L’expression « données non structurées », en informatique, est définie comme une information numérique sous forme brute, c’est-à-dire une information dont la structure ne peut être identifiée.
Contrairement aux données structurées, les informations ne peuvent pas être cartographiées dans des schémas et des bases de données et sont donc difficiles à utiliser dans le cas de processus d’analyse automatisés.
Cela inclut, par exemple, les commentaires sur les médias sociaux, les critiques de produits, le contenu audio, vidéo et image.
Selon leur degré de structuration, les données peuvent appartenir à deux macro-catégories différentes, par rapport à celle précédemment illustrée.
Regardons de plus près :
- données structurées : elles répondent à un cadre et une structure précis. C’est précisément en raison de leur nature qu’ils peuvent être facilement traités et modifiés par des systèmes informatiques. En fait, les informations ont des positions précises dans les lignes et les colonnes et peuvent être facilement modifiées et interrogées ;
- données semi-structurées : ces données répondent à un cadre structurel de base, c’est-à-dire qu’elles ont des métadonnées qui aident à définir des caractéristiques particulières qui facilitent le catalogage.
Les données non structurées, comme vous pouvez facilement le deviner, peuvent être stockées et sauvegardées plus rapidement mais nécessitent un effort plus important tant en termes de stockage que de protection et de sécurité.
Les données structurées sont généralement stockées dans des CRM et des entrepôts de données, tandis que les données non structurées sont généralement stockées dans des lacs de données.