Con l’espressione “Dati Non Strutturati”, in informatica, si vanno a definire informazioni digitali in forma grezza, ovvero che presentano una struttura che non può essere identificata.
A differenza di quanto avviene per i Dati Strutturati, le informazioni non possono così essere mappate in schemi e database e pertanto risultano difficilmente utilizzabili in caso di processi di analisi automatizzati.
Rientrano in questa categoria, ad esempio, commenti sui social media, recensioni di prodotto, contenuti audio, video ed immagini.
A seconda del loro grado di strutturazione, i dati possono appartenere ad alte due diverse macro-categorie, rispetto a quella precedentemente illustrata.
Analizziamole nel dettaglio:
- dati strutturati: essi rispondono ad un quadro ed ad una struttura bene precisa. Proprio per questa loro natura possono essere facilmente elaborati e modificati dai sistemi informatici. Le informazioni hanno infatti posizioni precise all’interno di righe e colonne e possono essere facilmente modificati e interrogati;
- dati semi-strutturati: tali dati rispondono ad un quadro strutturale di base, ovvero possiedono metadati che aiutano a definirne particolari caratteristiche che ne agevolano la catalogazione.
I Dati Non Strutturati, come è facilmente intuibile possono essere immagazzinati e salvati più rapidamente ma richiedono uno sforzo maggiore sia in termini di storage che protezione e sicurezza.
Solitamente i dati strutturati vengono comunemente archiviati in CRM e datawarehouse, mentre quelli non strutturati nei data lake.