El término «datos no estructurados», en informática, se utiliza para definir la información digital en bruto, es decir, con una estructura que no se puede identificar.
A diferencia de los datos estructurados, la información no puede asignarse a esquemas y bases de datos y, por tanto, es difícil de utilizar en procesos de análisis automatizados.
Esta categoría incluye, por ejemplo, comentarios en redes sociales, reseñas de productos, contenidos de audio, vídeo e imágenes.
En función de su grado de estructuración, los datos pueden pertenecer a dos macrocategorías distintas de la ilustrada anteriormente.
Analicémoslas en detalle:
- datos estructurados: responden a un marco y una estructura precisos. Precisamente por esta naturaleza, pueden ser procesados y modificados fácilmente por los sistemas informáticos. En efecto, la información tiene posiciones precisas dentro de filas y columnas y puede modificarse y consultarse fácilmente;
- datos semiestructurados: estos datos responden a un marco estructural básico, es decir, poseen metadatos que ayudan a definir características particulares que facilitan su catalogación.
Los datos no estructurados, como puede adivinarse fácilmente, pueden almacenarse y guardarse más rápidamente, pero requieren más esfuerzo en términos de almacenamiento, así como de protección y seguridad.
Los datos estructurados suelen almacenarse en CRM y almacenes de datos, mientras que los no estructurados se almacenan en lagos de datos.