La Data ingestion (ingestión de datos) es un aspecto importante en el universo del big data y la analítica, ya que permite a los responsables tomar mejores decisiones.
De hecho, esta expresión se refiere al proceso de transferencia de datos desde una o varias fuentes a un sitio de destino para su análisis y procesamiento.
Como sabemos, los datos pueden tener diversos formatos y, sobre todo, proceder de múltiples fuentes como:
- data lakes;
- dispositivos del Internet of things;
- database;
- APP;
- data warehouse.
Hay tres formas de llevar a cabo un proceso de «Data ingestion»:
- realización en tiempo real;
- explotando el lote;
- utilizando una arquitectura Lambda (combinación de los modelos anteriores).
Este tipo de actividad, como podemos imaginar, tiene numerosas ventajas para las empresas, que se remontan a la posibilidad de adoptar enfoques basados en datos.
En el ámbito del marketing, esto se traduce en la posibilidad de optimizar la eficacia de las campañas y actividades basándose precisamente en un análisis de los datos y en un conocimiento profundo de su público objetivo.
El concepto de Data ingestion también está relacionado con el de ETL (extract, transform, load-extraer, transformar, cargar).
En cambio, este último es un proceso de integración de datos que ayuda a las organizaciones a extraer datos de diversas fuentes a un único DB y transformarlos antes de su distribución.