La “Data Ingestion” è un aspetto importante nell’universo dei big data e dell’analytics, in quanto consente ai decision maker di prendere decisioni migliori.
Con questa espressione si intende, infatti, il processo di trasferimento dei dati da una o più sorgenti ad un sito di destinazione che ne consente l’analisi e l’elaborazione.
Come sappiamo i dati possono avere vari formati e soprattutto provenire da molteplici fonti quali, ad esempio:
- data lake;
- dispositivi Internet of Things;
- database;
- APP;
- data warehouse.
Esistono tre modi per effettuare un processo di “Data Ingestion”:
- realizzarlo in real time
- sfruttando il batch;
- utilizzando un’architettura Lambda (combinazione dei precedenti modelli).
Questo tipo di attività, come possiamo immaginare, presentano numerosi vantaggi per le aziende, riconducibile alla possibilità di adottare approcci data driven.
In ambito marketing tutto ciò si traduce nella possibilità di ottimizzare l’efficacia delle campagne e delle attività partendo proprio da un’analisi dei dati e da una conoscenza approfondita del proprio target di riferimento.
Il concetto di Data Ingestion è legato anche a quello di ETL (extract, transform, load).
A differenze di questa, quest’ultimo si tratta di un processo di integrazione di dati che aiuta le organizzazioni ad estrarre i dati da varie fonti verso un unico DB, trasformandoli prima della distribuzione.