Data Ingestion (ingestion de données) est un aspect important dans le monde du big data et de l’analytique, car elle permet aux décideurs de prendre de meilleures décisions.
En fait, cette expression désigne le processus de transfert de données d’une ou plusieurs sources vers un site de destination qui permet de les analyser et de les traiter.
On le sait, les données peuvent avoir des formats variés et surtout provenir de sources multiples comme, par exemple :
- data lake ;
- appareils de l’Internet des objets ;
- base de données ;
- APPLI ;
- data warehouse.
Il existe trois façons d’effectuer un processus d’ingestion de données :
- faite-le en temps réel ;
- tirer parti du traitement par lots ;
- utiliser une architecture Lambda (une combinaison des modèles ci-dessus).
Ce type d’activité, on peut l’imaginer, présente de nombreux avantages pour les entreprises, attribuables à la possibilité d’adopter des approches data-driven.
Dans le domaine du marketing, tout cela se traduit par la possibilité d’optimiser l’efficacité des campagnes et des activités à partir de l’analyse des données et d’une connaissance approfondie de son public cible.
Le concept d’ingestion de données est également lié à celui d’ETL (extract, transform, load-extraire, transformer, charger).
Contrairement à cela, ce dernier est un processus d’intégration de données qui aide les organisations à extraire des données de diverses sources dans une seule base de données, en les transformant avant le déploiement.