1
Comprendre les concepts clés et les enjeux du big data
- Les origines du big data.
- La valeur de la donnée : un changement d'importance.
- La donnée en tant que matière première.
- Les chiffres clés du marché dans le monde et en France.
- Les enjeux du big data : ROI, organisation, confidentialité des données.
Démonstration
Présentation d'une architecture big data.
2
Technologies du big data
- Architecture et composants de la plateforme Hadoop 2.
- Les modes de stockage (NoSQL, HDFS).
- Fonctionnement de MapReduce et Yarn...
- Principales distributions Hadoop : Hortonworks, Cloudera, MapR...
- Les technologies : Spark, Storm, Databrick, Machine Learning Azure...
- Démarche d'installation d'une plateforme Hadoop.
- Présentation des technologies spécifiques pour le big data (Talend, Tableau, QlikView...).
Démonstration
Installation d'une plateforme big data complète.
3
Traitement des données big data
- Fonctionnement de Hadoop Distributed File System (HDFS).
- Importer des données vers HDFS.
- Traitement des données avec PIG.
- Requêtes SQL avec HIVE.
- Création de flux de données massives avec un ETL.
Démonstration
Implémentation de flux de données massives.
4
Méthodes d'analyse et traitements des données pour le big data
- Les méthodes d'exploration.
- Segmentation et classification.
- machine learning, estimation et prédiction.
- Le temps réel, l'intelligence artificielle.
- L'implémentation des modèles.
Démonstration
Présentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses de machine learning avec le langage R, Python et Scala.
5
Data visualisation, représenter des données de façon visuelle
- Principales solutions du marché.
- Aller au-delà des rapports statiques.
- La data visualisation et l'art de raconter des chiffres de manière créative et ludique.
- Mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients...
Démonstration
Présentation et utilisation d'un outil de data visualisation pour constituer des analyses dynamiques.
6
Conclusion
- Les conditions du succès.
- Synthèse des meilleures pratiques.
- Bibliographie.