Ce cours vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.
Inter
Intra
Sur mesure
Cours pratique en présentiel ou en classe à distance
Formation dans vos locaux, chez nous ou à distance
Réf. BID
5j - 35h
Vous souhaitez transposer cette formation, sans modification, pour votre entreprise ?
Formation à la carte
Vous souhaitez une formation adaptée aux spécificités de votre entreprise et de vos équipes ? Nos experts construisent votre formation sur mesure !
Ce cours vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.
Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
Appréhender un outil de data visualisation pour restituer des analyses dynamiques
Public concerné
Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.
Prérequis
Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisantce test.
Programme de la formation
Comprendre les concepts et les enjeux du Big Data
Origines et définition du Big Data.
Les chiffres clés du marché dans le monde et en France.
Les enjeux du Big Data : ROI, organisation, confidentialité des données.
Un exemple d'architecture Big Data.
Les technologies du Big Data
Description de l'architecture et des composants de la plateforme Hadoop.
Les modes de stockage (NoSQL, HDFS).
Principes de fonctionnement de MapReduce, Spark, Storm...
Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
Installer une plateforme Hadoop.
Les technologies du datascientist.
Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).
Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).
Gérer les données structurées et non structurées
Principes de fonctionnement de Hadoop Distributed File System (HDFS).
Importer des données externes vers HDFS.
Réaliser des requêtes SQL avec HIVE.
Utiliser PIG pour traiter la donnée.
Le principe des ETL (Talend...).
Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)
Exercice
Implémentation de flux de données massives.
Technique et méthodes Big data analytics
Machine Learning, une composante de l'intelligence artificielle.
Découvrir les trois familles : Régression, Classification et Clustering.
La préparation des données (data preparation, feature engineering).
Générer des modèles en R ou Python.
Ensemble Learning.
Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...
Exercice
Mise en place d'analyses avec un des outils étudiés.
Data visualisation et cas d'usage concrets
Définir le besoin de la data visualisation.
Analyse et visualisation des données.
Peut concerner tous les types de données dans la DataViz ?
Les outils DataViz du marché.
Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.
Conclusion
Ce qu'il faut retenir.
Synthèse des bonnes pratiques.
Bibliographie.
Modalités pratiques
Exercice
Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.
Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
CHRISTOPHE C.
18/03/24
4 / 5
Excellente connaissance de la formatrice
--> Landscape fort intéressant et complet
Niveau hétéroclite des participants
--> Phase de travaux pratiques en autonomie trop court : à compléter en dehors des périodes de cours
LEKSIR HAMZA B.
18/03/24
5 / 5
Formation très intéressante mais le contenu est dense pour 5 jours .
ANTOINE C.
18/03/24
4 / 5
Stage très riche, voir trop riche.
Bonne préparation en amont par Khalid qui permet de manipuler et d’avancer.
L’axe pris est très académique et moins tourné "monde du travail" avec des gains / coûts d’implantation concrets. Je pense que cela permettrait de rendre la formation plus digeste.
Le format 5 jours est lourd. je pense que 2*2jours serait plus agréable.
LUCAS L.
18/03/24
4 / 5
Le contenu est très claire, il y a même peut-être trop je dirais.
MOHAMMED S.
18/03/24
5 / 5
Je propose d’ajouter un module sur le move to cloud (Cloudera vers GCP par exemple).
NICOLAS L.
18/03/24
5 / 5
Excellent formateur, expert de son sujet, pédagogue, patient.
Programme qui donne vision complète du paysage de la BigData.
TOM L.
18/03/24
5 / 5
Très bien
JEAN-BAPTISTE G.
11/03/24
5 / 5
Très bon formateur très pédagogie, le support est bien mais trop dépendant d’une explication orale.
GWENDOLINE V.
11/03/24
4 / 5
Formateur très à l’écoute des demandes. Il sait adapter la formation au niveau du groupe.
HANANE M.
11/03/24
5 / 5
Formation riche et intéressante
ANTOINE A.
11/03/24
5 / 5
Peut-être moins de pratique et lignes de commandes serait bien car ne sera applicable en l’état par chacun dans son métier.
Aussi, il serait intéressant de consacrer la dernière journée que le formateur passe du temps avec chacun pour voir comment appliquer toute la théorie dans son propre environnement professionnel.
C’est ce que j’ai fais le dernier jour et cela me sera utile dès mon retour en entreprise.
Merci beaucoup à Khalil pour son dynamisme et sa capacité à
MOELLE STEPHANE L.
27/11/23
3 / 5
Je pensais trouver un ensemble d’outils prêts à l’emploi sous un environnement soit windows, soit linux et non pas à devoir installer et paramétrer tous les outils dans une machine virtuelle linux sous windows. Cela nous a pris énormément de temps pour procéder aux installations avec quantité de messages d’erreur. Le formateur a été remarquable par sa disponibilité et sa maitrise technique des sujets. Cela a malheureusement fortement nuit au temps disponible à l’acquisition d
GILLES D.
27/11/23
3 / 5
J’ai été en décalage par rapport au contenu, très axé dev. J’attendais plus de choses sur l’architecture, les solutions, etc.. Le requis LINUX est critique et n’est pas mentionné dans le descriptif, alors que j’ai pris la peine de passer un test au préalable. Heureusement, l’animateur a été réactif et j’ai pu me concentrer sur mes attentes, en sortant du parcours prévu. Il y a me semble t’il un probleme de définition de contenu. Et aussi les supports de T
GUILLAUME B.
27/11/23
3 / 5
Il manquait une définition clair des prérequis pour cette formation.
Ce manque de pré-requis a empecher le formateur de repondre au besoin métier de chacun. Je m’attendais personnellement à une formation plus théorique , basé sur les enjeux et les cas pratiques que peuvent solutionner la big data. Le cours était pour moi trop technique et je n’ai pas eu l’information recherché.
XIAODONG Y.
27/11/23
3 / 5
Il y a beaucoup de TP mais très peu de théorie.
Qualité des supports de cours et TP à améliorer. Beaucoup des erreurs sur des documents TP et il n’est pas possible d’obtenir les résultats attendus en suivant les instructions, faut corriger en permanant.
Prérequis de la formation n’est pas aligné avec les contenues de cours. Tous les TP sont sur Linux mais connaissant minimum du Linux n’est pas mentionné dans le prérequis. Qui nous fait perdre beaucoup du temps inatt
LOÏC P.
27/11/23
5 / 5
Les exercices auraient pu gagner en lisibilité si un scénario global pour la formation avait été mis en place, en traitant le même jeu de données, avec des objectifs d’exploitation des données établis en plusieurs étapes itératives de manière à balayer les différents modules.
JACQUES A.
27/11/23
3 / 5
Le cours était destiné à des personnes avec une très bonne connaissance de LINUX et Python.
Par conséquent le matériel pédagogique, s’il a du sens pour des personnes expérimentées sous LINUX, n’était pas approprié pour des chefs de projets moins techniques.
Le formateur a fait de son mieux pour répondre à nos questions mais a aussi dû passer beaucoup de temps à débuguer nos configurations ce qui a cassé le rythme du cours. D’où l’impression d’avoir passé trop
FLORENCE Q.
27/11/23
4 / 5
Un sujet très très riche et complexe. L’ensemble du programme n’a pas pu être abordé complètement car nous avons rencontré des difficultés techniques au début de la formation en raison d’un défaut de communication sur les pré requis aussi bien côté stagiaires que côté matériel.
Le formateur a du s’adapter à une classe très hétérogène sur les attendus et les compétences.
JULIEN D.
27/11/23
4 / 5
Certains sujets auraient mérité une approche théorique accompagnée d’exemples ou de cas d’usage plus concrets
Les TPs s’adressaient essentiellement à un public dévellopeur : précision à expliciter plus clairement dans les pré-requis et programme de la formation publié sur le site
SONIA G.
27/11/23
2 / 5
Formateur plutôt compétent et disponible. Contenu du cours trop large qui ne permet pas d’être adapté aux besoins : il faudrait dissocier les parties "construction de bases de données en big data" et "MachineLearning" sur deux formations distinctes. Certaines parties de la formation n’ont pas été abordées. Trop de manipulations "informatiques" et pas assez de théorie pour avoir une vision d’ensemble en fin de formation. On reste sur sa fin...Connaissance de Linux à marquer dans le
JÉRÉMY B.
23/10/23
4 / 5
Première formation à distance et je me rends compte que ce format n’est pas fait pour moi, difficile de prendre la parole malgré les propositions de notre formatrice et plus d’aisance à l’écrit.
Beaucoup de théorique lié au sujet et beaucoup de connaissances à acquérir en peu de temps.
Des bases de programmations dans certains langages m’ont tout de même manqué, bien que j’ai réussi à me débrouiller.
Beaucoup d’intérêt pour la partie prése
FABIEN V.
23/10/23
4 / 5
Animatrice de qualité, avec des connaissances solides.
J’aurais aimé plus de manipulation, et une partie plus importante sur le machine learning et datavisualisation
SYLVAIN C.
23/10/23
3 / 5
La partie datavisualisation est très rapide et que théorique.
JULIEN C.
28/08/23
5 / 5
parfait ! formation très pratique, les connaissances acquises pourront être appliquées immédiatement.
GUILLAUME L.
28/08/23
5 / 5
La formation donne un aperçu global des technologies principales du Big Data et le fait bien. J’ai noté un petit moins pour les travaux pratiques qui m’ont fait personnellement moins progresser que les explications et qui sont parfois un petit peu moins fluide.
MOHAMED A.
24/07/23
5 / 5
Le contenu est excellent et surtout à jour, et couvre une vue 360 de la technologie Big Data, les TPs sont très bien préparés et très utiles. L’animatrice Mme Fayeche est excellente, professionnelle, ponctuelle, à l’écoute, maîtrise très bien les sujets qu’elle aborde.
CEDRIC C.
24/07/23
4 / 5
JE ne maitrise pas ces outils, j’aurai aimé beaucoup plus de temps sur la pratique, je n’avais pas le temps de pratiquer et ne voulait pas ralentir les autres. Pour moi la formation aurait pu durer 5 jours de plus pour pouvoir pratiquer sur beaucoup de TP on était juste en écoute.
JULIUS K.
12/06/23
5 / 5
Malgré la difficulté du sujet, cette formation a permis de présenter les différentes facettes des outils et de démarrage d’une plateforme Big Data, ainsi que la mise en pratique des méthodes d’Intelligence Artificielle sur ces données et sa visualisation. L’intérêt de cette formation est qu’on n’est pas seulement resté sur la théorie mais aussi sur la mise en pratique. Par contre, il est clair qu
ANNA R.
12/06/23
4 / 5
Moins d’exercices avec seulement de l’execution de code, plus d’exercice ou on joue avec les paramètres ou les méthodes
MORGANE C.
12/06/23
4 / 5
Bonne formation. Il est juste dommage que le contenu soit si dense ce qui a eu pour effet de survoler la plupart des sujets et peu de mise en pratique.
LÉA B.
12/06/23
3 / 5
Les notions ont été abordées de manière rapides : plus d’énonciation des notions qu’un réel travail sur les points importants.
Pas d’acquisition des compétences techniques pour gérer les flux de données.
Les exercices ( à part sur la visualisation) consistaient uniquement à un lancement de codes sans réel compréhension et sans pratique des langages.
Je repars de cette format
LUCAS D.
12/06/23
5 / 5
Formateur sympa et très compétent.
Certains sujets m’intéressent moins comme l’architecture big data, je ne serais pas amené à utiliser ces connaissances.
D’autres sujets comme la partie IA et Data Viz m’ont beaucoup intéressés et me seront très utiles.
AUDREY R.
12/06/23
5 / 5
Très instructif, très bonne qualité du contenu.
RAPOZO DEBORAH G.
12/06/23
4 / 5
Formateur maîtrise bien le contenu, est patient et pédagogique.
Bonne vision globale du domaine du Big Data.
Malheureusement, peu de temps a été accordé à la partie analyse des données (sujet que je cherchais).
ERIC D.
17/04/23
4 / 5
Formation très dense.
Donne un bon aperçu de l’éco système du Big Data.
Les exercices sont intéressants.
J’aurai aimé faire un exercice de A à Z depuis la prise de données jusqu’à la présentation finale.
Lionel maitrise son sujet. Bonne dynamique et partage son retour d’expérience.
SOPHIE L.
17/04/23
4 / 5
Formation qualitative, qui demande des bases sérieuses en informatique et en mathématique.
GOFF FRANÇOIS L.
17/04/23
5 / 5
Super intéressant. Bonne vision d’ensemble.
JEROME F.
27/03/23
5 / 5
Très bonne formation, beaucoup de pédagogie imagée, disponibilité pour répondre aux questions
STÉPHANE G.
27/03/23
5 / 5
le complément sur le MDM très intéressant. Un peu moins de pratique et d’exercices sur Tableau
THOMAS D.
27/03/23
5 / 5
Cours très complet et très dense avec des solutions, exemples pratiques et techniques à mettre en place en entreprise.
ALEXIS C.
27/03/23
5 / 5
la qualité des images sur le support de cours est médiocre car floues
VINCENT P.
27/03/23
4 / 5
Niveau des participants très hétérogène.
MOHAMMED B.
27/03/23
5 / 5
Trés complet
FABRICE P.
27/03/23
5 / 5
enseignant tres competente
THOMAS T.
27/03/23
5 / 5
L’enseignante est une très bonne pédagogue. Elle fait progresser tout le monde en même temps au cours des TP, y compris pour des sujets sur lesquels il y avait des débutants. Elle a une très bonne maîtrise du sujet, avec des compétences tant en programmation qu’en architecture.
Seul petit bémol, j’aurais souhaité perso, un TP sur la DataViz.
Sinon BRAVO!
NAILLY PAUL D.
21/11/22
5 / 5
Bonne pédagogie, contenu enseigné tel que prévu au début de la formation.
SABRY K.
21/11/22
4 / 5
Le support de cours est arrivé le jour 4/5 de la formation et comporte de nombreuses coquilles ou caractères absents.
Les énoncés des exercices sur la partie Visualisation sont assez abscons...
Lors des exercices sur R ou le Machine Learning beaucoup de temps a été consacré à des points mineurs plutôt qu’à expliquer les points majeurs...
RÉMI H.
21/11/22
5 / 5
Un parcours enrichissant et semble-t-il complet du Big Data, de ces concepts et des différentes technologies, par particulier les plus populaires.
Malgré un rythme soutenu et grâce aux qualités et aux facilités de discours de la formatrice, j’ai pu suivre facilement cette formation et je pense acquérir des connaissances qu’il y a plus qu’à mettre en place...
Le support des cours et les exercices sont intéressants.[[b
ARNAUD A.
21/11/22
5 / 5
Très satisfait.
A titre personnel, j’aurais aimé approfondir un peu plus la théorie, notamment les mécanismes et algorithmes de fonctionnement des différents outils. J’aurais également aimé aborder plus en détail le cas de fichier non structurés, fichiers de log voir des fichiers binaires.
SANDIE H.
21/11/22
5 / 5
La formation est très complète!
De nombreux sujets ont été abordés tant au niveau de la théorie du Big Data que des solutions techniques existantes.
Sondès, la formatrice, maîtrise parfaitement son sujet et sait s’adapter au niveau de chacun de ses utilisateurs.
La documentation fournie est riche (slides + TP + TP corrigés à la fin de la formation).
Petit plus, non négligeable : mise à dis
NADINE C.
21/11/22
4 / 5
L’expertise, l’amabilité de l’animatrice sont indéniables. Bravo Madame pour vos compétences.
Toutefois, le temps accordé aux TPs est insuffisant. Il ne permet pas de suivre et digérer les TPs.
Cette formation est supposée ne pas être technique pourtant elle l’est.
Beaucoup de choses à digérer, peut-etre trop pour etre retenues pour ma part.
Vers la fin de la formation, je ne suivais plus. Cel
LORENZO P.
22/08/22
5 / 5
très complet, à revoir grace au support
XAVIER EKAMBY E.
22/08/22
4 / 5
correct dans l’ensemble
SALMA B.
27/06/22
3 / 5
Le contenu était intéressant mais la quantité d’informations étant très dense qu’il est difficile de bien traiter les sujets. Pas de réelle plus value pour moi concernant des sujets que je maîtrisais déjà. Présentation et storytelling à améliorer.
SALMA G.
27/06/22
3 / 5
Le contenu de la formation est interressant mais très dense.Un cours destiné selon moi pour des developpeurs.
Beaucoup de théorie et peu de pratique à mon sens.
HUANG W.
13/06/22
4 / 5
peu d’exercise.
Introduction de beaucoup d’applications mais a la fin je n’ai pas reussi a retenir grandes choses.
Probablement, je n’ai pas bien choisi la formation a suivre. Comme je n’utilise pas encore big data, j’ai beaucoup de mal a bien rentrer dans le sujet.
ISABELLE B.
30/05/22
5 / 5
Contenu très enrichissant et Bon aperçu des outils.
GRÉGORY A.
30/05/22
5 / 5
Très bonne présentation, merci à la formatrice
DANIELLE R.
30/05/22
3 / 5
Le public concerné par cette formation, (Dataminers, chargés d’études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle), doit être revu par ORSYS.
En ce qui me concerne, la 1ère journée m’aurait largement suffi avec les uses case transmis à la conclusion.
Le dévt à travers les outils, très nombreux dans le Big - data, doivent être vu dans des
MICHEL L.
09/05/22
5 / 5
Excellente formatrice !
VIKTORIAA I.
09/05/22
4 / 5
J’aurais préféré d’avoir un peu plus d’interactions, partie théorie ( manque de compétences techniques de ma part )
N’KMLÉ D.
09/05/22
5 / 5
Très satisfait de la formation sur tous les plans.
PATRICE D.
25/04/22
4 / 5
Avec mon profil décideur, l’idée de la formation était pour moi d’avoir une vue 360° de l’eco systeme Big Data pour comprendre les résultats d’étude en cours dans notre société. Le coté ’pratique’ n’était pas pour moi primordiale et n’apporte pas forcément bcp d’information. Par contre plus de démo des outils seraient intéressants. Une partie à développer
SIMON M.
25/04/22
5 / 5
Contenu très intéressant et très dense qui couvre un panel technique impressionnant, de l’ingénieur système au développeur, en passant par les métiers de data science.
JEREMY D.
25/04/22
4 / 5
Cours bien complet et qui pourra être utile pour rechercher de l’information
GUILLAUME R.
25/04/22
5 / 5
Très bonne formation, peut être mettre à jour les différentes courbes liés aux tendances (les google trends, datant pour la plupart de 2018), sachant que c’est un milieu qui bouge beaucoup.
ELODIE B.
25/04/22
4 / 5
Les nombreux exemples (vécu, sous Word, analogie) aident à la compréhension. Les Quizz permettent de mieux retenir des notions. Pour mon besoin, les exercices réalisés en directe m’ont permis de suivre et pouvoir poser des questions. Réaliser plus de démonstration peut-être un plus pour appréhender les différents outils (si c’est possible selon les OpenSources)
MICHAËL M.
25/04/22
4 / 5
la moitié de la formation est théorique.
KONAN MARCELLIN B.
25/04/22
5 / 5
Le contenu pédagogique est bon avec des illustrations appropriés
TANOH LAMBERT T.
25/04/22
4 / 5
BON dans l’ensemble. Bonne maitrise des concepts théoriques mais aller plus lentement pour les Travaux pratiques
DEEPASHIKHA D.
04/04/22
4 / 5
Formation bien pour les profils techniques.
FRANZ L.
04/04/22
4 / 5
Soucis techniques durant la formation, manque de moyens côté Orsys. Très bonne animation et support pédagogique, mais un peu trop de théorie par rapport à la pratique
LUCAS P.
04/04/22
3 / 5
Cours très (trop) théorique, et qui traite trop d’aspect du big data (plutôt que de se concentrer sur l’essentiel, et le creuser). Par ailleurs, les exercices, à faire sur une plateforme AnyDesk, sont difficiles (pas dans leur compléxité mais dans les outils - AnyDesk en fenêtré dans un navigateur).
CAROLINE R.
07/02/22
4 / 5
pas mal de problèmes techniques qui ont perturbés les exercices et le début de la formation avec une impossibilité pour le formateur de se connecter au réseau prévu