Opleiding : Big Data, methoden en praktische oplossingen voor gegevensanalyse

Big Data, methoden en praktische oplossingen voor gegevensanalyse

Downloaden in pdf-formaat Deze cursus delen via mail 2


Deze cursus laat u kennismaken met de uitdagingen en voordelen van Big Data, en met de technologieën om deze te gebruiken. U leert hoe u enorme hoeveelheden gestructureerde en niet-gestructureerde gegevens kunt integreren via een ETL-tool en ze vervolgens kunt analyseren met behulp van statistische modellen en dynamische dashboards.


Inter
Intra
Op maat

Praktijkcursus ter plaatse of via klasverband op afstand

Ref. BID
Prijs : 3530 € V.B.
  5d - 35u00




Deze cursus laat u kennismaken met de uitdagingen en voordelen van Big Data, en met de technologieën om deze te gebruiken. U leert hoe u enorme hoeveelheden gestructureerde en niet-gestructureerde gegevens kunt integreren via een ETL-tool en ze vervolgens kunt analyseren met behulp van statistische modellen en dynamische dashboards.

Pedagogische doelstellingen
Aan het einde van de training is de deelnemer in staat om:
  • Kennis van de concepten en voordelen van Big Data ten aanzien van de zakelijke behoeften
  • Kennis van het technologische ecosysteem dat nodig is om een Big Data-project uit te voeren
  • De technische vaardigheden verwerven om complexe, niet-gestructureerde en massale gegevensstromen te beheren
  • Statistische analysemodellen implementeren om aan de zakelijke behoeften te voldoen
  • Kennis van een gegevensvisualisatietool om dynamische analyses weer te geven

Doelgroep
Data-analisten, statistisch onderzoekers, ontwikkelaars, projectmanagers, business intelligence consultants.

Voorafgaande vereisten
Basiskennis van relationele modellen, statistiek en programmeertalen. Basiskennis van de Business Intelligence-concepten.

Opleidingsprogramma

Kennis van de concepten en uitdagingen van Big Data

  • Oorsprong en definitie van Big Data.
  • De kerncijfers van de markt in de wereld en in Frankrijk.
  • De uitdagingen van Big Data: ROI, organisatie, vertrouwelijkheid van de gegevens.
  • Een voorbeeld van een Big Data-architectuur.

Big Data-technologieën

  • Beschrijving van de architectuur en de componenten van het Hadoop-platform.
  • Opslagmethoden (NoSQL, HDFS).
  • Werkingsprincipes van MapReduce, Spark, Storm...
  • Belangrijkste namen op de markt (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Een Hadoop-platform installeren.
  • De technologieën van de datascientist.
  • Presentatie van specifieke technologieën voor Big Data (Tableau, Talend, Qlikview, ...).
Oefening
Installatie van een Hadoop Big Data-platform (via Cloudera QuickStart of ander).

Beheer van de gestructureerde en niet-gestructureerde gegevens

  • Werkingsprincipes van Hadoop Distributed File System (HDFS).
  • Externe gegevens importeren naar HDFS.
  • SQL-query's uitvoeren met HIVE.
  • Gebruik van PIG om de gegevens te verwerken.
  • Het principe van ETL-tools (Talend...).
  • Streamingbeheer van massale gegevensstromen (NIFI, Kafka, Spark, Storm...)
Oefening
Implementatie van massale gegevensstromen.

Technieken en methoden voor Big Data Analytics

  • Machine Learning, een onderdeel van artificiële intelligentie.
  • Kennismaking met de drie families: Regressie, Classificatie en Clustering.
  • Voorbereiding van de gegevens (data preparation, feature engineering).
  • Modellen genereren in R of Python.
  • Ensemble Learning.
  • Kennismaking met de tools op de markt: Jupyter Notebook, Dataïku, Amazon Machine Learning...
Oefening
Uitvoering van analyses met een van de bestudeerde tools.

Datavisualisatie en concrete gebruikssituaties

  • De behoefte aan datavisualisatie bepalen.
  • Analyse en visualisatie van de gegevens.
  • Kan betrekking hebben op alle soorten gegevens in DataViz?
  • DataViz-tools op de markt.
Oefening
Installatie en gebruik van een datavisualisatietool om dynamische analyses samen te stellen.

Conclusie

  • Wat moeten we onthouden?
  • Samenvatting van goede praktijken.
  • Bibliografie.


Praktische modaliteiten
Oefening
Een Hadoop-platform met zijn basiscomponenten opzetten, een ETL-tool gebruiken om de gegevens te beheren, analysemodellen en dashboards maken.

Feedback van klanten
4 / 5
De feedback van klanten is afkomstig van eindevaluaties na de opleiding. De score wordt berekend op basis van alle evaluaties die minder dan 12 maanden oud zijn. Alleen die met een tekstcommentaar worden weergegeven.


Data en plaats
Selecteer uw locatie of kies voor de les op afstand en kies vervolgens uw datum.
Klas op afstand