Data Scientist Specialized in Big Data Analytics (zertifiziert)

 

Data Scientist Specialized in Big Data Analytics

 

Diese Schulung schließt an die Angebote »Data Scientist Basic Level« und »Data Scientist Specialized in Data Analytics« an. Fachkräfte mit Programmiererfahrung und Grundkenntnissen in der Datenanalyse lernen Methoden und Tools zur Analyse von Big Data kennen. Nach der Schulung verstehen Sie, wie Analysealgorithmen für eine skalierbare Big-Data-Architektur implementiert werden und haben Beispiele für Batch- und Streaming-Verarbeitung kennengelernt. Sie lernen den Einsatz von Tools und Methoden zur Analyse von großen Datenmengen am Beispiel von Spark kennen, wobei insbesondere die Algorithmen aus Spark Machine Learning Library sowie Anbindung von Spark an Python (PySpark) vorgestellt und selbst eingeübt wird. Unter dem Thema "Deployment" wird besprochen, wie Modelle, die im Batch auf historischen Daten erstellt worden sind, auf neuen Daten schnell angewendet werden können. Des weiteren wird die Einbindung von Streaming-Systemen und Methoden der Datenanalyse unter Echtzeitanforderungen besprochen. 

 

Die Zertifizierung findet durch die Fraunhofer-Personenzertifizierungsstelle statt. Das Zertifikat bescheinigt den Absolventen relevantes innovatives Praxiswissen und nachgewiesene Kompetenz.

Zielgruppe: Analysten, die ihre Fähigkeiten zur Auswertung von großen Datenbeständen ausweiten möchten.Softwareentwickler/-architekten, die Systeme mit analytischen Fragestellungen entwickeln.

Voraussetzung: Grundkenntnisse in Statistik und Programmierung sowie grundlegender Aufbau von Systemarchitekturen.

Empfehlung: Kombinieren Sie dieses Angebot mit der Schulung »Data Scientist Basic Level« am selben Ort. 

 

 

Inhalte

 

Tag 1: Einbettung von Modellerstellung- und Anwendung in eine Big Data Architektur

  • • Einführung: Herausforderungen von Big Data für die Datenanalyse
  • • Beispiel: Aufbau eines Empfehlungssystems
  • • Data Understanding und Feature-Erzeugung für die Analyse großer Datenmengen 
  • • Modellentwicklung und -anwendung in Big-Data-Umgebungen
  • • Analyse von Datenströmen

Tag 2: Datenanalyse mit Spark

  • • Einführung von Spark und PySpark
  • • Lineare Regression mit Spark
  • • Die Spark Maschine Learning Library
  • • Übungen zur Datenanalyse mit Spark und Python
  • • Graphische Workflows zur Datenanalyse mit Spark
  • • Big Data Algorithmen: Locality Sensitive Hashing und Anwendungen

Tag 3: Fortgeschrittene Methoden, Werkzeuge und Deployment

  • • Deployment: Abspeichern, Laden von Modellen in PMML und Spark
  • • Einsatz von Spark Feature-Generation, Spark Pipelines und Spark Streaming
  • • Fortgeschrittene Analystetechniken in Spark (Training-Test Dataset, Optimization, Cross-Validation, Ensemble Methods, Pipelines)
  • • Erkennung komplexer Ereignisse für die Betrugserkennung mit Complex Event Processing (CEP)
  • • Massiv Parallele Datenbanken

Tag 4: Praktische Anwendung fortgeschrittener Analysemethoden mit PySpark

  • • Data verstehen, aufbereiten
  • • Erzeugen von Features 
  • • Spark Machine Learning Library Pipelines
  • • Big Data Algorithmen 

Tag 5

  • • Schriftliche Prüfung

 

Rahmen

Dauer: 4 Tage + Prüfung an Tag 5

Tagungs- und Prüfungssprache: deutsch

Maximale Teilnehmerzahl: 15
Die Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.

Abschluss: Prüfung und Zertifikat »Data Scientist Specialized in Big Data Analytics«

Veranstaltungsort:

    Fraunhofer-Institut IAIS

    Schloss Birlinghoven

    53754 Sankt Augustin

Teilnahmegebühr: 4.350 Euro

Die Teilnahmegebühr ist steuerfrei gem. § 4 Nr. 22a UStG. Sie umfasst Begleitunterlagen (auf Englisch) und Verpflegung.  

Bitte beachten Sie die Storno- und Teilnahmebedingungen sowie die Datenschutzerklärung.

Falls Sie die Anmeldung über eine Bestellung vornehmen, erbitten wir eine Kopie der Bestellung an "datascientist(at)iais.fraunhofer.de".

Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.
Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.
Dozenten: Das Basisseminar wird von verschiedenen erfahrenen Dozenten aus unserem Data-Science-Schulungsprogramm durchgeführt.