Data Scientist Specialized in Data Management (zertifiziert)

Bauen Sie Daten-Silos mit dem Data Lake ab

Unsere Fraunhofer-Experten vermitteln Ihnen, wie Sie mit dem Konzept des Data Lakes Daten für die Analyse zusammenführen und aufbereiten. Diese praxisorientierte und interaktive Ausbildung befähigt Sie, Entscheidungen zur Einführung und Nutzung von Data Lakes oder NoSQL-Datenbanken zu treffen.

 

Was Ihnen die Ausbildung bringt

Nach der Ausbildung wissen Sie, wie Sie Daten richtig organisieren, Metadaten nutzen und unterschiedliche Software-Komponenten in den Layern des Data Lakes einsetzen, um Daten in den Data Lake aufzunehmen, zu speichern, zu transformieren und darauf zuzugreifen. 

Neben den reinen technischen Fragen spielen auch organisatorische Aspekte eine Rolle. Sie erfahren, wie Sie eine Organisationseinheit strukturell und organisatorisch führen müssen, um gute Datenmanagement-Praxis umzusetzen.

Die Zertifizierung findet durch die Fraunhofer-Personenzertifizierungsstelle statt. Das Zertifikat bescheinigt den Absolventen relevantes innovatives Praxiswissen und nachgewiesene Kompetenz.

Zielgruppe: Fach- und Führungskräfte mit einem Bezug zu heterogenen (Forschungs-)Daten.

Voraussetzung: Der Umgang mit Office-Programmen wird vorausgesetzt, Grundkenntnisse in Datenstrukturen und Programmierung sind von Vorteil.

Inhalt

Modul 1: Datenmanagement-Systeme

Sie lernen Grundlagen über modernes Datenmanagement, um ein gemeinsames Verständnis darüber zu erlangen. Sie bekommen Grundbegriffe der Datenmodellierung vermittelt, um diese in den Kontext der relationalen und NoSQL-Welt der Datenbanken einordnen zu können. Nach diesem Modul können Sie beantworten, welche Vorteile NoSQL-Datenbanken im Vergleich zu relationalen Datenbanken bieten. Sie wissen, für welche Fragestellungen sich ein Umstieg lohnt und Sie kennen die Unterschiede verschiedener Abfragesprachen.

Modul 2: Metadatenmanagement mit dem Data Lake

Wir vermitteln Ihnen das Konzept des Data Lakes und wie es sich vom klassischen Data Warehouse abgrenzt. Nach diesem Modul haben Sie verstanden, wie Sie Daten in einen Data Lake bekommen und wie Sie mit Metadaten am besten umgehen, um quellenübergreifende Abfragen effizient zu gestalten. Die wesentlichen Schritte können Sie mit verschiedenen Werkzeugen selbst umsetzen.

Modul 3: Data Reconciliation und andere Aufbereitungsmethoden

Die Aufbereitung und Vereinheitlichung von Daten sind die größten Zeitfresser in den Aufgaben eines Data Scientist. Gleichzeitig sind sie die wichtigsten Aufgaben, um Daten quellenübergreifend analysieren zu können. Nach diesem Modul kennen Sie verschiedene Werkzeuge für die Aufbereitung und Integration von Daten und können diese Prozesse effizienter durchführen.

Modul 4: Operationalisierung von Datenmanagement

Wer verstanden hat, wie Daten für eine Analyse richtig vorbereitet werden, will das Gelernte auch in operativ umsetzen. Hierfür vermitteln wir Ihnen einige organisatorische Aspekte des Datenmanagements. Nach diesem Modul kennen Sie praktische Ansätze für die Datenmanagement-Planung und haben einen Überblick über Rollen und Aufgaben in der Data Governance. Zudem planen Sie Ihr erstes kleines Change-Projekt für den Transfer des Gelernten in Ihre Organisation.

Rahmen

Dauer des Kurses: 4 Tage + Prüfung am 5. Tag

Teilnahmegebühr: 3.850 Euro, inkl. Unterlagen und Prüfungsgebühr;

Abschluss: Prüfung und Zertifikat »Data Scientist Specialized in Data Management«

Veranstaltungsort:

Fraunhofer-Institut für Angewandte Informationstechnik FIT

Schloss Birlinghoven

53754 Sankt Augustin