Kurs im Selbststudium

Data Engineering und Data Science – Klarheit in den Schlagwort-Dschungel

Angeboten von Prof. Dr. Felix Naumann

Beim Laden des Videoplayers ist ein Fehler aufgetreten, oder es dauert lange, bis er initialisiert wird. Sie können versuchen, Ihren Browser-Cache zu leeren. Bitte versuchen Sie es später noch einmal und wenden Sie sich an den Helpdesk, wenn das Problem weiterhin besteht.

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Seit 26. Februar 2020 im Selbststudium
Kurssprache: Deutsch
Beginner, Big Data and AI

Kursinformationen

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Zielgruppe

Interessierte Öffentlichkeit, PraktikerInnen und Bachelorstudierende

Kursstruktur

  • Woche 1: Big Data und Data Science
  • Woche 2: Data Science Anwendungen und Text Mining
  • Woche 3: Skalierbares Datenmanagement
  • Woche 4: Datenaufbereitung
  • Woche 5: Informationsintegration
  • Woche 6: Statistik, Data Mining, Machine Learning
  • Woche 7: Klausur

Arbeitsaufwand

Der Arbeitsaufwand für diesen Kurs entspricht 2 ECTS-Punkten.

Podcast-Empfehlung

Mehr zum Thema Data Engineering erfahren Sie auch in der aktuellen Folge des Neuland Podcast.

Für diesen Kurs einschreiben

Der Kurs ist kostenlos. Legen Sie sich einfach ein Benutzerkonto auf openHPI an und nehmen Sie am Kurs teil!
Jetzt einschreiben

Lernende

Aktuell
Heute
21.362
Kursende
26. Februar 2020
14.654
Kursstart
8. Januar 2020
11.346

Bewertungen

Der Kurs wurde mit durchschnittlich 4.95 Sternen bei 55 abgegebenen Stimmen bewertet.

Anforderungen für Leistungsnachweise

  • Den Leistungsnachweis erhält, wer in der Summe aller benoteten Aufgaben mindestens 50% der Höchstpunktzahl erreicht hat.
  • Die Teilnahmebestätigung erhält, wer auf mindestens 50% der Kursunterlagen zugegriffen hat.
  • Einen Open Badge erhalten Sie, indem Sie den Kurs abschließen.

Mehr Informationen finden Sie in den Richtlinien für Leistungsnachweise.

Dieser Kurs wird angeboten von

Prof. Dr. Felix Naumann

Prof. Felix Naumann leitet seit 2006 das Fachgebiet Informationssysteme am Hasso Plattner Institut in Potsdam. Dort entwickelt er zusammen mit seinem Team Methoden zur Datenanalyse, Datenreinigung, Informationsintegration und Text Mining. Er ist Autor zahlreicher wissenschaftlicher Artikel und betreut eine Vielzahl an Doktoranden. Felix Naumann gibt regelmäßig Vorlesungen in den Bachelor- und Masterstudiengängen IT-Systems Engineering über Datenbanksysteme und weiterführende Themen des Informationsmanagement, und er ist Autor eines Lehrbuchs zur Informationsintegration. Felix Naumann studierte Wirtschaftsmathematik an der Technischen Universität Berlin und wurde 1997 Stipendiat des Berlin-Brandenburger Graduiertenkollegs "Verteile Systeme". Seine Promotion wurde mit dem Dissertationspreis 2000 der Gesellschaft für Informatik ausgezeichnet. Nach einem zweijährigen Forschungsaufenthalt am IBM Almaden Research Center lehrte und forschte er als Juniorprofessor an der Humboldt Universität zu Berlin. Als Gastwissenschaftler verbrachte er seit 2006 zudem mehrere internationale Forschungsaufenthalte.