Data Engineering und Data Science

Kursinformationen

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

Zielgruppe

Interessierte Öffentlichkeit, PraktikerInnen und Bachelorstudierende

Kursstruktur

Woche 1: Big Data und Data Science
Woche 2: Data Science Anwendungen und Text Mining
Woche 3: Skalierbares Datenmanagement
Woche 4: Datenaufbereitung
Woche 5: Informationsintegration
Woche 6: Statistik, Data Mining, Machine Learning
Woche 7: Klausur

Arbeitsaufwand

Der Arbeitsaufwand für diesen Kurs entspricht 2 ECTS-Punkten.

Podcast-Empfehlung

Mehr zum Thema Data Engineering erfahren Sie auch in der aktuellen Folge des Neuland Podcast.

Achtung: Dieser Kurs befindet sich aktuell im Selbststudium-Modus, in dem Sie keinen Zugriff auf die bewerteten Hausaufgaben/Prüfungen haben. Daher können wir Ihnen lediglich eine Teilnahmebestätigung ausstellen.

Für diesen Kurs einschreiben

Der Kurs ist kostenlos. Legen Sie sich einfach ein Benutzerkonto auf openHPI an und nehmen Sie am Kurs teil!

Jetzt einschreiben

Lernende

Aktuell

Heute

21.816

Kursende

26. Februar 2020

14.654

Kursstart

8. Januar 2020

11.346

Anforderungen für Leistungsnachweise

Den Leistungsnachweis erhält, wer in der Summe aller benoteten Aufgaben mindestens 50% der Höchstpunktzahl erreicht hat.
Die Teilnahmebestätigung erhält, wer auf mindestens 50% der Kursunterlagen zugegriffen hat.

Mehr Informationen finden Sie auf der Seite für Zertifikate und Richtlinien.

Dieser Kurs wird angeboten von

Prof. Dr. Felix Naumann

Prof. Felix Naumann leitet seit 2006 das Fachgebiet Informationssysteme am Hasso Plattner Institut in Potsdam. Dort entwickelt er zusammen mit seinem Team Methoden zur Datenanalyse, Datenreinigung, Informationsintegration und Text Mining. Er ist Autor zahlreicher wissenschaftlicher Artikel und betreut eine Vielzahl an Doktoranden. Felix Naumann gibt regelmäßig Vorlesungen in den Bachelor- und Masterstudiengängen IT-Systems Engineering über Datenbanksysteme und weiterführende Themen des Informationsmanagement, und er ist Autor eines Lehrbuchs zur Informationsintegration. Felix Naumann studierte Wirtschaftsmathematik an der Technischen Universität Berlin und wurde 1997 Stipendiat des Berlin-Brandenburger Graduiertenkollegs "Verteile Systeme". Seine Promotion wurde mit dem Dissertationspreis 2000 der Gesellschaft für Informatik ausgezeichnet. Nach einem zweijährigen Forschungsaufenthalt am IBM Almaden Research Center lehrte und forschte er als Juniorprofessor an der Humboldt Universität zu Berlin. Als Gastwissenschaftler verbrachte er seit 2006 zudem mehrere internationale Forschungsaufenthalte.