Data Engineering und Data Science

An error occurred while loading the video player, or it takes a long time to initialize. You can try clearing your browser cache. Please try again later and contact the helpdesk if the problem persists.

Die Schlagwörter Künstliche Intelligenz, Data Science, Data Engineering, und Big Data dominieren seit einigen Jahren nicht nur die IT-Schlagzeilen. In unserem Kurs wollen wir diese Wörter mit grundlegendem Inhalt füllen und die typischen Arbeitsschritte eines Data Scientists nachvollziehen. Insbesondere schauen wir hinter die Kulissen und betrachten den oft mühsamen Weg der Daten bis sie endlich genutzt werden können um z.B. mittels maschinellem Lernen Modelle trainieren zu können. Dazu gehören die Datenbeschaffung, die Datenreinigung, und die Datenintegration. Anschließend lernen wir, wie man aus diesen Daten und auch aus Texten neue Erkenntnisse mittels Data Mining und maschinellem Lernen gewinnt. Der Abschluss bildet eine Diskussion über Ethik und Fairness bei der automatisierten Datenanalyse.

自二月 26, 2020起开始自学
语言: Deutsch
Beginner, Big Data and AI

注册该课程

课程信息

Zielgruppe

Interessierte Öffentlichkeit, PraktikerInnen und Bachelorstudierende

Kursstruktur

Woche 1: Big Data und Data Science
Woche 2: Data Science Anwendungen und Text Mining
Woche 3: Skalierbares Datenmanagement
Woche 4: Datenaufbereitung
Woche 5: Informationsintegration
Woche 6: Statistik, Data Mining, Machine Learning
Woche 7: Klausur

Arbeitsaufwand

Der Arbeitsaufwand für diesen Kurs entspricht 2 ECTS-Punkten.

Podcast-Empfehlung

Mehr zum Thema Data Engineering erfahren Sie auch in der aktuellen Folge des Neuland Podcast.

订阅本课程

该课程是免费的。只需在openHPI上注册一个帐户并参加课程！

现在注册吧

Learners

Current

Today

21,362

Course End

2月 26 2020

14,654

Course Start

1月 08 2020

11,346

评分

本课程已由55位用户进行了五分制评分，平均得分为4.95

证书要求

课程证书 授予者需要至少取得课程总分的百分之 50%。
参与证明 授予者需要至少学习了所有课程资料的百分之 50%。
完成课程可获得开放徽章。

欲知详情，请访问证书指南.

该课程提供者

Prof. Dr. Felix Naumann

Prof. Felix Naumann studied mathematics, economy, and computer sciences at the University of Technology in Berlin. After receiving his diploma (MA) in 1997 he completed his PhD thesis in the area of data quality at Humboldt University of Berlin in 2000. In 2001 and 2002 he worked at the IBM Almaden Research Center on data integration topics. From 2003 - 2006 he was assistant professor for information integration, again at the Humboldt-University of Berlin. Since 2006 he holds the chair for information systems at the Hasso Plattner Institute at the University of Potsdam in Germany. He has been visiting researcher at QCRI in Qatar, AT&T Research in New York, and IBM Research in California. His research interests include data profiling, data cleansing, and text mining. Next to numerous PC memberships for international conferences, he has organized several conferences in various roles, he is editor-in-chief for the Information Systems journal and trustee of the VLDB Endowment. More details are at https://hpi.de/naumann/people/felix-naumann.html .