Self-paced course
An error occurred while loading the video player, or it takes a long time to initialize. You can try clearing your browser cache. Please try again later and contact the helpdesk if the problem persists.
Ohne Daten gibt es keine Künstliche Intelligenz. Maschinelles Lernen benutzt große Datenmengen, um KI-Modelle zu trainieren. Eine der größten Herausforderungen beim Einsatz von gesellschaftlich verträglicher KI ist die Bereitstellung ausreichender, besonders aber qualitativ hochwertiger Trainingsdaten. In dem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz.
Künstliche Intelligenz beruht auf Verfahren des maschinellen Lernens, die mit großen Datenmengen trainiert werden. Viele der KI-Methoden, die seit Ende der 1950er Jahre erforscht werden, basieren vor allem auf manuell entwickelten Modellen und Regeln. Neuronale Netze jedoch, die seit 2006/07 technisch und seit 2011/12 auch in der breiten Anwendung zum jüngsten Durchbruch von KI und maschinellem Lernen geführt haben, sind auf große Mengen passender Trainingsdaten zwingend angewiesen. Auch die Bundesregierung betont in ihrer nationalen Strategie für Künstliche Intelligenz die große Bedeutung von Trainingsdaten.
Wie kommt man an gute, also qualitativ hochwertige Trainingsdaten? Das ist die große Frage, die wir uns stellen müssen, wenn wir gesellschaftlich verträgliche KI entwickeln wollen.
Dabei ist “Qualität” in einem weiten Sinn zu verstehen und umfasst sowohl informatische als auch juristische, ethische, normungstechnische und regulatorische Aspekte. Ziele wie “Diskriminierungsfreiheit”, „Diversität“ oder “Arbeitnehmerdatenschutz”, die für KI-Anwendungen angestrebt werden, wirken auch auf die Daten und Prozesse zurück, mit denen KI-Systeme zuvor trainiert wurden. Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder asymmetrische Trainingsdaten zu unsicheren Modellen und können so letztlich zu Fehlentscheidungen führen. Auch die rechtlichen Vorgaben für KI-Test-, Validierungs- und Trainingsdaten sowie deren Umsetzung in Normen und Standards sind noch weitgehend ungeklärt und damit Gegenstand von Wissenschaft und Forschung. In unserem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz. Die Dozenten dieses Kurses forschen gemeinsam im Rahmen des KITQAR Projekts an dem Thema KI und Datenqualität.
Der Kurs richtet sich an die interessierte Öffentlichkeit, sowie an Praktiker und Praktikerinnen, die bei der Entwicklung und beim Einsatz von KI-Systemen nicht nur hohe Ergebnisqualität erzielen wollen, sondern auch Wert auf ethische und rechtliche Aspekte legen. Zur Teilnahme bestehen keine besonderen technischen Voraussetzungen – die relevanten KI-Grundlagen werden einführend erläutert.
Kursdauer: 2 Wochen + Prüfung
Zeitaufwand: 3 - 5 Stunden pro Kurswoche
You can access all graded assignments and earn a Record of Achievement with the course reactivation option. Learn more or
This course was rated with 4.21 stars in average from 458 votes.
Find out more in the certificate guidelines.
Prof. Felix Naumann studied mathematics, economy, and computer sciences at the University of Technology in Berlin. After receiving his diploma (MA) in 1997 he completed his PhD thesis in the area of data quality at Humboldt University of Berlin in 2000. In 2001 and 2002 he worked at the IBM Almaden Research Center on data integration topics. From 2003 - 2006 he was assistant professor for information integration, again at the Humboldt-University of Berlin. Since 2006 he holds the chair for information systems at the Hasso Plattner Institute at the University of Potsdam in Germany. He has been visiting researcher at QCRI in Qatar, AT&T Research in New York, and IBM Research in California. His research interests include data profiling, data cleansing, and text mining. Next to numerous PC memberships for international conferences, he has organized several conferences in various roles, he is editor-in-chief for the Information Systems journal and trustee of the VLDB Endowment. More details are at https://hpi.de/naumann/people/felix-naumann.html .
PD Dr. Jessica Heesen ist Leiterin des Forschungsschwerpunkts Medienethik und Informationstechnik am Internationalen Zentrum für Ethik in den Wissenschaften (IZEW) der Universität Tübingen. Sie beschäftigt sich in ihrer Arbeit insbesondere mit philosophischen Fragestellungen und ethischen Konflikten im Bereich Medien und Digitalisierung. Dazu gehören Probleme der Meinungsfreiheit in Sozialen Medien ebenso wie Fragen nach einer wertorientierten Entwicklung von Künstlicher Intelligenz.
Sie ist Autorin zahlreicher Veröffentlichungen zur Medien-, Technik- und Sicherheitsethik, darunter das Handbuch Medien- und Informationsethik. Ihre aktuellen Forschungsvorhaben beschäftigen sich mit der Nutzung von KI für diversitätsorientiertes und prosoziales Handeln, der Rolle von KI für Journalismus, der ethischen Reflexion von KI-Trainingsdaten und der Sicherheit von Kindern im Internet.
Jessica Heesen ist Leiterin der AG IT-Sicherheit und Privacy, Recht und Ethik der BMBF/Acatech-Plattform „Lernende Systeme – Die Plattform für Künstliche Intelligenz“, Sprecherin im baden-württembergischen Verbundprojekt „Digitalisierung im Dialog (digilog)“ für die Universität Tübingen und Mitglied im BMBF-Forum Privatheit. Sie wurde an der Universität Stuttgart promoviert und erhielt mit ihrer Habilitation am Karlsruher Institut für Technologie die Lehrbefugnis im Fach Philosophie.
Prof. Dr. Dr. Frauke Rostalski ist seit 2018 geschäftsführende Direktorin des Instituts für Strafrecht und Strafprozessrecht an der Universität zu Köln. Dort ist sie Inhaberin des Lehrstuhls für Strafrecht, Strafprozessrecht, Rechtsphilosophie und Rechtsvergleichung. Ein weiterer Schwerpunkt ihrer Forschung liegt auf den Herausforderungen der Digitalisierung für Recht und Moral. Sie studierte Rechtswissenschaften an der Philipps-Universität in Marburg und verbrachte Forschungsaufenthalte in China, Korea und den USA. An der Friedrich-Schiller-Universität in Jena promovierte sie zudem im Fach Philosophie. Frauke Rostalski ist Mitglied mehrerer wissenschaftlicher Vereinigungen, darunter auch die Kompetenzplattform Künstliche Intelligenz Nordrhein-Westfalen „KI.NRW“, wo sie den Teilbereich Recht des Zertifizierungsprojekts für den vertrauenswürdigen Einsatz von KI verantwortet. Seit April 2020 ist sie zudem Mitglied des Deutschen Ethikrates.
Dr. Sebastian Hallensleben leitet die Querschnittsthemen Digitalisierung und Künstliche Intelligenz im VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V. Er verantwortet sowohl die Entwicklung neuer digitaler Produkte und Services als auch das Begreifen von Digitalisierung als sektorübergreifender Gestaltungsaufgabe, u.a. durch Beratung und Konzeptentwicklung für den Bundestag, Bundesministerien und die EU-Kommission. Der Schwerpunkt liegt dabei insbesondere auf KI-Ethik, auf dem Umgang mit generierender KI sowie der Beschreibung von KI-Qualität. - Sebastian Hallensleben ist Vorsitzender des CEN-CENELEC JTC AI, der die europäischen KI-Standards zur Unterfütterung der EU-Regulierung erarbeitet, und Mitglied des Aufsichtsrats des StandICT-Programms der EU. Auf internationaler Ebene wirkt er u.a. in KI-Gremien der IEC, der OECD, des Europarats sowie der UNESCO mit. - In früheren Rollen arbeitete Sebastian Hallensleben unter anderem an Dialogprozessen zwischen Wissenschaft, Wirtschaft und Politik (z.B. im Rahmen von BMBF-Foresight) sowie in der Entwicklung nationaler und internationaler Infrastrukturprojekte für Abfall, Energie und Trinkwasser. Er ist promovierter Physiker und begann seine berufliche Laufbahn in IT-Entwicklung und Lösungsarchitekturen im Finanz- und Telekommunikationssektor, zunächst im mobilen Devicemanagement bei Ericsson, später bei AspectCapital in der systematischen Entwicklung von Handelssystemen.