Kurs im Selbststudium

KI und Datenqualität - Perspektiven aus Data Science, Ethik, Normung und Recht

Angeboten von Prof. Dr. Felix Naumann, PD Dr. Jessica Heesen, Prof. Dr. Dr. Frauke Rostalski, Dr. Sebastian Hallensleben

Beim Laden des Videoplayers ist ein Fehler aufgetreten, oder es dauert lange, bis er initialisiert wird. Sie können versuchen, Ihren Browser-Cache zu leeren. Bitte versuchen Sie es später noch einmal und wenden Sie sich an den Helpdesk, wenn das Problem weiterhin besteht.

Ohne Daten gibt es keine Künstliche Intelligenz. Maschinelles Lernen benutzt große Datenmengen, um KI-Modelle zu trainieren. Eine der größten Herausforderungen beim Einsatz von gesellschaftlich verträglicher KI ist die Bereitstellung ausreichender, besonders aber qualitativ hochwertiger Trainingsdaten. In dem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz.

Seit 4. Mai 2023 im Selbststudium
Kurssprache: Deutsch
Beginner, Big Data and AI

Kursinformationen

Künstliche Intelligenz beruht auf Verfahren des maschinellen Lernens, die mit großen Datenmengen trainiert werden. Viele der KI-Methoden, die seit Ende der 1950er Jahre erforscht werden, basieren vor allem auf manuell entwickelten Modellen und Regeln. Neuronale Netze jedoch, die seit 2006/07 technisch und seit 2011/12 auch in der breiten Anwendung zum jüngsten Durchbruch von KI und maschinellem Lernen geführt haben, sind auf große Mengen passender Trainingsdaten zwingend angewiesen. Auch die Bundesregierung betont in ihrer nationalen Strategie für Künstliche Intelligenz die große Bedeutung von Trainingsdaten.
Wie kommt man an gute, also qualitativ hochwertige Trainingsdaten? Das ist die große Frage, die wir uns stellen müssen, wenn wir gesellschaftlich verträgliche KI entwickeln wollen.
Dabei ist “Qualität” in einem weiten Sinn zu verstehen und umfasst sowohl informatische als auch juristische, ethische, normungstechnische und regulatorische Aspekte. Ziele wie “Diskriminierungsfreiheit”, „Diversität“ oder “Arbeitnehmerdatenschutz”, die für KI-Anwendungen angestrebt werden, wirken auch auf die Daten und Prozesse zurück, mit denen KI-Systeme zuvor trainiert wurden. Umgekehrt führen unvollständige, fehlerbehaftete, unpassende oder asymmetrische Trainingsdaten zu unsicheren Modellen und können so letztlich zu Fehlentscheidungen führen. Auch die rechtlichen Vorgaben für KI-Test-, Validierungs- und Trainingsdaten sowie deren Umsetzung in Normen und Standards sind noch weitgehend ungeklärt und damit Gegenstand von Wissenschaft und Forschung. In unserem Kurs “KI und Datenqualität” berichten Expertinnen und Experten aus den Bereichen Informatik, Recht, Ethik und Normung über diese vielfältigen Aspekte der Daten für die Künstliche Intelligenz. Die Dozenten dieses Kurses forschen gemeinsam im Rahmen des KITQAR Projekts an dem Thema KI und Datenqualität.

Der Kurs richtet sich an die interessierte Öffentlichkeit, sowie an Praktiker und Praktikerinnen, die bei der Entwicklung und beim Einsatz von KI-Systemen nicht nur hohe Ergebnisqualität erzielen wollen, sondern auch Wert auf ethische und rechtliche Aspekte legen. Zur Teilnahme bestehen keine besonderen technischen Voraussetzungen – die relevanten KI-Grundlagen werden einführend erläutert.

Kursdauer: 2 Wochen + Prüfung
Zeitaufwand: 3 - 5 Stunden pro Kurswoche

Lernmaterial

  • Vorstellung

  • Woche 1.1: KI Einführung

  • Woche 1.2: Datenqualität

  • Woche 2.1: Regulierung von Datenqualität

  • Woche 2.2: Herausforderungen mangelnder Datenqualität

  • Abschlussprüfung:

    Klausur zum Abschluss des Kurses
  • I like, I wish

Diesen Kurs reaktivieren

Diesen Kurs können Sie reaktivieren und so die Möglichkeit erhalten, sich noch für einen Leistungsnachweis zu qualifizieren. Weitere Informationen finden Sie hier — oder

Für diesen Kurs einschreiben

Der Kurs ist kostenlos. Legen Sie sich einfach ein Benutzerkonto auf openHPI an und nehmen Sie am Kurs teil!
Jetzt einschreiben

Lernende

Aktuell
Heute
4.791
Kursende
4. Mai 2023
2.795
Kursstart
19. April 2023
2.439

Bewertungen

Der Kurs wurde mit durchschnittlich 4.21 Sternen bei 458 abgegebenen Stimmen bewertet.

Anforderungen für Leistungsnachweise

  • Den Leistungsnachweis erhält, wer in der Summe aller benoteten Aufgaben mindestens 50% der Höchstpunktzahl erreicht hat.
  • Die Teilnahmebestätigung erhält, wer auf mindestens 50% der Kursunterlagen zugegriffen hat.
  • Einen Open Badge erhalten Sie, indem Sie den Kurs abschließen.

Mehr Informationen finden Sie in den Richtlinien für Leistungsnachweise.

Dieser Kurs wird angeboten von

Prof. Dr. Felix Naumann

Prof. Felix Naumann leitet seit 2006 das Fachgebiet Informationssysteme am Hasso Plattner Institut in Potsdam. Dort entwickelt er zusammen mit seinem Team Methoden zur Datenanalyse, Datenreinigung, Informationsintegration und Text Mining. Er ist Autor zahlreicher wissenschaftlicher Artikel und betreut eine Vielzahl an Doktoranden. Felix Naumann gibt regelmäßig Vorlesungen in den Bachelor- und Masterstudiengängen IT-Systems Engineering über Datenbanksysteme und weiterführende Themen des Informationsmanagement, und er ist Autor eines Lehrbuchs zur Informationsintegration. Felix Naumann studierte Wirtschaftsmathematik an der Technischen Universität Berlin und wurde 1997 Stipendiat des Berlin-Brandenburger Graduiertenkollegs "Verteile Systeme". Seine Promotion wurde mit dem Dissertationspreis 2000 der Gesellschaft für Informatik ausgezeichnet. Nach einem zweijährigen Forschungsaufenthalt am IBM Almaden Research Center lehrte und forschte er als Juniorprofessor an der Humboldt Universität zu Berlin. Als Gastwissenschaftler verbrachte er seit 2006 zudem mehrere internationale Forschungsaufenthalte.

PD Dr. Jessica Heesen

PD Dr. Jessica Heesen ist Leiterin des Forschungsschwerpunkts Medienethik und Informationstechnik am Internationalen Zentrum für Ethik in den Wissenschaften (IZEW) der Universität Tübingen. Sie beschäftigt sich in ihrer Arbeit insbesondere mit philosophischen Fragestellungen und ethischen Konflikten im Bereich Medien und Digitalisierung. Dazu gehören Probleme der Meinungsfreiheit in Sozialen Medien ebenso wie Fragen nach einer wertorientierten Entwicklung von Künstlicher Intelligenz.
Sie ist Autorin zahlreicher Veröffentlichungen zur Medien-, Technik- und Sicherheitsethik, darunter das Handbuch Medien- und Informationsethik. Ihre aktuellen Forschungsvorhaben beschäftigen sich mit der Nutzung von KI für diversitätsorientiertes und prosoziales Handeln, der Rolle von KI für Journalismus, der ethischen Reflexion von KI-Trainingsdaten und der Sicherheit von Kindern im Internet.
Jessica Heesen ist Leiterin der AG IT-Sicherheit und Privacy, Recht und Ethik der BMBF/Acatech-Plattform „Lernende Systeme – Die Plattform für Künstliche Intelligenz“, Sprecherin im baden-württembergischen Verbundprojekt „Digitalisierung im Dialog (digilog)“ für die Universität Tübingen und Mitglied im BMBF-Forum Privatheit. Sie wurde an der Universität Stuttgart promoviert und erhielt mit ihrer Habilitation am Karlsruher Institut für Technologie die Lehrbefugnis im Fach Philosophie.

Prof. Dr. Dr. Frauke Rostalski

Prof. Dr. Dr. Frauke Rostalski ist seit 2018 geschäftsführende Direktorin des Instituts für Strafrecht und Strafprozessrecht an der Universität zu Köln. Dort ist sie Inhaberin des Lehrstuhls für Strafrecht, Strafprozessrecht, Rechtsphilosophie und Rechtsvergleichung. Ein weiterer Schwerpunkt ihrer Forschung liegt auf den Herausforderungen der Digitalisierung für Recht und Moral. Sie studierte Rechtswissenschaften an der Philipps-Universität in Marburg und verbrachte Forschungsaufenthalte in China, Korea und den USA. An der Friedrich-Schiller-Universität in Jena promovierte sie zudem im Fach Philosophie. Frauke Rostalski ist Mitglied mehrerer wissenschaftlicher Vereinigungen, darunter auch die Kompetenzplattform Künstliche Intelligenz Nordrhein-Westfalen „KI.NRW“, wo sie den Teilbereich Recht des Zertifizierungsprojekts für den vertrauenswürdigen Einsatz von KI verantwortet. Seit April 2020 ist sie zudem Mitglied des Deutschen Ethikrates.

Dr. Sebastian Hallensleben

Dr. Sebastian Hallensleben leitet die Querschnittsthemen Digitalisierung und Künstliche Intelligenz im VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V. Er verantwortet sowohl die Entwicklung neuer digitaler Produkte und Services als auch das Begreifen von Digitalisierung als sektorübergreifender Gestaltungsaufgabe, u.a. durch Beratung und Konzeptentwicklung für den Bundestag, Bundesministerien und die EU-Kommission. Der Schwerpunkt liegt dabei insbesondere auf KI-Ethik, auf dem Umgang mit generierender KI sowie der Beschreibung von KI-Qualität. - Sebastian Hallensleben ist Vorsitzender des CEN-CENELEC JTC AI, der die europäischen KI-Standards zur Unterfütterung der EU-Regulierung erarbeitet, und Mitglied des Aufsichtsrats des StandICT-Programms der EU. Auf internationaler Ebene wirkt er u.a. in KI-Gremien der IEC, der OECD, des Europarats sowie der UNESCO mit. - In früheren Rollen arbeitete Sebastian Hallensleben unter anderem an Dialogprozessen zwischen Wissenschaft, Wirtschaft und Politik (z.B. im Rahmen von BMBF-Foresight) sowie in der Entwicklung nationaler und internationaler Infrastrukturprojekte für Abfall, Energie und Trinkwasser. Er ist promovierter Physiker und begann seine berufliche Laufbahn in IT-Entwicklung und Lösungsarchitekturen im Finanz- und Telekommunikationssektor, zunächst im mobilen Devicemanagement bei Ericsson, später bei AspectCapital in der systematischen Entwicklung von Handelssystemen.