Modul Data Science, Informatik (Master) (SPO 7)

Modulübersicht

Modulbezeichnung

Data Science

EDV-Bezeichnung

INFM120ML

Verantwortlich

Prof. Dr. Reimar Hofmann

Umfang (ECTS/SWS)

7/5

Einordnung

Alle Semester

Inhaltliche Voraussetzungen

keine

Voraussetzungen nach SPO

keine

Kompetenzen

In diesem Modul werden theoretische und mathematische Grundlagen des Maschinellen Lernens sowie Methoden der Datenanalyse behandelt.

Die vermittelten Inhalte und Kompetenzen des Moduls sind für die Teilnahme am Modul Künstliche Intelligenz von Vorteil.

Prüfungsleistungen

Klausur/mündl. Prüfung 120/20 Min. (benotet)

Lehrveranstaltung Data Science

EDV-Bezeichnung

INFM121ML.a

Art/Modus

Vorlesung

Dozent/in

Prof. Dr. Reimar Hofmann

Lehrsprache

deutsch

Umfang (ECTS/SWS)

2/2

60 Stunden gesamt, davon 30 Stunden Kontaktstudium.

Prüfungsleistungen

Modulprüfung

Inhalt

Ziel: Theoretische und praktische Kenntnissen über Data Analytics im Kontext Maschinellen Lernens

Einführung und Motivation
Prozessmodelle, z.B. CRISP-DM
Datenvorverarbeitung (Feature Engineering im Sinne von processing and cleaning)

Datentypen: nominal, ordinal, intervall, ratio
Typische Daten (bag of words, record-daten, heterogene Daten etc.)
Umgang mit Daten heterogener Typen
Konvertierung von Datentypen (one-hot-coding etc.)
Manipulation Wertebereich: Normierung, z.B z-score, bagging, Entropie-basiert usw., fehlende Werte
Dimensionsreduktion: heuristisch, manuell etc.
Umfangsreduktion: Sampling etc.
Spezielle Methoden der Vorverarbeitung, z.B. Word2Vec

Exploration

Deskriptive Statistik
Datenvisualisierung

Modellierung (u.a. Methode kleinster Quadrate), Over-Fitting, Model Tuning

Empfohlene Literatur

Lehrveranstaltung Optimierung

EDV-Bezeichnung

INFM121ML.b

Art/Modus

Vorlesung

Dozent/in

Prof. Dr.-Ing. Astrid Laubenheimer

Lehrsprache

deutsch

Umfang (ECTS/SWS)

2/2

60 Stunden gesamt, davon 30 Stunden Kontaktstudium.

Prüfungsleistungen

Modulprüfung

Inhalt

Ziel: Vermittlung von theoretischen und praktischen Kenntnissen über Optimierungsmethoden/-kalküle im Kontext des Maschinellen Lernens (Minimierung der Fehlerfunktion)

Inhalte:

Einführung, Motivation und Modellierung

(Wiederholung) Mehrdimensionale Analysis (u.a. Gradienten einführen und verstehen, Taylorentwicklung, konvexe Funktionen, spezielle Ableitungen)

Numerische Verfahren zur Lösung von Gleichungssystemen:

Direkte Ansätze (Gauß-Jordan, LU, Cholesky, QR)
Iterative Ansätze (z.B. Jacobi-Verfahren)
Konvergenzgeschwindigkeit
Lineare Gleichungssysteme mit speziellen (z.B. dünn besetzten) Matrizen

Gradientenabstieg:

Line-search, Schrittweitestrategien
Newton-Verfahren (für quadratische Funktionen), Levenberg-Marquardt, Gauß-Newton, Quasi-Newton
Stochastischer Gradientenabstieg (Momentum, Nesterov Momentum)
Adaptive Lernraten (AdaGrad, RMSProp, Adam)

Kleinste Quadrate (Least Squares - LS):

Formulierung
Lineares LS, nichtlineares LS, alternierendes LS
Varianten LS
Vektorielle Residuen
Robustes LS

Restringierte Optimierung:

Lagrange-Multiplikatoren
SVM

Auf Wunsch: Spezielle Kapitel

Empfohlene Literatur

M. P. Deisenroth, A. A. Faisal, C. S. Ong. Mathematics for Machine Learning. Cambridge University Press. 2020.

I. Goodfellow, Y. Bengio, A. Couville. Deep Learning. MIT Press. 2016.

J. Nocedal, S. J. Wright. Numerical Optimization. Springer. 2006.

W. H. Press, S. A. Teukolsky, W. T. Vetterling, B. P. Flannery. Numerical Recipies in C. Cambridge University Press. 2007.

Lehrveranstaltung Optimierung Übung

EDV-Bezeichnung

INFM122ML

Art/Modus

Übung

Dozent/in

Prof. Dr.-Ing. Astrid Laubenheimer

Lehrsprache

deutsch

Umfang (ECTS/SWS)

3/1

90 Stunden gesamt, davon 15 Stunden Kontaktstudium.

Prüfungsleistungen

Übung 1 Semester (nicht benotet)

Inhalt

Übungen und praktische Optimierungsaufgaben begleitend zur Vorlesung Optimierung.

Empfohlene Literatur

Anmerkungen

Die Übung wird mit Python durchgeführt, wahlweise auf dem eigenen Laptop oder auf PCs des Labors für Maschinelles Lernen. Erste Erfahrungen im Umgang mit Python (wie etwa in der Übung Maschinelles Lernen angeboten) werden vorausgesetzt. Die Übung findet in der zweiten Vorlesungshälfte statt.

Modul Data Science, Informatik (Master) (SPO 7)

Farbschema