Modul Data Science, Informatik (Master) (SPO 6)

Modulübersicht

Modulbezeichnung

Data Science

EDV-Bezeichnung

INFM120ML

Verantwortlich

Prof. Dr. Reimar Hofmann

Umfang (ECTS/SWS)

7/5

Einordnung

Alle Semester

Inhaltliche Voraussetzungen

keine

Voraussetzungen nach SPO

keine

Kompetenzen

In diesem Modul werden theoretische und mathematische Grundlagen des Maschinellen Lernens sowie Methoden der Datenanalyse behandelt.

Die vermittelten Inhalte und Kompetenzen des Moduls sind für die Teilnahme am Modul Künstliche Intelligenz von Vorteil.

Prüfungsleistungen

Klausur 90 Min. (benotet)

Lehrveranstaltung Data Science

EDV-Bezeichnung

INFM121ML.a

Art/Modus

Vorlesung

Dozent/in

Prof. Dr. Reimar Hofmann

Lehrsprache

deutsch

Umfang (ECTS/SWS)

2/2

60 Stunden gesamt, davon 30 Stunden Kontaktstudium.

Prüfungsleistungen

Modulprüfung

Inhalt

Ziel: Theoretische und praktische Kenntnissen über Data Analytics im Kontext Maschinellen Lernens

Einführung und Motivation
Prozessmodelle, z.B. CRISP-DM
Datenvorverarbeitung (Feature Engineering im Sinne von processing and cleaning)

Datentypen: nominal, ordinal, intervall, ratio
Typische Daten (bag of words, record-daten, heterogene Daten etc.)
Umgang mit Daten heterogener Typen
Konvertierung von Datentypen (one-hot-coding etc.)
Manipulation Wertebereich: Normierung, z.B z-score, bagging, Entropie-basiert usw., fehlende Werte
Dimensionsreduktion: heuristisch, manuell etc.
Umfangsreduktion: Sampling etc.
Spezielle Methoden der Vorverarbeitung, z.B. Word2Vec

Exploration

Deskriptive Statistik
Datenvisualisierung

Modellierung (u.a. Methode kleinster Quadrate), Over-Fitting, Model Tuning

Empfohlene Literatur

Lehrveranstaltung Optimierung

EDV-Bezeichnung

INFM121ML.b

Art/Modus

Vorlesung

Dozent/in

Prof. Dr.-Ing. Astrid Laubenheimer

Lehrsprache

deutsch

Umfang (ECTS/SWS)

2/2

60 Stunden gesamt, davon 30 Stunden Kontaktstudium.

Prüfungsleistungen

Modulprüfung

Inhalt

Ziel: Vermittlung von theoretischen und praktischen Kenntnissen über Optimierungsmethoden/-kalküle im Kontext des Maschinellen Lernens (Minimierung der Fehlerfunktion)

Einführung, Motivation und Modellierung
Wiederholung Mehrdimensionale Analysis (u.a. Gradienten einführen und verstehen)
Lösbarkeit und Optimalitätsbedingungen
(Lineare) Regression mit und ohne Regularisierungsterm
Gradientenverfahren und Anwendungen (insb. zum Training Neuronaler Netze, aber nicht nur)
Newton-Verfahren und Gauß-Netwon-Verfahren und Anwendungen (Approximationsprobleme, Source-Localization)
Konvexität (Mengen und Funktionen)
Projiziertes Gradientenverfahren und Anwendung auf Constrained Regression Probleme
Restringierte Optimierungsprobleme und Verwendung von Solvern aus der Matlab Optimization Toolbox zur Lösung von Problemen aus dem Maschinellen Lernen (z.B. Support-Vector-Maschinen)

Empfohlene Literatur

Lehrveranstaltung Optimierung Übung

EDV-Bezeichnung

INFM122ML

Art/Modus

Übung

Dozent/in

Prof. Dr.-Ing. Astrid Laubenheimer

Lehrsprache

deutsch

Umfang (ECTS/SWS)

3/1

90 Stunden gesamt, davon 15 Stunden Kontaktstudium.

Prüfungsleistungen

Übung 1 Semester (nicht benotet)

Inhalt

Übungen und praktische Optimierungsaufgaben begleitend zur Vorlesung Optimierung.

Empfohlene Literatur

Anmerkungen

Die Übung wird mit Python durchgeführt, wahlweise auf dem eigenen Laptop oder auf PCs des Labors für Maschinelles Lernen. Erste Erfahrungen im Umgang mit Python (wie etwa in der Übung Maschinelles Lernen angeboten) werden vorausgesetzt. Die Übung findet in der zweiten Vorlesungshälfte statt.

Modul Data Science, Informatik (Master) (SPO 6)

Farbschema