Grundlagen des maschinellen Lernens mit Python

Modulgruppe: Informatik

In diesem Modul erlernen die TeilnehmerInnen grundlegende Methoden des maschinellen Lernens und deren Anwendung in Python. Das Modul vermittelt theoretische Grundlagen zu Algorithmen des überwachten und unüberwachten Lernens und verzahnt diese stets mit der Anwendung in Python auf Basis realer Datensätze. Da der Einsatz maschineller Lernverfahren weitreichende Implikationen haben kann, liegt ein besonderes Augenmerk auf der korrekten Evaluation der Modelle und Einordnung der Ergebnisse.

Das Modul beinhaltet einen festen wöchentlichen Online-Termin am Dienstagabend, jeweils von 19:00 - 20:30 Uhr.

Online-Termine:

18./25. März 2025
1./8./15./22./29. April 2025
6./13./20./27. Mai 2025
3./24. Juni 2025
1./8./15./22. Juli 2025

Das Modulhandbuch finden Sie hier.

Zunächst werden generelle Konzepte vorgestellt wie unterschiedliche Lernansätze ((Un-)Supervised, Reinforcement), Umgang mit verschiedenartigen Daten (Skalenniveaus), Problemlösungsvorgehen nach CRISP-DM, Trainings- und Testdaten, Loss-Functions oder Qualitätsmaße.

Die folgenden Inhalte werden mit umfangreichem Übungsanteil auf Basis realer Daten (etwa von der Kaggle-Website) hauptsächlich mit Hilfe der Python ML-Bibliothek scikit-learn unter Bezug auf die generellen Konzepte vermittelt:

- Unüberwachte Verfahren:
+ Clustering
+ Hauptkomponentenanalyse
+ Assoziationsanalyse
- Überwachte Verfahren
+ Regression
+ Klassfikation: Entscheidungsbäume, Naive Bayes, k-Nearest Neighbors
+ Ensemble Methoden: Random Forest, AdaBoost
- Einfache Neuronale Netze

Den Abschluss bildet ein Projekt, bei dem zur Lösung einer konkreten Aufgabenstellung verschiedene der zuvor erlerneten Konzepte und Methoden anhand des CRISP-DM-Prozesses zum Einsatz kommen sollen.

Die Studierenden...

Fachkompetenz

verstehen grundlegende Konzepte des maschinellen Lernens
beurteilen die Qualität gefundener Modelle anhand nachvollziehbarer Kriterien
wenden grundlegende Python-Bibliotheken für maschinelles Lernen an
wählen ML-Verfahren passend für gegebene Problemstellungen aus
bereiten Daten für das gewählte ML-Verfahren adäquat vor

Methodenkompetenz

wenden den CRISP-DM Prozess zur Lösung analytischer Fragestellungen an
entwerfen, implementieren und testen Ansätze zur Problemlösung
lösen Anwendungsprobleme mit Hilfe eines geeigneten maschinellen Lernverfahrens
können die Problemlösungen in den Anwendungskontext einordnen

Sozial- und Selbstkompetenz

entwickeln und diskutieren Lösungen für Aufgaben des maschinellen Lernens und arbeiten in Kleingruppen
schätzen eigene analytische und konzeptionelle Fähigkeiten ein und können fachliche Stärken und Schwächen reflektieren

Das Online-Studium findet im Selbststudium in der Form eines „Flipped Classroom“ statt. Für das Selbststudium stehen Video-Vorlesungen, ausführliche und sauber dokumentierte Codebeispiele als Jupyter-Notebooks und praktische Übungen bereit. In wöchentlichen Online-Sprechstunden werden Sie bei der Bearbeitung des Lernstoffs zusätzlich unterstützt.

Voraussetzung ist ein erster Hochschulabschluss.

Inhaltlich: Grundkenntnisse in Python für Data Science wünschenswert (in der ersten Lerneinheit findet ein Crashkurs statt)

Dozent

Prof. Dr. Reinhold von Schwerin
Technische Hochschule Ulm

Dieser Zertifikatskurs wurde im Rahmen des Projekts "Data Literacy und Data Science für den Mittelstand: Qualifizierung und Weiterbildung" entwickelt.

Gefördert vom Ministerium für Soziales und Integration Baden-Württemberg aus Mitteln des Europäischen Sozialfonds sowie vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg

Grundlagen des maschinellen Lernens mit Python

Online-Termine:

Modulhandbuch

Inhalte des Moduls

Lernziele

Lernsetting

Voraussetzungen

Technische Voraussetzungen für die E-Learning-Lerneinheiten

Zertifizierung

Gebühren

Dozent