Grundlagen des maschinellen Lernens mit Python
Modulgruppe: Informatik
In diesem Modul erlernen die TeilnehmerInnen grundlegende Methoden des maschinellen Lernens und deren Anwendung in Python. Das Modul vermittelt theoretische Grundlagen zu Algorithmen des überwachten und unüberwachten Lernens und verzahnt diese stets mit der Anwendung in Python auf Basis realer Datensätze. Da der Einsatz maschineller Lernverfahren weitreichende Implikationen haben kann, liegt ein besonderes Augenmerk auf der korrekten Evaluation der Modelle und Einordnung der Ergebnisse.
Das Modul beinhaltet einen festen wöchentlichen Online-Termin am Dienstagabend, jeweils von 19:00 - 20:30 Uhr.
Online-Termine:
- 18./25. März 2025
- 1./8./15./22./29. April 2025
- 6./13./20./27. Mai 2025
- 3./24. Juni 2025
- 1./8./15./22. Juli 2025
Das Modulhandbuch finden Sie hier.
Zunächst werden generelle Konzepte vorgestellt wie unterschiedliche Lernansätze ((Un-)Supervised, Reinforcement), Umgang mit verschiedenartigen Daten (Skalenniveaus), Problemlösungsvorgehen nach CRISP-DM, Trainings- und Testdaten, Loss-Functions oder Qualitätsmaße.
Die folgenden Inhalte werden mit umfangreichem Übungsanteil auf Basis realer Daten (etwa von der Kaggle-Website) hauptsächlich mit Hilfe der Python ML-Bibliothek scikit-learn unter Bezug auf die generellen Konzepte vermittelt:
- Unüberwachte Verfahren:
+ Clustering
+ Hauptkomponentenanalyse
+ Assoziationsanalyse
- Überwachte Verfahren
+ Regression
+ Klassfikation: Entscheidungsbäume, Naive Bayes, k-Nearest Neighbors
+ Ensemble Methoden: Random Forest, AdaBoost
- Einfache Neuronale Netze
Den Abschluss bildet ein Projekt, bei dem zur Lösung einer konkreten Aufgabenstellung verschiedene der zuvor erlerneten Konzepte und Methoden anhand des CRISP-DM-Prozesses zum Einsatz kommen sollen.
Die Studierenden...
Fachkompetenz
- verstehen grundlegende Konzepte des maschinellen Lernens
- beurteilen die Qualität gefundener Modelle anhand nachvollziehbarer Kriterien
- wenden grundlegende Python-Bibliotheken für maschinelles Lernen an
- wählen ML-Verfahren passend für gegebene Problemstellungen aus
- bereiten Daten für das gewählte ML-Verfahren adäquat vor
Methodenkompetenz
- wenden den CRISP-DM Prozess zur Lösung analytischer Fragestellungen an
- entwerfen, implementieren und testen Ansätze zur Problemlösung
- lösen Anwendungsprobleme mit Hilfe eines geeigneten maschinellen Lernverfahrens
- können die Problemlösungen in den Anwendungskontext einordnen
Sozial- und Selbstkompetenz
- entwickeln und diskutieren Lösungen für Aufgaben des maschinellen Lernens und arbeiten in Kleingruppen
- schätzen eigene analytische und konzeptionelle Fähigkeiten ein und können fachliche Stärken und Schwächen reflektieren
Das Online-Studium findet im Selbststudium in der Form eines „Flipped Classroom“ statt. Für das Selbststudium stehen Video-Vorlesungen, ausführliche und sauber dokumentierte Codebeispiele als Jupyter-Notebooks und praktische Übungen bereit. In wöchentlichen Online-Sprechstunden werden Sie bei der Bearbeitung des Lernstoffs zusätzlich unterstützt.
Voraussetzung ist ein erster Hochschulabschluss.
Inhaltlich: Grundkenntnisse in Python für Data Science wünschenswert (in der ersten Lerneinheit findet ein Crashkurs statt)
Empfohlen wird:
- Ein Desktop-Rechner oder ein Notebook mit einer aktuellen, d.h. vom jeweiligen Hersteller unterstützten Version von Microsoft Windows, Apple macOS oder Linux
- Ein Headset
- Die aktuelle Version von Mozilla Firefox, Google Chrome, Apple Safari oder Microsoft Edge
- Internet-Zugang (z.B. über xDSL, Cable, LTE, 5G) mit mindestens 3 Mbit/s in Downstream- und 384 kbit/s in Upstream-Richtung ("DSL 3000").
Bitte zögern Sie nicht, uns bei Fragen zu den technischen Anforderungen zu kontaktieren.
Bei erfolgreichem Abschluss des Moduls erhalten Sie ein Zertifikat sowie ein Supplement, das die Inhalte des Moduls als Übersicht auflistet. Im Supplement bestätigt Ihnen der Modulverantwortliche das Äquivalent von 3 Leistungspunkten nach ECTS.
Die Studiengebühren der Module für immatrikulierte Studierende bzw. für die Belegung von Einzelmodulen im Kontaktstudium finden Sie auf der Seite zur Modulübersicht.
Dozent
Prof. Dr. Reinhold von Schwerin
Technische Hochschule Ulm
Dieser Zertifikatskurs wurde im Rahmen des Projekts "Data Literacy und Data Science für den Mittelstand: Qualifizierung und Weiterbildung" entwickelt.
Gefördert vom Ministerium für Soziales und Integration Baden-Württemberg aus Mitteln des Europäischen Sozialfonds sowie vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg