Grundlagen des maschinellen Lernens mit Python

Modulgruppe: Informatik

In diesem Modul erlernen die TeilnehmerInnen grundlegende Methoden des maschinellen Lernens und deren Anwendung in Python. Das Modul vermittelt theoretische Grundlagen zu Algorithmen des überwachten und unüberwachten Lernens und verzahnt diese stets mit der Anwendung in Python auf Basis realer Datensätze. Da der Einsatz maschineller Lernverfahren weitreichende Implikationen haben kann, liegt ein besonderes Augenmerk auf der korrekten Evaluation der Modelle und Einordnung der Ergebnisse.

Das Modul beinhaltet einen festen wöchentlichen Online-Termin am Dienstagabend, jeweils von 19:00 - 20:30 Uhr.

Termine:
  • 12./19./26. März 2024
  • 2./9./16./23./30. April 2024
  • 7./14. Mai 2024
  • 4./11./18./25. Juni 2024
  • 2./9./16. Juli 2024

  

Das Modulhandbuch finden Sie hier.

Zunächst werden generelle Konzepte vorgestellt wie unterschiedliche Lernansätze ((Un-)Supervised, Reinforcement), Umgang mit verschiedenartigen Daten (Skalenniveaus), Problemlösungsvorgehen nach CRISP-DM, Trainings- und Testdaten, Loss-Functions oder Qualitätsmaße.

Die folgenden Inhalte werden mit umfangreichem Übungsanteil auf Basis realer Daten (etwa von der Kaggle-Website) hauptsächlich mit Hilfe der Python ML-Bibliothek scikit-learn unter Bezug auf die generellen Konzepte vermittelt:

- Unüberwachte Verfahren:
  + Clustering
  + Hauptkomponentenanalyse
  + Assoziationsanalyse
- Überwachte Verfahren
  + Regression
  + Klassfikation: Entscheidungsbäume, Naive Bayes, k-Nearest Neighbors
  + Ensemble Methoden: Random Forest, AdaBoost
- Einfache Neuronale Netze

Den Abschluss bildet ein Projekt, bei dem zur Lösung einer konkreten Aufgabenstellung verschiedene der zuvor erlerneten Konzepte und Methoden anhand des CRISP-DM-Prozesses zum Einsatz kommen sollen.

Die Studierenden...

Fachkompetenz

  • verstehen grundlegende Konzepte des maschinellen Lernens
  • beurteilen die Qualität gefundener Modelle anhand nachvollziehbarer Kriterien
  • wenden grundlegende Python-Bibliotheken für maschinelles Lernen an
  • wählen ML-Verfahren passend für gegebene Problemstellungen aus
  • bereiten Daten für das gewählte ML-Verfahren adäquat vor

Methodenkompetenz

  • wenden den CRISP-DM Prozess zur Lösung analytischer Fragestellungen an
  • entwerfen, implementieren und testen Ansätze zur Problemlösung  
  • lösen Anwendungsprobleme mit Hilfe eines geeigneten maschinellen Lernverfahrens
  • können die Problemlösungen in den Anwendungskontext einordnen

Sozial- und Selbstkompetenz

  • entwickeln und diskutieren Lösungen für Aufgaben des maschinellen Lernens und arbeiten in Kleingruppen
  • schätzen eigene analytische und konzeptionelle Fähigkeiten ein und können fachliche Stärken und Schwächen reflektieren

Das Online-Studium findet im Selbststudium in der Form eines „Flipped Classroom“ statt. Für das Selbststudium stehen Video-Vorlesungen, ausführliche und sauber dokumentierte Codebeispiele als Jupyter-Notebooks und praktische Übungen bereit. In wöchentlichen Online-Sprechstunden werden Sie bei der Bearbeitung des Lernstoffs zusätzlich unterstützt.

Voraussetzung ist ein erster Hochschulabschluss.

Inhaltlich: Grundkenntnisse in Python für Data Science wünschenswert (in der ersten Lerneinheit findet ein Crashkurs statt)

Empfohlen wird:

  • Ein Desktop-Rechner oder ein Notebook mit einer aktuellen, d.h. vom jeweiligen Hersteller unterstützten Version von Microsoft Windows, Apple macOS oder Linux
  • Ein Headset
  • Die aktuelle Version von Mozilla Firefox, Google Chrome, Apple Safari oder Microsoft Edge
  • Internet-Zugang (z.B. über xDSL, Cable, LTE, 5G) mit mindestens 3 Mbit/s in Downstream- und 384 kbit/s in Upstream-Richtung ("DSL 3000").

Bitte zögern Sie nicht, uns bei Fragen zu den technischen Anforderungen zu kontaktieren.

Bei erfolgreichem Abschluss des Moduls erhalten Sie ein Zertifikat sowie ein Supplement, das die Inhalte des Moduls als Übersicht auflistet. Im Supplement bestätigt Ihnen der Modulverantwortliche das Äquivalent von 3 Leistungspunkten nach ECTS.
 

Die Studiengebühren der Module für immatrikulierte Studierende bzw. für die Belegung von Einzelmodulen im Kontaktstudium finden Sie auf der Seite zur Modulübersicht.

Dozent

Prof. Dr. Reinhold von Schwerin
Technische Hochschule Ulm

 

 

Dieser Zertifikatskurs wurde im Rahmen des Projekts "Data Literacy und Data Science für den Mittelstand: Qualifizierung und Weiterbildung" entwickelt.

Gefördert vom Ministerium für Soziales und Integration Baden-Württemberg aus Mitteln des Europäischen Sozialfonds sowie vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg