Projekt Deep Visual Learning, Sommersemester 2025
Inhalt

Das Projekt beginnt mit einer grundlegenden Einführung in Deep-Learning-Konzepte für visuelle Daten, die grundlegende Architekturen wie convolutional neural networks (CNNs) und Vision-Transformatoren abdeckt. Die Studierenden werden mit modernen Frameworks wie PyTorch arbeiten, um Modelle für Aufgaben wie Bildklassifizierung, Objekterkennung und Bilderzeugung zu implementieren. Nach der Einführung wird sich jeder Student auf ein spezielles Deep-Learning-Projekt konzentrieren, entweder einzeln oder in kleinen Gruppen. Während des gesamten Projekts folgen die Studierenden einem strukturierten Arbeitsablauf und berücksichtigen dabei Software-Engineering-Prinzipien wie modulare Code-Entwicklung, Reproduzierbarkeit und angemessene Dokumentation. Diese Projekte ermöglichen es ihnen, tiefer in eine spezifische Anwendung einzutauchen, wie z. B. die Berechnung von Bildern in der realen Welt, medizinische Bildgebung oder generative KI. Während des Projekts entwickeln die Studierenden praktische Programmierfähigkeiten, sammeln Erfahrungen mit großen Datensätzen und lernen, wie sie die rechnerischen Herausforderungen des Deep Learning in der Praxis bewältigen können.
Allgemeine Hinweise
In diesem Projekt werden die Studierenden die Möglichkeiten der KI für Bilder erschließen, indem sie visuelle Deep-Learning-Techniken und deren Anwendungen beherrschen. Durch praktische Erfahrung werden sie lernen, wie man Deep-Learning-Modelle für bildbasierte Aufgaben entwirft, trainiert und evaluiert. Zu den wichtigsten Lernzielen gehören die Beherrschung von Deep Neural Network-Architekturen, die Optimierung der Modellleistung, der Umgang mit großen Bilddatensätzen und die Erkundung fortgeschrittener Themen wie generative Modelle und selbstüberwachtes Lernen. Die Studierenden werden auch praktische Erfahrungen in realen Umgebungen sammeln, indem sie auf dem VisCom GPU-Cluster und dem BwUniCluster arbeiten, wo sie lernen werden, wie man Deep-Learning-Workloads effizient verwaltet. Am Ende des Projekts werden sie sowohl theoretisches Wissen als auch praktische Fähigkeiten erworben haben, die für die Anwendung von Deep Learning in Forschung und Industrie unerlässlich sind.

Medieninformatik
Visual Deep Learning
(Bachelor)
(6LP)
(75707 / 15707)