Projekt Advanced Visual Deep Learning, Sommersemester 2025

Inhalt

Das Projekt konzentriert sich auf die eingehende Erforschung modernster visueller Deep-Learning-Architekturen, einschließlich Transformator-basierter Modelle, Diffusionsmodelle und multimodaler Netzwerke. Die Studierenden werden an Einzel- oder Kleingruppenprojekten arbeiten, in denen sie nicht nur Modelle trainieren und feinabstimmen, sondern auch aktiv Netzwerkstrukturen verändern, den Trainingsprozess optimieren und neuartige Variationen bestehender Architekturen implementieren. Mit Hilfe von PyTorch und dem VisCom GPU-Cluster sowie dem BwUniCluster werden sie große Experimente durchführen und ihre Modelle systematisch evaluieren. Die Lehrveranstaltung betont einen strukturierten Ansatz, der Software-Engineering-Prinzipien, systematische Experimente und die Interpretierbarkeit von Modellen einbezieht. Während des gesamten Moduls entwickeln die Studierenden die Fähigkeit, Deep-Learning-Architekturen kritisch zu bewerten und zu verbessern, und sammeln so wertvolle Erfahrungen sowohl für die Forschung als auch für industrielle Anwendungen.

Allgemeine Hinweise

In diesem Projekt werden die Studierenden ein tiefgreifendes Verständnis für fortgeschrittene Deep-Learning-Architekturen für visuelle Daten entwickeln. Neben dem Training von Modellen und der Handhabung von Datensätzen werden sie Architekturen für tiefe neuronale Netze kritisch analysieren, modifizieren und optimieren, um Leistung, Effizienz und Interpretierbarkeit zu verbessern. Sie werden Schlüsselkonzepte wie Vision Transformers, generative Modelle, selbstüberwachtes Lernen und effiziente Trainingstechniken untersuchen. Am Ende des Moduls werden die Studierenden die Fähigkeit erlangt haben, nicht nur bestehende Deep-Learning-Methoden anzuwenden, sondern auch Architekturen anzupassen und zu erweitern, um komplexe reale Herausforderungen auf forschungsorientierte Weise zu bewältigen.

Illustration Projekte Visual Computing
Einordnung

Medieninformatik
Informatik
KI
Cognitive Systems
(Master)

(8LP)

(75709 / 15709)