Deep Learning-Based Video Coding for Machines

17. Oktober 2024

Beschreibung

Bild- und Videodaten werden zunehmend nicht nur von einem menschlichen Betrachter ausgewertet, sondern mittels Algorithmen maschinell ausgewertet. In vielen Szenarien, wie z.B. Smart City Systemen, ist die Rechenleistung am Aufnahmegerät zu gering, um die Auswertung lokal durchzuführen. Die Bilddaten werden stattdessen an Geräte mit ausreichender Rechenleistung übertragen. Da die Bandbreite limitiert ist, müssen verlustbehaftete Kompressionsverfahren angewandt werden. Bereits existierende Videokompressionstechniken sind jedoch auf die visuelle Qualität der Rekonstruktion und nicht auf eine optimale Auswertung mit Algorithmen optimiert. Im Rahmen von „Video Coding for Machines“ (VCM) werden verschiedene Methoden für diesen Anwendungsfall untersucht.

Voraussetzungen

Vorausgesetzt werden Erfahrungen in der Programmierung mit Python, Deep Learning (PyTorch/TF) und Bild- und Videokompression

Betreuer

Marc Windsheimer
marc.windsheimer@fau.de
Raum 06.036

Hochschullehrer

Prof. Dr.-Ing. André Kaup
andre.kaup@fau.de
Raum 06.031