Deep Learning-Based Video Coding for Machines
Beschreibung
Bild- und Videodaten werden zunehmend nicht nur von einem menschlichen Betrachter ausgewertet, sondern mittels Algorithmen maschinell ausgewertet. In vielen Szenarien, wie z.B. Smart City Systemen, ist die Rechenleistung am Aufnahmegerät zu gering, um die Auswertung lokal durchzuführen. Die Bilddaten werden stattdessen an Geräte mit ausreichender Rechenleistung übertragen. Da die Bandbreite limitiert ist, müssen verlustbehaftete Kompressionsverfahren angewandt werden. Bereits existierende Videokompressionstechniken sind jedoch auf die visuelle Qualität der Rekonstruktion und nicht auf eine optimale Auswertung mit Algorithmen optimiert. Im Rahmen von „Video Coding for Machines“ (VCM) werden verschiedene Methoden für diesen Anwendungsfall untersucht.
Details können dem folgenden Dokument entnommen werden:
Themen_Vorschläge
Voraussetzungen
Vorausgesetzt werden Erfahrungen in der Programmierung mit Python, Deep Learning (PyTorch/TF) und Bild- und Videokompression
Betreuer
Marc Windsheimer
marc.windsheimer@fau.de
Raum 06.036
Hochschullehrer
Prof. Dr.-Ing. André Kaup
andre.kaup@fau.de
Raum 06.031