Hochschullehrer:
Beginn:
  • 01.01.2020

Neuronale Netze (NN) sind das beste Werkzeug um Bildinhalte zu klassifizieren. Der Durchbruch gelang mit der zuverlässigen Klassifikation von handgeschriebenen Postleitzahlen. Heutige Implementierungen verwenden echtzeitfähige Implementierungen um Fußgänger, Autos, LKWs und viele weitere Objekte zu erkennen.

Trotz der hohen Verbreitung von neuronalen Netzen, gibt es wenig Erkenntnisse über die Vorverarbeitung der Eingangsdaten. Heutzutage wird die Anzahl der Eingangsdaten erhöht, in dem Trainingsbilder beschnitten, rotiert oder Rauschen aufaddiert wird. Gleichzeitig konnte gezeigt werden, dass minimale Änderungen an den Eingangsdaten, große Auswirkungen auf das Ergebnis mit einer erheblichen Anzahl an Falschklassifikationen haben.

Aus diesem Grund soll in einer ersten Arbeit die Erhöhung der Eingangsdaten näher betrachtet werden. Vor allem der Fall der Rotation soll näher untersucht werden. Wird ein Bild rotiert, so verlieren die Pixel ihre feste Zuordnung auf dem regelmäßigen Gitter. Eine Umtastung muss vorgenommen werden. In dieser Arbeit soll untersucht werden, welche Auswirkungen unterschiedliche Methoden zur Umtastung auf das Klassifikationsergebnis haben.

In einer zweiten Arbeit soll die Objekterkennung in verzerrten Bilder, z.B. Fisheye Bildern, näher betrachtet werden. Insbesondere soll herausgefunden werden, ob die Klassifikation auf verzerrten oder entzerrten Bildern besser funktioniert. Auch bei dieser Entzerrung müssen die Bilder umgetastet werden, so dass hier ebenfalls der Einfluss der Umtastungstechnik auf das Klassifikationsresult näher analysiert werden kann.