Research Topics
[MA] Effizientes Auffinden ähnlicher Bilder in großen Datenbeständen
Durch die breite Verfügbarkeit von Geräten zur Bildgenerierung, wie Digitalkameras oder
Scannern, haben sich visuelle Medien zu einer relevanten - oft bevorzugten - Art der
Kommunikation entwickelt. Die immer stärkere Verwendung von Bildinhalten als Mittel
des Ausdrucks dessen, was man „sagen" oder „tun" möchte, verändert somit auch die
Art und Weise, wie Nutzer digitaler Lösungen mit den dahinter liegenden IT-Systemen
interagieren. Ein Aspekt hiervon ist die Suche nach visuellen Inhalten, deren
Ausgangspunkt nicht die textbasierte Beschreibung semantisch interpretierbarer
Suchkriterien ist, sondern vielmehr ein ebenfalls visuell erfasstes Pendant.
Es existieren zahlreiche Ansätze, die eine solche Ähnlichkeitssuche implementieren.
Aufgrund der in realen Einsatzszenarien vorliegenden großen Datenmengen, stehen diese
in einem Spannungsfeld zwischen Komplexität, Präzision und Effizienz. Kurzum: Für den
breiten Einsatz müssen sie unter Verwendung von Standardhardware, in einer für den
Endanwender akzeptablen Zeit, verwertbare Ergebnisse liefern. Dabei spielen zwei
Aspekte eine Rolle:
- Die Aufbereitung des in der Datenbank erfassten Bildmaterials erfordert in der Regel sehr zeit- und rechenintensive Schritte der Bildverarbeitung sowie der Extraktion von Eigenschaftsvektoren. Hieraus gewonnene Daten müssen dann für den eigentlichen Zweck, einer Ähnlichkeitsanalyse von Bildmaterial, entsprechend aufbereitet werden.
- Die Abfrage ähnlicher Bilder auf der Basis eines Referenzbildes muss effizient und ohne die Wiederholung der Schritte aus 1) für sämtliche erfasste Bilddaten realisiert werden.
- Welche Ansätze existieren zur Ähnlichkeitsanalyse von Bildern?
- Wie sind diese Ansätze qualitativ hinsichtlich ihrer Genauigkeit zu bewerten?
- Wie können auf Basis der bestehenden Ansätze Kriterien abgeleitet werden, die zu der Clusterbildung führen?
- In welcher Form müssen die Daten aufbereitet werden, um eine effiziente Abfrage ähnlicher Bilder in ihrem Cluster zu ermöglichen?
Betreuer: Sebastian Götz