Foto: ANDREA SEIFERT FOTOGRAFIE
Mensch vs. Maschine: Wer erkennt den Aufnahmeort eines Fotos
Foto: clango CC-By-SA 2.0
Ein Foto, das die Skyline einer Großstadt vor grauem Himmel zeigt, im Vordergrund Wasser: Welche Stadt ist das? Bei der Geolocation Estimation treten Mensch und Maschine gegeneinander an und schätzen, wo das Foto aufgenommen wurde. Das Ergebnis: Seattle. Meist gewinnt der Computer - dank künstlicher Intelligenz.
Das Verfahren zur Lokalisierung des Aufnahmeortes von Fotos hat die Forschungsgruppe Visual Analytics (Leitung Prof. Dr. Ralph Ewerth) der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften entwickelt. Ein maschinelles Lernverfahren auf Basis sogenannter neuronaler Netze nutzt zur Schätzung des Aufnahmeortes von Bildern neben geographischen Merkmalen zusätzlich kontextbezogene Informationen der abgebildeten Szene. Damit erlangt das neuronale Netz die Fähigkeit, für unterschiedliche Szenarien spezifische geographische Merkmale zu erlernen. „Bei Stadtimpressionen sind das etwa Bauwerke oder architektonische Details, bei Naturaufnahmen werden Pflanzen und Tiere berücksichtigt“, beschreibt Prof. Dr. Ewerth das Verfahren.
Das Verfahren zur Lokalisierung des Aufnahmeortes von Fotos hat die Forschungsgruppe Visual Analytics (Leitung Prof. Dr. Ralph Ewerth) der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften entwickelt. Ein maschinelles Lernverfahren auf Basis sogenannter neuronaler Netze nutzt zur Schätzung des Aufnahmeortes von Bildern neben geographischen Merkmalen zusätzlich kontextbezogene Informationen der abgebildeten Szene. Damit erlangt das neuronale Netz die Fähigkeit, für unterschiedliche Szenarien spezifische geographische Merkmale zu erlernen. „Bei Stadtimpressionen sind das etwa Bauwerke oder architektonische Details, bei Naturaufnahmen werden Pflanzen und Tiere berücksichtigt“, beschreibt Prof. Dr. Ewerth das Verfahren.
TIB-Direktor und L3S-Miglied Prof. Dr. Sören Auer hat das Ziel, dieses innovative Verfahren zur Geolokalisierung mittelfristig zu einem Web-Dienst der TIB zu entwickeln. „Mit einem solchen Dienst könnten Bilder in Gedächtnisinstitutionen wie Bibliotheken und Archiven weltweit besser gefunden werden“, sagt Auer.
Selbst gegen den Computer antreten kann man übrigens bei der browserbasierten Demonstration: hier.
Als Mitmach-Exponat im Deutschen Museum Bonn und auf der MS Wissenschaft
Im Frühjahr 2020 wird das Geolokalisierungstool als Mitmach-Exponat Besuchern im Rahmen einer Ausstellung zum Thema Künstliche Intelligenz (KI) im Deutschen Museum Bonn einen Einblick in die Forschung zu KI bieten. Bereits 2019 war das Exponat Teil der Ausstellung „Künstliche Intelligenz“ auf dem Ausstellungsschiff MS Wissenschaft in vielen deutschen und österreichischen Städten zu sehen.
Kontakt
Prof. Dr. Ralph Ewerth
L3S-Mitglied Ralph Ewerth ist Professor am Institut für Verteilte Systeme – Fachgebiet Wissensbasierte Systeme der Leibniz Universität Hannover und leitet die Forschungsgruppe Visual Analytics der TIB. Er forscht zu visuellen Analyse-, Such- und Präsentationsverfahren.