L3S Best Publication of the Quarter (Q3/2024)
Kategorie: Information Retrieval and Language Model
LaMMOn: language model combined graph neural network for multi-target multi-camera tracking in online scenarios
Authors: Tuan T Nguyen, Hoang H Nguyen, Mina Sartipi, Marco Fisichella
Veröffentlicht im Machine Learning Journal
Das Papier in Kürze:
Wir haben LaMMOn entwickelt, ein KI-System, das Fahrzeuge in Echtzeit über mehrere städtische Kameras verfolgt. Im Gegensatz zu bisherigen Systemen nutzt LaMMOn fortschrittliche sprach- und graphbasierte KI-Techniken, um sich automatisch und ohne manuelle Einstellungen an verschiedene Szenarien anzupassen. Es übertrifft bestehende Methoden in mehreren öffentlichen Datensätzen und lässt sich leicht auf große Stadtgebiete übertragen. Diese Technologie könnte das Verkehrsmanagement und die Stadtplanung revolutionieren, indem sie genauere und umfassendere Daten zur Fahrzeugverfolgung liefert.
Welches Problem lösen Sie mit Ihrer Forschung?
Unsere Forschung beschäftigt sich damit, den Stadtverkehr über mehrere Kameras hinweg effizient zu verfolgen und zu steuern. Mit LaMMOn ist es nicht mehr notwendig, jede neue Kamera manuell einzurichten. Das macht den großflächigen Einsatz wesentlich einfacher. Städte können damit den Verkehrsfluss besser steuern, die Reaktionszeiten bei Notfällen verbessern und datenbasierte Entscheidungen für die Stadtplanung und Umweltinitiativen treffen.
Welche potenziellen Auswirkungen haben Ihre Ergebnisse?
LaMMOn könnte das Leben in der Stadt deutlich angenehmer machen, weil dadurch intelligente und effiziente Städte möglich werden. LaMMOn liefert umfassende Echtzeitdaten über stadtweite Verkehrsmuster. Damit lässt sich der Verkehr besser steuern, die Stadtplanung effizienter gestalten und Notfallhilfe schneller organisieren. Das führt zu weniger Staus, optimierten öffentlichen Verkehrsmitteln und geringeren Fahrzeugemissionen. Das System kann sich anpassen, sodass sich eine fortschrittliche Verkehrsüberwachung auch in großem Maßstab kosteneffizient umsetzen lässt. Das macht die Stadt lebenswerter.
Was ist neu an Ihrer Forschung?
Wir haben einen neuen Ansatz entwickelt, mit dem man mehrere Ziele mit mehreren Kameras verfolgen kann. LaMMOn ist eine ganz neue Kombination aus Sprachmodellen, grafischen neuronalen Netzen und föderierten Lerntechniken. Es passt sich an neue Kamerakonstellationen an, ohne dass manuell Regeln festgelegt werden müssen. Es nutzt synthetische Daten, um die Beschränkungen von Datensätzen zu überwinden, und es bewahrt die Privatsphäre durch föderiertes Lernen. Dieser innovative Ansatz ist ein großer Schritt nach vorne in Sachen Smart-City-Technologie und bietet eine skalierbare, effiziente und datenschutzfreundliche Lösung für die Fahrzeugverfolgung in Städten.
Link zum Papier: link.springer.com/article/10.1007/s10994-024-06592-1