L3S Bestes Papier des Quartals (Q2/2024)
Kategorie: NLP
Ein vertrauenswürdiger Ansatz zur Klassifizierung und Analyse von epidemiebezogenen Informationen aus Microblogs
Autoren: Thi Huyen Nguyen, Marco Fisichella, Koustav Rudra
Veröffentlicht in IEEE Transactions on Computational Social Systems
https://ieeexplore.ieee.org/abstract/document/10530086
Das Papier in Kürze:
Wir stellen einen vertrauenswürdigen Ansatz für die Klassifizierung von Tweets während eines Krankheitsausbruchs. Unsere Methode kann Tweets aus verschiedenen entscheidenden Klassen wie Anzeichen und Symptome, Übertragung, Präventionsmaßnahmen usw. effizient identifizieren und gleichzeitig Erklärungen für die Ausgabeentscheidungen extrahieren. Außerdem schlagen wir ein einfaches graphbasiertes Rankingverfahren vor, um kurze Zusammenfassungen von Tweets zu erstellen.
Welche potenziellen Auswirkungen haben Ihre Ergebnisse?
Die zeitkritische Analyse krisenbezogener Informationen hilft humanitären Organisationen und Regierungsstellen dabei, verwertbare Informationen zu erhalten und eine situationsgerechte Reaktion zu planen. Unsere Arbeit zielt darauf ab, betroffene Gemeinschaften und Interessengruppen dabei zu unterstützen, schnelle und wichtige Updates zu erhalten, ohne von der Masse an Inhalten, die während Epidemien in sozialen Medien gepostet werden, überwältigt zu werden. Durch die Integration der Interpretierbarkeit kann unsere Studie den Endnutzern helfen, die Entscheidungen von ML-Modellen für reale Anwendungen zu verstehen und ihr Vertrauen in diese zu stärken.
Was ist neu an Ihrer Forschung?
Im Gegensatz zu den meisten früheren Arbeiten zur Klassifizierung von Tweets im Zusammenhang mit Epidemien, die sich lediglich auf die Modellleistung, nicht aber auf die Transparenz des Modells konzentrieren, ist unser Modell von vornherein interpretierbar. Der vorgeschlagene Klassifikator verbessert sowohl die Genauigkeit als auch die Erklärbarkeit der Klassifizierung. Außerdem ist unser graphenbasiertes Modell einfach, aber effizient, um prägnante Situations-Updates von Tweets aus verschiedenen Klassen während einer Epidemie zu generieren.