Mit vertrauenswürdigen Mitteln: Analysieren und Klassifizieren pandemiebezogener Daten

L3S Bestes Papier des Quartals (Q2/2024)
Kategorie: NLP

A Trustworthy Approach to Classify and Analyze Epidemic-Related Information From Microblogs

Autoren: Thi Huyen Nguyen, Marco Fisichella, Koustav Rudra

Veröffentlicht in IEEE Transactions on Computational Social Systems
https://ieeexplore.ieee.org/abstract/document/10530086

Das Papier in Kürze:

Wir stellen einen vertrauenswürdigen Ansatz für die Klassifizierung von Tweets während eines Krankheitsausbruchs. Unsere Methode kann Tweets aus verschiedenen entscheidenden Klassen wie Anzeichen und Symptome, Übertragung, Präventionsmaßnahmen usw. effizient identifizieren und gleichzeitig Erklärungen für die Ausgabeentscheidungen extrahieren. Außerdem schlagen wir ein einfaches graphbasiertes Rankingverfahren vor, um kurze Zusammenfassungen von Tweets zu erstellen.

Welche Auswirkungen könnten Ihre Erkenntnisse haben?

Die zeitkritische Analyse krisenbezogener Informationen hilft humanitären Organisationen und Regierungsstellen dabei, verwertbare Informationen zu erhalten und eine situationsgerechte Reaktion zu planen. Unsere Arbeit zielt darauf ab, betroffene Gemeinschaften und Interessengruppen dabei zu unterstützen, schnelle und wichtige Updates zu erhalten, ohne von der Masse an Inhalten, die während Epidemien in sozialen Medien gepostet werden, überwältigt zu werden. Durch die Integration der Interpretierbarkeit kann unsere Studie den Endnutzern helfen, die Entscheidungen von ML-Modellen für reale Anwendungen zu verstehen und ihr Vertrauen in diese zu stärken.

Was ist neu an Ihrer Forschung?

Im Gegensatz zu den meisten früheren Arbeiten zur Klassifizierung von Tweets im Zusammenhang mit Epidemien, die sich lediglich auf die Modellleistung, nicht aber auf die Transparenz des Modells konzentrieren, ist unser Modell von vornherein interpretierbar. Der vorgeschlagene Klassifikator verbessert sowohl die Genauigkeit als auch die Erklärbarkeit der Klassifizierung. Außerdem ist unser graphenbasiertes Modell einfach, aber effizient, um prägnante Situations-Updates von Tweets aus verschiedenen Klassen während einer Epidemie zu generieren.