unsplash.com

Ausgabe 01/2023

Beitrag zur Infektionskontrolle

Big Data gegen Noroviren

Von Noroviren möchte jeder gern verschont bleiben. Sie verursachen Magen-Darm-Infekte (Gastroenteritis) mit starken Durchfällen und heftigem Erbrechen. Da die Erkrankten hoch ansteckend sind, breitet sich der Erreger in Gemeinschaftseinrichtungen wie Altenheimen, Krankenhäusern, Kindergärten und Schulen besonders schnell aus. Gegen Noroviren gibt es bislang weder eine Impfung noch Medikamente. Umso wichtiger ist es, insbesondere schwere Verläufe besser behandeln zu können und Ausbrüche ganz zu vermeiden.

Im Projekt Paving the way towards personalized prevention and care of severe Norovirus gastroenteritis, kurz PRESENt, betreiben Wissenschaftler der Tierärztlichen Hochschule Hannover, der Medizinischen Hochschule Hannover, des Helmholtz-Zentrums für Infektionsforschung und des L3S seit Anfang 2020 klinische, biologische und Big-Data-Forschung mit dem Ziel, die Norovirus-Gastroenteritis besser zu verstehen und somit zur Infektionskontrolle beizutragen.

Um schwere Infekte und mögliche Interventionspunkte vorherzusagen, entwickelt das Team des L3S Ansätze für maschinelles Lernen aus biologischen Daten. Die Wissenschaftler standen dabei vor einigen Herausforderungen: So reichten die vorliegenden Daten für das Training nicht aus und waren noch dazu verrauscht, also ungenau. Da die Daten aber aus verschiedenen Arten biologischer Informationsquellen stammten, konnten die Forscher den Mangel an einzelnen Datentypen ausgleichen, indem sie unterschiedliche Daten effektiv kombinierten. Sie stellten die Hypothese auf, dass kein Datentyp allein in der Lage sein würde, die Komplexität der Krankheit vollständig aufzudecken. Gemeinsames Lernen aus heterogenen Daten würde also fehlende oder unzuverlässige Informationen in jedem Datentyp kompensieren.

In einem Fall nutzen die Wissenschaftler mehrere Quellen biologischer Informationen über menschliche und virale Proteine, um deren Interaktionsmuster zu untersuchen und vorherzusagen. Das Verständnis der Interaktion spielt eine entscheidende Rolle bei der Aufdeckung des zugrundeliegenden Mechanismus der Virusinfektion und könnte helfen, Viruserkrankungen vorzubeugen und zu behandeln. Die Vorhersage ist jedoch schwierig, da nur wenige Daten über Interaktionen zwischen Viren und Menschen vorliegen und die meisten Viren schnell mutieren.

Für das Problem der kleinen Trainingsdatensätze haben die Forscher bereits eine Lösung gefunden: Sie haben einen Multitasking-Transfer-Lernansatz entwickelt, der die Informationen von rund 24 Millionen Proteinsequenzen und die Interaktionsmuster zwischen menschlichen Proteinen in einer Zelle nutzt.

Vorgestellte Projekte

PRESENt project

Kontakt

Thi Ngan Dong

Thi Ngan Dong ist Doktorandin im PRESENt-Projekt. Ihre aktuelle Forschung konzentriert sich auf Netzwerkanalyse, Merkmalsauswahl, graphenbasiertes Repräsentationslernen und gemeinsame Lernmodelle aus heterogenen Informationsquellen.