Bahnbrechende Technologie für die biomedizinische Bildgebung
Einen Meilenstein in der biomedizinischen Forschung erreichten nun Wissenschaftlerinnen und Wissenschaftler um Professor Fabian Kießling vom Institut für Experimentelle Molekulare Bildgebung der RWTH und Fraunhofer MEVIS und Dr. Johannes Lotz vom Fraunhofer MEVIS. Gemeinsam mit anderen Forschenden der RWTH, der Universität Regensburg und der Hannover Medical School entwickelten sie UMedPT, ein wichtiges Grundlegendes Modell für die biomedizinische Bildgebung. Seine Arbeit veröffentlichte das Team unter dem Titel „Overcoming data scarcity in biomedical imaging with a foundational multi-task model“ in Nature Computational Science.
Das Vortraining mit Vorläufermodellen, wie es auch in ChatGPT angewandt wird, kann die erforderliche Menge an Trainingsdaten durch Wiederverwendung von Wissen reduzieren. Jedoch müssen Grundlegende Modelle auf großen, umfassenden Datensätzen trainiert werden, die im biomedizinischen Bereich oft nicht verfügbar sind. Um dieses Hindernis zu überwinden, haben die Forschenden UMedPT entwickelt und anhand von Röntgenbildern sowie mikroskopischen und tomografischen Bildern umfassend validiert. UMedPT basiert auf einem eigens dafür entworfenen, neuartigen Multitasking-Lernalgorithmus, der auf einer vielfältig beschrifteten Sammlung kleiner bis mittelgroßer biomedizinischer Bildgebungsdatensätze trainiert werden kann.
„Unsere Ergebnisse zeigen, dass ein einzelnes Netzwerk klare Vorteile gegenüber dem Stand der Technik haben kann“, sagt Professor Fabian Kießling, MItglied von JARA-BRAIN. „Im internationalen Wettbewerb SemiCOL übertraf UMedPT alle anderen Methoden bei der Klassifizierung von Darmkrebs“, so Kießling weiter. UMedPT übertraf ImageNet-vortrainierte Modelle und die besten veröffentlichten Referenzergebnisse mit nur einem Prozent der ursprünglichen Trainingsdaten für Aufgaben mit verwandten Daten in der Vortrainingsdatenbank. Selbst bei Aufgaben ohne verwandte Daten in der Pretraining-Datenbank übertraf UMedPT die Leistung von ImageNet-vortrainierten Modellen und die besten dokumentierten Ergebnisse auf diesem Gebiet mit 50 Prozent der ursprünglichen Trainingsdaten oder weniger.
Diese Fortschritte zeigten, dass UMedPT erhebliche Vorteile für Anwendungen biete, bei denen die Verfügbarkeit von Stichprobendaten begrenzt sei – ein häufiges Problem in der biomedizinischen Forschung, insbesondere bei seltenen Krankheiten, erklärt Kießling.
Originalpublikation:
Schafer R., Nicke T., Hoefener H., Lange A., Merhof D., Feuerhake F., Schulz V., Lotz J., Kiessling F. Overcoming Data Scarcity in Biomedical Imaging with a Foundational Multi-Task Model. Nat Comput Sci, 2024
DOI: 10.1038/s43588-024-00662-z