Bild-Datensätze für KI in der Medizin künstlich erzeugen: Fraunhofer HHI ist Teil des Verbundprojekts SyReal

10. Januar 2022

Im Verbundprojekt SyReal (Synthetisierung von realistischen Daten für anwendbare Künstliche Intelligenz in der Medizin) arbeitet das Fraunhofer Heinrich-Hertz-Institut (HHI) daran, realistische medizinische Bilddaten künstlich zu erzeugen. Dafür benutzt das Projektteam physikalische Simulationen sowie generative KI-Algorithmen, die in der Lage sind, Bildmerkmale zu lernen und realistisch nachzubilden. Mit einem auf diese Weise künstlich erzeugten Bild-Datensatz wird es ermöglicht, robuste KI-Algorithmen für medizinische Anwendungen zu trainieren und zu validieren. SyReal hat seine Arbeit im September 2021 begonnen und läuft noch bis August 2023. Das Projekt wird mit 1,5 Millionen Euro vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.

KI-basierte Anwendungen können das Gesundheitssystem deutlich entlasten, indem sie medizinische Arbeitsabläufe erleichtern und effizienter gestalten. Um KI-Anwendungen verstärkt in die medizinische Praxis zu bringen, benötigt man umfangreiche, qualitativ hochwertige Bild-Datensätze. Solche Datensätze bilden das Herzstück der KI. Mit ihnen werden die Algorithmen trainiert und anschließend mit Methoden der erklärbaren KI (XAI) validiert.

Diese künstlichen Bild-Datensätze zu erstellen, ist eine große Herausforderung für den Einsatz von KI im Gesundheitswesen. Forschende erhalten oft keinen Zugang zu medizinischen Daten, weil diese sensitive persönliche Informationen enthalten. Werden die Daten doch weitergegeben, ist es häufig schwierig deren Ursprung sowie Meta-Daten zu bestimmen.

Das SyReal-Team will dieses Problem lösen, indem es eine Methode zur künstlichen Bilderzeugung von medizinischen Bild-Datensätzen entwickelt. Die Forschenden arbeiten zunächst mit Bilddaten aus der Histologie (Feingewebeuntersuchungen, bspw. zur Tumorerkennung) und aus Magnetresonanz (MRT)-Scans. Das Team hat diese zwei Bereiche ausgewählt, weil der Einsatz von KI-Technologien hier bereits gut erforscht und zugleich sehr erfolgsversprechend ist. Die verwendeten Methoden können im Anschluss an das Projekt auf weitere medizinische Bilddatentypen (z.B. Röntgenbildgebung oder Computertomographie) ausgeweitet werden.

Für die Bilderzeugung benutzt das Projektteam physikalische Simulationen sowie generativen KI-Algorithmen, welche bestimmte Bildmerkmale anlernen und anschließend synthetisch nachbilden können.

Die Abteilung „Künstliche Intelligenz“ am Fraunhofer HHI bringt ihre Expertise beim Trainieren, Evaluieren und Implementieren von Deep-Learning-Algorithmen in das Projekt ein. Dabei legen die Forschenden ein besonderes Augenmerk auf das kontinuierliche Testen und Evaluieren der eingesetzten Algorithmen. Das Team verwendet dafür die am Fraunhofer HHI entwickelten XAI-Methoden.

Nach Ende des Projekts stellt das SyReal-Konsortium die erzeugten Daten für andere Forschungs- und Entwicklungs-Vorhaben kostenfrei bereit, um den Ausbau von anwendbarer KI weiter voranzutreiben.

Das Projektkonsortium besteht neben dem Fraunhofer HHI aus dem Hasso-Plattner-Institut für Digital Engineering, dem Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft, dem Pathologischen Institut der Ludwig-Maximilians-Universität München sowie den Industriepartnern Aignostics, Imfusion und Dotphoton.