Verbund

FDLP2 - Föderiertes Lernen in der Lymphompathologie: Selbst-supervidierte Lernalgorithmen und Erstellung eines qualitätsgesicherten Referenzdatensatzes

In der modernen Krebsforschung fallen immer umfangreichere Datensätze an (Big Data). Die Daten stammen unter anderem aus molekularen und biochemischen Analysen, Bildgebungsverfahren, klinischen Studien. Teilweise bilden diese Daten auch Krankheitsverläufe von Patientinnen und Patienten ab. Neue computergestützte Ansätze der Datennutzung, modernste Methoden der Künstlichen Intelligenz bzw. des Maschinellen Lernens bergen ein großes Potenzial bei der Analyse und Extraktion solcher forschungsrelevanten Informationen.

Mit dieser Förderrichtlinie im Rahmen der Nationalen Dekade gegen Krebs beabsichtigt das BMBF, Forschungsgruppen aus dem Bereich der Datenanalyse einen niederschwelligen Zugang zu hochqualitativen Daten aus der translationalen biomedizinischen Krebsforschung und der onkologischen Routineversorgung zu ermöglichen. Zeitgleich arbeiten Forschende aus den Bereichen der Datengewinnung und Datenanalyse eng zusammen, um klinisch relevante onkologische Fragen anzugehen. Darüber hinaus soll die Kultur des Datenteilens für Forschungszwecke gefördert werden.

Im Forschungsverbund FDLP2 soll die Diagnose bei Lymphknoten-Krebs durch Künstliche Intelligenz (KI) optimiert werden. Dafür sollen diagnostisch gewonnene Lymph-Gewebeproben von Erkrankten mittels KI so aufbereitet werden, dass sie besser mit anderen kranken Lymph-Gewebeabschnitten der gleichen Person und auch anderer Personen vergleichbar sind. Die Ergebnisse sollen klinisch nachvollziehbar dargestellt werden und geben so wichtige Hinweise für eine verbesserte, weil gezieltere Behandlung dieser Krebsart.

Teilprojekte

Universität Göttingen

Förderkennzeichen: 01KD2415A
Gesamte Fördersumme: 335.810 EUR
Förderzeitraum: 2025 - 2027
Projektleitung: Prof. Dr. Michael Altenbuchinger
Adresse: Georg-August-Universität Göttingen, Universitätsmedizin Göttingen, Institut für Medizinische Bioinformatik
Goldschmidtstr. 1
37077 Göttingen

Universität Göttingen

Methoden der künstlichen Intelligenz (KI) übernehmen zunehmend Aufgaben der medizinischen Diagnostik und versprechen vielfältige Anwendungen im Bereich der Lymphomdiagnostik. Voraussetzung sind jedoch umfassende Daten zur Modellentwicklung, wie sie auch in diesem Verbund generiert werden sollen. Die Nutzung sicherheitssensibler medizinischer Daten stellt einen komplexen Vorgang dar, der konform mit den regulativen Rahmenbedingungen erfolgen muss. Sogenannte föderierte Lernmethoden versprechen hierbei Abhilfe, indem sicherheitssensible Daten nicht mehr zwischen Standorten geteilt werden, sondern nurmehr Modellparameter übermittelt werden. Dieser Vorgang muss so erfolgen, dass keine persönlichen Daten rekonstruiert werden können. In den Laboren wird bereits eine Infrastruktur für föderiertes Lernen etabliert und eine gemeinsame Gewebeanalyse-Software optimiert. In diesem Projekt liegt der Fokus auf Representation Learning. Es wird eine federated Learning-Infrastruktur genutzt, um KI-Repräsentationen von Gewebeabschnitten zu entwickeln, die die Gewebearchitektur und ihre Kontextnuancen ‘verstehen’. Dafür werden am Standort Göttingen die sogenannten maskierten Autoencoder weiterentwickelt, so dass diese auch in föderierten Lernszenarien im Rahmen der Lymphomdiagnostik zum Einsatz kommen können. Weiter sollen die zu entwickelnden Representation Learning-Ansätze genutzt werden um die KI-unterstützte Diagnose um seltene Lymphomentitäten zu erweitern. Da seltene Erkrankungsentitäten üblicherweise unzureichend durch Daten abgedeckt werden können, sind hoch-optimierte Modell-Repräsentation und die Nutzung verteilter Daten entscheidend. In diesem Subprojekt werden die entsprechenden algorithmischen Grundlagen entwickelt.

Universität Würzburg

Förderkennzeichen: 01KD2415B
Gesamte Fördersumme: 294.408 EUR
Förderzeitraum: 2025 - 2027
Projektleitung: Prof. Dr. Rainer Spang
Adresse: Universität Regensburg, Institut für Funktionelle Genomik, Lehrstuhl für statistische Bioinformatik
Am BioPark 9
93053 Regensburg

Universität Würzburg

Representation Learning ist ein neuer und äußerst effizienter Ansatz, um föderiertes Lernen in der Bildklassifikation und Bildannotation anzuwenden. Es hat auch großes Potenzial für die Differenzialdiagnose und Diagnoseunterstützung in der digitalen Pathologie. Als Teil des FDLP2 Konsortiums mit Partnern aus Göttingen, Kiel, Stuttgart und Würzburg ist das Vorhaben in Regensburg auf die Entwicklung einer speziellen Metrik und die Anwendung von XAI (eXplainable AI) fokussiert. Gemeinsam wird die selbstentwickelte föderierte Lerninfrastruktur pamly genutzt, um KI-Repräsentationen von Gewebeabschnitten zu entwickeln, die die Gewebearchitektur und ihre Kontextnuancen verstehen. In Regensburg wird insbesondere eine Metrik entwickelt, die die Ähnlichkeit von Gewebearchitekturen quantifiziert. Ziel ist es, die digitale Lymphom-Pathologie in drei Schlüsselbereichen voranzubringen: 1) Bereitstellung eines standardisierten, qualitätsgesicherten KI-Trainingssets von Referenz-Gewebeabschnitten mit flexiblen Repräsentationen für die KI-gestützte digitale Pathologie; 2) Erweiterung der KI-unterstützten Diagnose um seltene Lymphomentitäten und 3) Entwicklung von XAI-Anwendungen, die nicht nur Annotationsmöglichkeiten bieten, sondern auch den untersuchten Gewebeschnitt im Kontext ähnlicher, bereits diagnostizierter Gewebe aus der Referenzdatenbank erklären. Der Schwerpunkt auf die Entwicklung von XAI-Anwendungen wird dabei besonders in Regensburg gesetzt.

Robert Bosch Gesellschaft Stuttgart

Förderkennzeichen: 01KD2415C
Gesamte Fördersumme: 32.040 EUR
Förderzeitraum: 2025 - 2027
Projektleitung: Prof. Dr. German Ott
Adresse: Robert Bosch Gesellschaft für medizinische Forschung mbH, Dr. Margarete Fischer-Bosch-Institut für Klinische Pharmakologie
Auerbachstr. 112
70376 Stuttgart

Robert Bosch Gesellschaft Stuttgart

Lymphome sind eine komplexe Krebsart mit unterschiedlichen Entitäten, deren Identifizierung für eine optimale Behandlung essentiell ist. Die exakte pathologische Klassifikation ist jedoch oftmals eine Herausforderung. Es wurden zwei der weltweit umfangreichsten Datensätze kuratiert – einer für molekulare (OMICS) Daten und einer für hochauflösende Bilder. Darauf aufbauend hat die Forschungsarbeit des Vorhabens die aktuelle molekulare Klassifikation von Lymphomen entscheidend mitgeprägt. In dem Vorhaben ist bereits eine Infrastruktur für föderiertes Lernen etabliert und es wird eine gemeinsame Gewebeanalyse-Software optimiert. In diesem Projekt liegt der Fokus auf Representation Learning, wobei die federated Learning-Infrastruktur genutzt werden soll, um KI-Repräsentationen von Gewebeabschnitten zu entwickeln, die die Gewebearchitektur und ihre Kontextnuancen 'verstehen'. Der Standort Stuttgart wird hierbei zusammen mit den Pathologielaboren in Kiel und Würzburg ein standardisiertes, qualitätsgesichertes KI-Trainingsset von Referenz-Gewebeabschnitten mit flexiblen Repräsentationen für KI-gestützte digitale Pathologie bereitstellen.

Universität Würzburg

Förderkennzeichen: 01KD2415D
Gesamte Fördersumme: 38.292 EUR
Förderzeitraum: 2025 - 2027
Projektleitung: Prof. Dr. Andreas Rosenwald
Adresse: Julius-Maximilians-Universität Würzburg, Medizinische Fakultät, Pathologisches Institut
Josef-Schneider-Str. 2
97080 Würzburg

Universität Würzburg

Lymphome sind eine komplexe Krebsart mit unterschiedlichen Entitäten, deren Identifizierung für eine optimale Behandlung essentiell ist. Die exakte pathologische Klassifikation ist jedoch oftmals eine Herausforderung. Es wurden zwei der weltweit umfangreichsten Datensätze kuratiert – einer für molekulare (OMICS) Daten und einer für hochauflösende Bilder. Darauf aufbauend hat die Forschungsarbeit des Vorhabens die aktuelle molekulare Klassifikation von Lymphomen entscheidend mitgeprägt. In dem Vorhaben ist bereits eine Infrastruktur für föderiertes Lernen etabliert und es wird eine gemeinsame Gewebeanalyse-Software optimiert. In diesem Projekt liegt der Fokus auf Representation Learning, wobei die federated Learning-Infrastruktur genutzt werden soll, um KI-Repräsentationen von Gewebeabschnitten zu entwickeln, die die Gewebearchitektur und ihre Kontextnuancen 'verstehen'. Der Standort Würzburg wird hierbei zusammen mit den Pathologielaboren in Kiel und Würzburg ein standardisiertes, qualitätsgesichertes KI-Trainingsset von Referenz-Gewebeabschnitten mit flexiblen Repräsentationen für KI-gestützte digitale Pathologie bereitstellen.

Universität Kiel

Förderkennzeichen: 01KD2415E
Gesamte Fördersumme: 171.760 EUR
Förderzeitraum: 2025 - 2027
Projektleitung: Prof. Dr. Wolfram Klapper
Adresse: Christian-Albrechts-Universität zu Kiel, Universitätsklinikum Schleswig-Holstein, Campus Kiel, Institut für Pathologie, Sektion für Hämatopathologie
Arnold-Heller-Str. 3
24105 Kiel

Universität Kiel

Lymphome sind eine komplexe Krebsart mit unterschiedlichen Entitäten, deren Identifizierung für eine optimale Behandlung essentiell ist. Die exakte pathologische Klassifikation ist jedoch oftmals eine Herausforderung. Es wurden zwei der weltweit umfangreichsten Datensätze kuratiert – einer für molekulare (OMICS) Daten und einer für hochauflösende Bilder. Darauf aufbauend hat die Forschungsarbeit des Vorhabens die aktuelle molekulare Klassifikation von Lymphomen entscheidend mitgeprägt. In dem Vorhaben ist bereits eine Infrastruktur für föderiertes Lernen etabliert und es wird eine gemeinsame Gewebeanalyse-Software optimiert. In diesem Projekt liegt der Fokus auf Representation Learning, wobei die federated Learning-Infrastruktur genutzt werden soll, um KI-Repräsentationen von Gewebeabschnitten zu entwickeln, die die Gewebearchitektur und ihre Kontextnuancen 'verstehen'. Der Standort Kiel wird hierbei zusammen mit den Pathologielaboren in Würzburg und Stuttgart ein standardisiertes, qualitätsgesichertes KI-Trainingsset von Referenz-Gewebeabschnitten mit flexiblen Repräsentationen für KI-gestützte digitale Pathologie bereitstellen. Hierbei wird der Standort Kiel neben der Zusammenstellung der Referenzbilder vieler verschiedener Lymphomgewebe auch dazugehörige Annotationen wie Diagnose, Gewebeart, molekulare Merkmale und klinische Daten (soweit zur Diagnosestellung vorhanden gewesen) dokumentieren und bereitstellen. Für die Ressource von Bilddaten, die der Gemeinschaft zugänglich gemacht werden sollen, wird der Standort Kiel eine Prüfung von Vollständigkeit und technische Eignung der Bilder als technische Endkontrolle für alle Pathologiezentren durchführen.