Förderkennzeichen: | 01KD25029 |
Fördersumme: | 49.992 EUR |
Förderzeitraum: | 2025 - 2026 |
Projektleitung: | Dr. Stefan Lenz |
Adresse: |
Universitätsmedizin der Johannes Gutenberg-Universität Mainz, Institut für Medizinische Biometrie, Epidemiologie und Informatik Rhabanusstraße 3 - Bonifazius-Turm A 55118 Mainz |
Die strukturierte Dokumentation onkologischer Therapieverläufe ist für Forschung und Versorgung von zentraler Bedeutung, erfordert jedoch bislang einen hohen manuellen Aufwand. Mit der zunehmenden Leistungsfähigkeit großer Sprachmodelle (engl.: Large Language Models, LLMs) eröffnen sich neue Möglichkeiten zur Automatisierung dieser Aufgabe. Vor diesem Hintergrund verfolgt das Vorhaben das Ziel, aktuelle Verfahren der künstlichen Intelligenz zur automatisierten Strukturierung von Informationen aus klinischen Freitexten zu Therapieverläufen von Tumorpatienten zu erproben und insbesondere die Möglichkeiten von großen Sprachmodellen in diesem Bereich systematisch zu untersuchen. Das Vorhaben baut auf einem bereits annotierten Textkorpus von Dokumenten aus der klinischen Routinebehandlung von urologischen Patientinnen und Patienten auf. Der Fokus wird dabei auf die Erkennung von relevanten Tumorbehandlungen und deren Zuordnung zu einer Tumorerkrankung gelegt. Die im Datensatz enthaltenen Annotationen von klinischen Experten ermöglichen eine quantitative Analyse der Leistungsfähigkeit von LLMs in diesem Anwendungsbereich. Die Ergebnisse dieser Evaluation sollen aufzeigen, inwieweit aktuelle, frei verfügbare LLMs in Kombination mit etablierten Verfahren wie Prompting (textuelle Anweisungen an die Modelle) und Fine-Tuning (Anpassung der Modellgewichte mittels weiterer Daten) perspektivisch zur automatisierten Tumordokumentation eingesetzt werden können. Die entwickelte Evaluierungspipeline wird unter einer Open-Source-Lizenz veröffentlicht. Es wird ebenfalls angestrebt, mit den Daten trainierte Modelle öffentlich zugänglich zu machen, soweit sich dies in Anbetracht des Datenschutzes vertreten lässt. Dazu sind Prüfungen zur Datenschutzkonformität geplant, die bereits beim Fine-Tuning der Modelle eingeplant werden.