Teilprojekt eines Verbundes

Maschinelles Lernen für die Identifizierung von Symptomen und Risikofaktoren auf der Grundlage von Krankenversicherungsdaten

Förderkennzeichen: 01EQ2409E
Fördersumme: 138.350 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Marvin Wright
Adresse: Leibniz-Institut für Präventionsforschung und Epidemiologie, BIPS GmbH
Achterstr. 30
28359 Bremen

Das Verbundvorhaben RESOLVE-PCC zielt darauf ab, die Langzeitfolgen von COVID-19 besser zu verstehen und die Grundlage für maßgeschneiderte Interventionsstrategien zu entwickeln. Dieses Vorhaben hat zum Ziel, interpretierbare maschinelle Lernverfahren (IML) für die Identifizierung von Symptomen und Risikofaktoren einzusetzen, die mit dem Long-/Post-COVID-Syndrom (PCS) in Verbindung stehen. Bei diesem Ansatz wird die einzigartige Kombination aus umfangreichen epidemiologischen Basisdaten, SARS-CoV-2-bezogenen Fragebögen und Daten von Krankenversicherungen genutzt, d. h. Daten zu Gesundheitsleistungen, die in der deutschen Nationalen Kohorte (NAKO) verfügbar sind. Zur Identifizierung von Symptomen, die auf SARS-CoV-2-Infektionen zurückzuführen sind, wird zunächst das Paradigma des überwachten Lernens umgekehrt und der SARS-CoV-2-Infektionsstatus auf der Grundlage vorherrschender PCS-Symptome prädiziert, um Assoziationen mit Hilfe von IML-Methoden zu finden. Zweitens werden zur Identifizierung von Risikofaktoren IML-Methoden auf der Grundlage von bedingten Verteilungen verwendet, die eine Confounder-Adjustierung ermöglichen. Für beide Ziele sollen sogenannte modellagnostische Methoden verwendet werden, die nicht auf bestimmte Modellklassen beschränkt sind, sondern für alle Arten von maschinellen Lernmodellen funktionieren. Daher kann diese Technik auch zur Unterstützung anderer Partner des RESOLVE-PCC-Konsortiums eingesetzt werden.