Teilprojekt eines Verbundes

Datengenerierung, Bereinigung und Kuratierung

Förderkennzeichen: 01EQ2406D
Fördersumme: 154.810 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Peter Heuschmann
Adresse: Universitätsklinikum Würzburg, Institut für medizinische Datenwissenschaften (ImDS)
Josef-Schneider-Str. 2
97080 Würzburg

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.