Verbund

NAPCODE - Zusammenführung eines Nationalen Post-COVID-Datensatzes aus bestehenden Studiendaten

Als Folge einer SARS-CoV-2-Infektion treten bei einem Teil der Betroffenen gesundheitliche Beschwerden auf, die noch Wochen oder Monate nach der akuten Infektion andauern können. Es gibt eine Vielzahl an unterschiedlichen Symptomen, die einzeln oder in Kombination vorkommen. Dabei werden Symptome, die länger als vier Wochen nach der akuten Infektion weiterhin bestehen, als Long-COVID bezeichnet. Bei dem Post-COVID-Syndrom handelt es sich um Symptome, die später als zwölf Wochen (wieder) auftreten und nicht anderweitig erklärt werden können. Die Ursachen sowie wirksame Behandlungs- und Versorgungskonzepte sind bislang nicht ausreichend erforscht. Zudem ist die Diagnose von Long/Post-COVID herausfordernd, da eine Abgrenzung gegenüber anderen Erkrankungen oftmals schwierig ist.

Daher sollen nun forschungsrelevante Informationen aus der klinisch-epidemiologischen und biomedizinischen Forschung zu Long-/Post-COVID mittels innovativer Verfahren der Datenanalyse aus bereits vorhandenen Datensätzen gefiltert und verwendet werden. In Verbindung mit Versorgungsdaten von Long-/Post-COVID-Patientinnen und -Patienten sollen die Erkenntnisse zur Entwicklung besserer Behandlungs- und Versorgungskonzepte beitragen.

Der Verbund NAPCODE verfolgt das Ziel, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zur Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. Dazu werden ein umfangreicher Datensatz mit relevanten Variablen zur Post-COVID-Forschung für Forschende sowie die Erarbeitung relevanter Variablen für eine umfassende Post-COVID-Condition-Forschung erstellt. Ergänzend dazu werden pseudonymisierte, anonymisierte und synthetisierte Datensätze basierend auf identifizierten Variablen aus verfügbaren Studiendaten zusammengestellt.

Teilprojekte

Governance und Koordination

Förderkennzeichen: 01EQ2406A
Gesamte Fördersumme: 208.562 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Dr. Ramsia Geisler
Adresse: Johann Wolfgang Goethe-Universität Frankfurt am Main, FB 16 Medizin und Klinikum, Institut für digitale Medizin und Klinische Datenwissenschaften
Theodor-Stern-Kai 7
60596 Frankfurt am Main

Governance und Koordination

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.

Erarbeitung der Datensatzvarianten

Förderkennzeichen: 01EQ2406B
Gesamte Fördersumme: 383.905 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Sylvia Thun
Adresse: Berliner Institut für Gesundheitsforschung in der Charité, Translationsforschungsbereich der Charité, Universitätsmedizin Charité
Anna-Louisa-Karsch-Str. 2
10178 Berlin

Erarbeitung der Datensatzvarianten

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.

Patienteninterviews und Variablensatzerstellung

Förderkennzeichen: 01EQ2406C
Gesamte Fördersumme: 52.145 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: PD Dr. Christina Lemhöfer
Adresse: Universitätsklinikum Jena, Institut für Physikalische und Rehabilitative Medizin
Am Klinikum 1
07747 Jena

Patienteninterviews und Variablensatzerstellung

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.

Datengenerierung, Bereinigung und Kuratierung

Förderkennzeichen: 01EQ2406D
Gesamte Fördersumme: 154.810 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Peter Heuschmann
Adresse: Universitätsklinikum Würzburg, Institut für medizinische Datenwissenschaften (ImDS)
Josef-Schneider-Str. 2
97080 Würzburg

Datengenerierung, Bereinigung und Kuratierung

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.

Erstellung des open-access-Forschungsdatensatzes

Förderkennzeichen: 01EQ2406E
Gesamte Fördersumme: 79.985 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Christoph Dieterich
Adresse: Universität Heidelberg, Medizinische Fakultät und Universitätsklinikum Heidelberg, Innere Medizin III, Kardiologie, Angiologie und Pneumologie, Klaus Tschira Institute für Computerkardiologie
Im Neuenheimer Feld 669
69120 Heidelberg

Erstellung des open-access-Forschungsdatensatzes

Während der COVID-19-Pandemie wurden umfangreiche Daten gesammelt, jedoch variieren diese in Größe, Bezug auf Patientengruppen, Zeitpunkte und Fragestellungen. Um die Ressourcen dieser bisherigen COVID-19-Forschung gezielt für die Forschung zum Post-COVID-Zustand (PCC) zu nutzen, soll ein auf die aktuellen Bedürfnisse der Forschung zum PCC zugeschnittener Datensatz aus den bestehenden Daten der COVID-19-Forschung zusammengestellt werden. Das Ziel ist es, Forschenden einen möglichst umfangreichen Datensatz mit relevanten Variablen zur Post-COVID-Forschung zu Verfügung zu stellen, um Forschungsergebnisse zu beschleunigen. In einem ersten Schritt wird eine detaillierte Literaturrecherche durchgeführt, um in Zusammenarbeit mit Expertinnen, Experten und Betroffenen relevante Variablen für eine umfassende PCC-Forschung zu identifizieren. Anschließend wird ein pseudonymisierten Datensatz basierend auf den identifizierten Variablen aus verfügbaren Studiendaten erstellt. Zunächst werden hierfür die Daten des Nationalen Pandemie-Kohorten-Netzes (NAPKON), einer deutschlandweiten Kohortenstudie mit drei verschiedenen Studienpopulationen verwendet. Diese bietet eine optimale Grundlage für die erste Version des neuen Post-COVID-Datensatzes. Da dieser Datensatz aus Datenschutzgründen von Forschenden über ein Use- and Access-Verfahren beantragt werden muss, werden zwei weitere Varianten entwickelt, die öffentlich verfügbar gemacht werden können: eine anonymisierte Variante und eine synthetische Variante.