Verbund

HALTA_Long_COVID - Heterogenitäts- und Störfaktor-adjustierte föderierte latente Übergangsanalyse von Long-COVID/PASC-Daten

Als Folge einer SARS-CoV-2-Infektion treten bei einem Teil der Betroffenen gesundheitliche Beschwerden auf, die noch Wochen oder Monate nach der akuten Infektion andauern können. Es gibt eine Vielzahl an unterschiedlichen Symptomen, die einzeln oder in Kombination vorkommen. Dabei werden Symptome, die länger als vier Wochen nach der akuten Infektion weiterhin bestehen, als Long-COVID bezeichnet. Bei dem Post-COVID-Syndrom handelt es sich um Symptome, die später als zwölf Wochen (wieder) auftreten und nicht anderweitig erklärt werden können. Die Ursachen sowie wirksame Behandlungs- und Versorgungskonzepte sind bislang nicht ausreichend erforscht. Zudem ist die Diagnose von Long-/Post-COVID herausfordernd, da eine Abgrenzung gegenüber anderen Erkrankungen oftmals schwierig ist.

Daher sollen nun forschungsrelevante Informationen aus der klinisch-epidemiologischen und biomedizinischen Forschung zu Long-/Post-COVID mittels innovativer Verfahren der Datenanalyse aus bereits vorhandenen Datensätzen gefiltert und verwendet werden. In Verbindung mit Versorgungsdaten von Long-/Post-COVID-Patientinnen und -Patienten sollen die Erkenntnisse zur Entwicklung besserer Behandlungs- und Versorgungskonzepte beitragen.

Der Verbund HALTA_Long_COVID verfolgt das Ziel, neue föderierte Lernmethoden für die Integration großer nationaler und internationaler Long-/Post-COVID-Syndrom-Datensätze zu entwickeln. So können die Prädiktoren für den schweren Verlauf des Long-/Post-COVID-Syndroms identifiziert und Interventionsstrategien bewertet werden. Weiterhin wird ein fairer, die Datensicherheit wahrender Algorithmus für föderiertes Repräsentationslernen zum besseren Verständnis von Krankheitsmustern in großen Stichproben implementiert.

Teilprojekte

Föderierte Erkennung gemeinsamer Störfaktoren und Repräsentationslernen und Koordination

Förderkennzeichen: 01EQ2404A
Gesamte Fördersumme: 212.700 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Nico Pfeifer
Adresse: Eberhard Karls Universität Tübingen, Mathematisch-Naturwissenschaftliche Fakultät, Fachbereich IV Informatik, Methoden der Medizininformatik
Sand 14
72076 Tübingen

Föderierte Erkennung gemeinsamer Störfaktoren und Repräsentationslernen und Koordination

Mit dem Ende der Pandemie gibt es immer mehr Berichte von Patientinnen und Patienten mit Langzeitkomplikationen von COVID-19. Das Krankheitsbild wird zusammengefasst unter den Namen Post-COVID-Syndrom. Dabei kommt es bei den Betroffenen zu unterschiedlichen meist schwer vorherzusagenden Verläufen. Eine frühzeitige Identifizierung der Risikofaktoren, sowie eine Klassifizierung der Symptomverläufe ist daher essentiell für ein näheres Verständnis der Langzeitfolgen und möglicher Behandlungsstrategien. Mit den teils maßgeblichen Unterschieden der Krankheitsverläufe geht auch eine hohe Komplexität der Daten einher. Um diese Komplexität zu beschreiben und Muster zu erkennen, werden bereits Methoden des sogenannten föderierten Lernens verwendet, bei denen die Analyse an den einzelnen Standorten stattfindet, um den Datenschutz zu verbessern. Nur aggregierte Statistiken werden iterativ an einen zentralen Analysten übermittelt. Jedoch werden bisher beim föderierten Lernen vergleichsweise simple Analysen verwendet, die oft nicht skalierbar sind. Aus diesen Gründen werden im interdisziplinären Projekt HALTA Methoden entwickelt, mit denen sich mit künstlicher Intelligenz die Risikofaktoren betroffener Individuen identifizieren, sowie Krankheitsverläufe vorhersagen lassen. Das ermöglicht die Unterstützung von Entscheidungen zur Behandlung der Patienten. Hierbei wird stets die Verschiedenartigkeit der Krankheitsverläufe beachtet und die Skalierbarkeit auf große Datensätze über die sogenannte amortisierende Inferenz, eine neue Methode im Forschungsbereich der künstlichen Intelligenz, gewährleistet. Um diese Analyse zu ermöglichen, wird die Methode der latenten Klassenanalyse mit kontinuierlicher Zeit für föderierte Datensätze entwickelt und föderiertes "Representation Learning" genutzt, um ähnliche Muster im Krankheitsverlauf und Patientengruppen zu erkennen. Für die Analyse werden bereits bestehende (inter-)nationale Datensätze verwendet.

Vergleichbare Datenharmonisierung

Förderkennzeichen: 01EQ2404B
Gesamte Fördersumme: 45.506 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Clara Lehmann
Adresse: Universität zu Köln, Medizinische Fakultät, Universitätsklinikum, Klinik I für Innere Medizin
Kerpener Str. 62
50937 Köln

Vergleichbare Datenharmonisierung

Mit dem Ende der Pandemie gibt es immer mehr Berichte von Patientinnen und Patienten mit Langzeitkomplikationen von COVID-19. Das Krankheitsbild wird zusammengefasst unter den Namen Post-COVID-Syndrom. Dabei kommt es bei den Betroffenen zu unterschiedlichen meist schwer vorherzusagenden Verläufen. Eine frühzeitige Identifizierung der Risikofaktoren, sowie eine Klassifizierung der Symptomverläufe ist daher essentiell für ein näheres Verständnis der Langzeitfolgen und möglicher Behandlungsstrategien. Mit den teils maßgeblichen Unterschieden der Krankheitsverläufe geht auch eine hohe Komplexität der Daten einher. Um diese Komplexität zu beschreiben und Muster zu erkennen, werden bereits Methoden des sogenannten föderierten Lernens verwendet, bei denen die Analyse an den einzelnen Standorten stattfindet, um den Datenschutz zu verbessern. Nur aggregierte Statistiken werden iterativ an einen zentralen Analysten übermittelt. Jedoch werden bisher beim föderierten Lernen vergleichsweise simple Analysen verwendet, die oft nicht skalierbar sind. Aus diesen Gründen werden im interdisziplinären Projekt HALTA Methoden entwickelt, mit denen sich mit künstlicher Intelligenz die Risikofaktoren betroffener Individuen identifizieren, sowie Krankheitsverläufe vorhersagen lassen. Das ermöglicht die Unterstützung von Entscheidungen zur Behandlung der Patienten. Hierbei wird stets die Verschiedenartigkeit der Krankheitsverläufe beachtet und die Skalierbarkeit auf große Datensätze über die sogenannte amortisierende Inferenz, eine neue Methode im Forschungsbereich der künstlichen Intelligenz, gewährleistet. Um diese Analyse zu ermöglichen, wird die Methode der latenten Klassenanalyse mit kontinuierlicher Zeit für föderierte Datensätze entwickelt und föderiertes "Representation Learning" genutzt, um ähnliche Muster im Krankheitsverlauf und Patientengruppen zu erkennen. Für die Analyse werden bereits bestehende (inter-)nationale Datensätze verwendet.

Datenrepräsentation

Förderkennzeichen: 01EQ2404C
Gesamte Fördersumme: 33.720 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: PD Dr. Björn-Erik Ole Jensen
Adresse: Heinrich-Heine-Universität Düsseldorf, Medizinische Fakultät und Universitätsklinikum, Klinik für Gastroenterologie, Hepatologie und Infektiologie
Moorenstr. 5
40225 Düsseldorf

Datenrepräsentation

Mit dem Ende der Pandemie gibt es immer mehr Berichte von Patientinnen und Patienten mit Langzeitkomplikationen von COVID-19. Das Krankheitsbild wird zusammengefasst unter den Namen Post-COVID-Syndrom. Dabei kommt es bei den Betroffenen zu unterschiedlichen meist schwer vorherzusagenden Verläufen. Eine frühzeitige Identifizierung der Risikofaktoren, sowie eine Klassifizierung der Symptomverläufe ist daher essentiell für ein näheres Verständnis der Langzeitfolgen und möglicher Behandlungsstrategien. Mit den teils maßgeblichen Unterschieden der Krankheitsverläufe geht auch eine hohe Komplexität der Daten einher. Um diese Komplexität zu beschreiben und Muster zu erkennen, werden bereits Methoden des sogenannten föderierten Lernens verwendet, bei denen die Analyse an den einzelnen Standorten stattfindet, um den Datenschutz zu verbessern. Nur aggregierte Statistiken werden iterativ an einen zentralen Analysten übermittelt. Jedoch werden bisher beim föderierten Lernen vergleichsweise simple Analysen verwendet, die oft nicht skalierbar sind. Aus diesen Gründen werden im interdisziplinären Projekt HALTA Methoden entwickelt, mit denen sich mit künstlicher Intelligenz die Risikofaktoren betroffener Individuen identifizieren, sowie Krankheitsverläufe vorhersagen lassen. Das ermöglicht die Unterstützung von Entscheidungen zur Behandlung der Patienten. Hierbei wird stets die Verschiedenartigkeit der Krankheitsverläufe beachtet und die Skalierbarkeit auf große Datensätze über die sogenannte amortisierende Inferenz, eine neue Methode im Forschungsbereich der künstlichen Intelligenz, gewährleistet. Um diese Analyse zu ermöglichen, wird die Methode der latenten Klassenanalyse mit kontinuierlicher Zeit für föderierte Datensätze entwickelt und föderiertes "Representation Learning" genutzt, um ähnliche Muster im Krankheitsverlauf und Patientengruppen zu erkennen. Für die Analyse werden bereits bestehende (inter-)nationale Datensätze verwendet.

Datenzusammenführung

Förderkennzeichen: 01EQ2404D
Gesamte Fördersumme: 216.991 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr.-Ing. Jan Peter Hasenauer
Adresse: Rheinische Friedrich-Wilhelms-Universität Bonn, Mathematisch-Naturwissenschaftliche Fakultät, Fachgruppe Molekulare Biomedizin, LIMES-Institut
Carl-Troll-Str. 31
53115 Bonn

Datenzusammenführung

Mit dem Ende der Pandemie gibt es immer mehr Berichte von Patientinnen und Patienten mit Langzeitkomplikationen von COVID-19. Das Krankheitsbild wird zusammengefasst unter den Namen Post-COVID-Syndrom. Dabei kommt es bei den Betroffenen zu unterschiedlichen meist schwer vorherzusagenden Verläufen. Eine frühzeitige Identifizierung der Risikofaktoren, sowie eine Klassifizierung der Symptomverläufe ist daher essentiell für ein näheres Verständnis der Langzeitfolgen und möglicher Behandlungsstrategien. Mit den teils maßgeblichen Unterschieden der Krankheitsverläufe geht auch eine hohe Komplexität der Daten einher. Um diese Komplexität zu beschreiben und Muster zu erkennen, werden bereits Methoden des sogenannten föderierten Lernens verwendet, bei denen die Analyse an den einzelnen Standorten stattfindet, um den Datenschutz zu verbessern. Nur aggregierte Statistiken werden iterativ an einen zentralen Analysten übermittelt. Jedoch werden bisher beim föderierten Lernen vergleichsweise simple Analysen verwendet, die oft nicht skalierbar sind. Aus diesen Gründen werden im interdisziplinären Projekt HALTA Methoden entwickelt, mit denen sich mit künstlicher Intelligenz die Risikofaktoren betroffener Individuen identifizieren, sowie Krankheitsverläufe vorhersagen lassen. Das ermöglicht die Unterstützung von Entscheidungen zur Behandlung der Patienten. Hierbei wird stets die Verschiedenartigkeit der Krankheitsverläufe beachtet und die Skalierbarkeit auf große Datensätze über die sogenannte amortisierende Inferenz, eine neue Methode im Forschungsbereich der künstlichen Intelligenz, gewährleistet. Um diese Analyse zu ermöglichen, wird die Methode der latenten Klassenanalyse mit kontinuierlicher Zeit für föderierte Datensätze entwickelt und föderiertes "Representation Learning" genutzt, um ähnliche Muster im Krankheitsverlauf und Patientengruppen zu erkennen. Für die Analyse werden bereits bestehende (inter-)nationale Datensätze verwendet.

Föderierte modellbasierte Analyse von Gesundheitsdatenverläufen

Förderkennzeichen: 01EQ2404E
Gesamte Fördersumme: 45.720 EUR
Förderzeitraum: 2025 - 2026
Projektleitung: Prof. Dr. Siegbert Rieg
Adresse: Albert-Ludwigs-Universität Freiburg, Medizinische Fakultät, Universitätsklinikum Freiburg, Abt. Innere Medizin II
Hugstetter Str. 55
79106 Freiburg im Breisgau

Föderierte modellbasierte Analyse von Gesundheitsdatenverläufen

Mit dem Ende der Pandemie gibt es immer mehr Berichte von Patientinnen und Patienten mit Langzeitkomplikationen von COVID-19. Das Krankheitsbild wird zusammengefasst unter den Namen Post-COVID-Syndrom. Dabei kommt es bei den Betroffenen zu unterschiedlichen meist schwer vorherzusagenden Verläufen. Eine frühzeitige Identifizierung der Risikofaktoren, sowie eine Klassifizierung der Symptomverläufe ist daher essentiell für ein näheres Verständnis der Langzeitfolgen und möglicher Behandlungsstrategien. Mit den teils maßgeblichen Unterschieden der Krankheitsverläufe geht auch eine hohe Komplexität der Daten einher. Um diese Komplexität zu beschreiben und Muster zu erkennen, werden bereits Methoden des sogenannten föderierten Lernens verwendet, bei denen die Analyse an den einzelnen Standorten stattfindet, um den Datenschutz zu verbessern. Nur aggregierte Statistiken werden iterativ an einen zentralen Analysten übermittelt. Jedoch werden bisher beim föderierten Lernen vergleichsweise simple Analysen verwendet, die oft nicht skalierbar sind. Aus diesen Gründen werden im interdisziplinären Projekt HALTA Methoden entwickelt, mit denen sich mit künstlicher Intelligenz die Risikofaktoren betroffener Individuen identifizieren, sowie Krankheitsverläufe vorhersagen lassen. Das ermöglicht die Unterstützung von Entscheidungen zur Behandlung der Patienten. Hierbei wird stets die Verschiedenartigkeit der Krankheitsverläufe beachtet und die Skalierbarkeit auf große Datensätze über die sogenannte amortisierende Inferenz, eine neue Methode im Forschungsbereich der künstlichen Intelligenz, gewährleistet. Um diese Analyse zu ermöglichen, wird die Methode der latenten Klassenanalyse mit kontinuierlicher Zeit für föderierte Datensätze entwickelt und föderiertes "Representation Learning" genutzt, um ähnliche Muster im Krankheitsverlauf und Patientengruppen zu erkennen. Für die Analyse werden bereits bestehende (inter-)nationale Datensätze verwendet.