Entwicklung und Implementierung innovativer Methoden und Werkzeuge für biomedizinische Datenexploration
Über das Projekt
Evidenzbasierte Medizin verwendet hochqualitative, kuratierte und zuverlässige Daten aus der Gesundheitsforschung, kombiniert diese mit der jeweiligen individuellen Expertise der behandelnden Mediziner*innen und hat das Ziel bestmögliche Behandlungsentscheidungen für individuelle Patient*innen zu treffen. Um aus den zugreifbaren Datenquellen das notwendige Wissen zu generieren, müssen heterogene Daten zusammengeführt und vergleichbar gemacht werden – eine komplexe Aufgabe aus Sicht der Datenwissenschaften. Ausschlaggebend für eine zuverlässige Datenbasis von hoher Qualität ist insbesondere die gute Dokumentation des Forschungsprozesses und der resultierenden Daten. Dies schließt ebenfalls den Prozess der Integration von in sich heterogenen Daten aus unterschiedlichen Quellen mit ein. Die Qualität der Datenbasis hängt hierbei maßgeblich von der Qualität der Datenquellen, aber nicht minder von der Qualität der Datenintegration ab.
Ziele
Mit Fokus auf der Generierung FAIRer Daten und der Einbindung standardisierter Datenformate entwickelt die Nachwuchsgruppe MeDaX eine Informations- und Forschungsplattform für die (bio)Medizinsche DateneXploration. Dazu werden
- heterogene (bio)medizinsche Daten aus diversen Quellen über sogenannte ETL-Prozesse (ETL: Extract-Transform-Load) in einem Wissensgraphen (Graphdatenbank) zusammengeführt,
- neuartige bzw. verbesserte Methoden zur computergestützten semantischen Anreicherung, Qualitätskontrolle, Provenienz und Vergleichbarkeit entwickelt und
- Algorithmen und Werkzeuge für die Weiterverarbeitung der Daten integriert.
Als Ausgangspunkte dienen verschiedene Datenquellen, wie z.B. der Kerndatensatz der Medizininformatik-Initiative, lokal verortete Bevölkerungsstudien, biomedizinische Ontologien und öffentlich zugängliche Informationsportale. Zusätzlich müssen in der Aufbauphase die Bedarfe der Patient*innen sowie der datenerhebenden Mediziner*innen und Wissenschaftler*innen eruiert werden, um den größtmöglichen Nutzen der MeDaX-Plattform zu gewährleisten.
Der Schutz personenbezogener Daten sowie die transparente Dokumentation und Kommunikation der wissenschaftlichen Arbeit als Grundlage nachhaltiger Wissenschaft sind der Arbeitsgruppe dabei besonders wichtig.
Leitung der Nachwuchsforschergruppe
Dr. Judith Wodke
Leiterin der Nachwuchsforschergruppe MeDaX
Abteilung Medizininformatik – Institut für Community Medicine | Universitätsmedizin Greifswald
Team
Journalpublikationen
- Lobentanzer et al. Democratizing knowledge representation with BioCypher. Nat Biotech. 2023;41:1056–1059.
- Waltemath et al. FAIRe Gesundheitsdaten im nationalen und internationalen Datenraum.
- Ammon & Kurscheidt et al. Arbeitsgruppe Interoperabilität: Kerndatensatz und Informationssysteme für Integration und Austausch von Daten in der Medizininformatik-Initiative. Bundesgesundheitsblatt. 2024; 67:710–720.
Konferenzbeiträge
- Wodke JAH et al. The MeDaX Knowledge Graph Prototype. Stud Health Technol Inform. 2023 May 18;302:147-148.
- Gierend K, Judith A.H. et al. TAPP: Defining standard provenance information for clinical research data and workflows – Obstacles and opportunities. In Companion Proceedings of the ACM Web Conference 2023 (WWW ’23 Companion). Association for Computing Machinery, New York, NY, USA, 1551–1554.
- Mazein I et al. MeDaX: A Knowledge Graph on FHIR. Stud Health Technol Inform. 2024 Aug 22;316:367-371.