Sekundärnutzung von Studiendaten

Daten, die in interventionellen Studien oder in Observationsstudien generiert werden, können auch über die jeweilige Studie hinaus einen übergeordneten wissenschaftlichen Mehrwert für die Krebsforschung am DKFZ leisten. Der Mehrwert solcher Daten zeigt sich vor allem in Auswertungen, die Daten aus fremden Studien verwenden, ob als eigenständige Studie oder zur Validierung anderer Daten, wie z.B. bei Kent et al., Klatte et al., und Germonpre et al..

Die medizininformatische Arbeitsgruppe AG Secondary Use of Data in Oncology (SUDO) unter der Leitung von Alexander Knurr hat die Aufgabe, Wissenschaftler:innen des DKFZ und Kooperationspartner:innen in die Lage zu versetzen, diesen Mehrwert nutzen zu können. Dazu sind einige Herausforderungen zu meistern: Wissenschaftler:innen sollen sich unkompliziert über durchgeführte Studien und die untersuchten Fragestellungen informieren können. Die Verfügbarkeit der Daten einer Studie für die Sekundärnutzung, sowie Inhalt, Umfang und Qualität der verfügbaren Daten, sind klar darzustellen und die Datenformate sind für eine Wiederverwendung geeignet aufzubereiten.

Die AG SUDO wurde aus der früheren DKFZ-Abteilung Medizinische Informatik in der Translationalen Onkologie (MITRO) von Prof. Frank Ückert heraus gegründet. Daher verfügt das Team über eine langjährige Erfahrung und fundierte Kenntnisse bei der Integration und Analyse medizinischer Daten des Nationalen Centrums für Tumorerkrankungen Heidelberg (NCT), des DKFZ und des Universitätsklinikums Heidelberg (UKHD), um heterogene Daten aus unterschiedlichsten Studien zusammenzuführen und der translationalen Forschung zur Verfügung zu stellen. Dabei verfolgt Sie die in den FAIR Data Principles formulierten Grundsätze für nachhaltig nutzbare Forschungsdaten.

Um dieses Ziel zu erreichen, sind eine Vielzahl von Arbeitsschritten notwendig, von denen wir Ihnen kurz die wesentlichsten vorstellen wollen.

  • Unterstützung bei der Studienvorbereitung und -durchführung

Zusammen mit der AG Clinical Trials des CTO unterstützen wir die wissenschaftlichen Koordinatoren:innen klinischer Studien einerseits organisatorisch z.B. bei der Erstellung von Patienteneinwilligungen oder Ethikanträgen, um die rechts- und datenschutzkonforme Nachnutzung der Studiendaten zu ermöglichen. Andererseits beraten wir bei inhaltlichen Fragen zur Dokumentation patientenbezogener, medizinischer Daten im Rahmen von klinischen Studien insbesondere im Hinblick auf die spätere Sekundärdatennutzung. Das CTO betreibt dazu zwei Systeme zur elektronischen Dokumentation (Electronic Data Capture, EDC).

    • Marvin EDC ist ein für AMG-Studien zertifiziertes EDC-System, das u.a. intensiv von der NCT Studienzentrale unter der Leitung von Richard Schlenk und Andreas Eisenmenger verwendet wird.
    • Onkostar ist ein hochflexibles EDC-System, das ursprünglich gemeinsam mit dem DKFZ als Krebsregister-EDC-System entwickelt wurde und schon häufig für Observationsstudien am DKFZ eingesetzt wurde.

Für beide Systeme werden Standardformulare - sogenannte electronic Case Report Forms (eCRFs) - entwickelt und können von Studien eingesetzt werden. Dadurch wird der Implementationsaufwand bei Start einer Studie minimiert.

  • Datenaufbereitung zur Sekundärdatennutzung

Daten aus Studien unterschiedlicher onkologischer Fachrichtungen und mit unterschiedlichen Fragestellungen generieren unvermeidbar relativ heterogene Datensammlungen. Um die Hürden für die spätere gemeinsame Sekundärdatennutzung möglichst gering zu halten, sind umfangreiche Arbeiten zur Standardisierung und Harmonisierung der Daten notwendig. Dies geschieht im sogenannten ETL-Prozess (Extraction, Transformation, Loading), in dem die Daten in eine einheitliche, in einem Metadaten Repository (MDR) hinterlegte Ontologie überführt und anschließend in einem zentralen Datenrepository gespeichert werden.

In diesem Prozessschritt werden auch personenidentifizierbare Daten pseudonymisiert, damit eine datenschutzkonforme, wissenschaftliche Verwendung möglich ist.

  • Unterstützung bei der Sekundärdatennutzung

Das CTO betreibt verschiedene zentrale Werkzeuge, die direkt von Wissenschaftlern:innen des DKFZ und von Kooperationspartnern:innen genutzt werden können. Dazu gehören

  • das Metadaten Repository, in dem Informationen zu den im Rahmen der Studien erhobenen Daten enthalten sind
  • eine Analyseplattform als umfangreichste Komponente, in der die pseudonymisierten Daten aus verschiedenen Studien gemeinsam exploriert, visualisiert und für die weitere Verarbeitung exportiert werden können. Der Zugriff auf die Daten wird selbstverständlich durch die DKFZ-Governance klar geregelt und durch ein Use-and-Access-Komitee kontrolliert.

Schematische Darstellung des ETL-Prozess unter Einbeziehung eines digitalen Pseudonymisierungsdienstes (PSD) und eines digitalen Consent Management Systems (CMS)
© dkfz.de

nach oben
powered by webEdition CMS