Gesundheit Digital Gesundheitsdaten in der Forschung

Gesundheitsdaten dienen in erster Linie der Versorgung von Patientinnen und Patienten. Mithilfe von Gesundheitsdaten können darüber hinaus neue Erkenntnisse zu Gesundheit und Krankheit gewonnen werden, denn sie enthalten wertvolle Informationen für die medizinische Forschung.

Auf einen Blick

  • Gesundheitsdaten werden primär für die Versorgung von Patientinnen und Patienten erhoben und genutzt.
  • Für die medizinische Forschung und andere gemeinwohlorientierte Zwecke bergen Gesundheitsdaten großes Potenzial.
  • Durch die Forschung mit Gesundheitsdaten können unter anderem die Gesundheitsversorgung verbessert und Krankheiten besser verstanden werden.
  • Es gelten strenge Regeln für die Forschung mit Gesundheitsdaten, um beispielsweise den Datenschutz zu gewährleisten.
Medizinisches Personal zeigt sich an einem Laptop gegenseitig Forschungsergebnisse.

Was sind Gesundheitsdaten?

Gesundheitsdaten sind alle Daten, aus denen Informationen über den Gesundheitszustand einer Person hervorgehen können. Das sind Informationen wie Ergebnisse von Untersuchungen, Diagnosen und verordnete Behandlungen. 

Die Daten werden vorwiegend in medizinischen Einrichtungen durch das Personal erhoben und dokumentiert. Dabei dienen die Daten der Versorgung von Patientinnen und Patienten. Werden Daten zu dem Zweck genutzt, zu dem sie erhoben wurden, nennt man das auch Primärnutzung. 

Genauere Informationen darüber, was Gesundheitsdaten sind und wie sie im Alltag erhoben werden, finden Sie im Artikel Gesundheitsdaten im Alltag.  

Gesundheitsdaten haben aber auch großes Potenzial für die Forschung. Nachdem sie für die Versorgung von Patientinnen und Patienten erhoben und genutzt wurden, können sie für gemeinwohlorientierte Zwecke weiterverwendet werden. Das nennt man auch Sekundärnutzung. 

Gut zu wissen: Gesundheitsdaten aus dem medizinischen Alltag enthalten wertvolle Informationen, unter anderem weil sie die täglich geleistete Gesundheitsversorgung in Krankenhäusern und Praxen direkt abbilden.

Durch die Forschung mit Gesundheitsdaten kann die Gesundheitsversorgung, die Vorsorge und die Behandlung von Patientinnen und Patienten verbessert werden. Zusammenhänge zwischen verschiedenen Erkrankungen und ihren Risikofaktoren können anhand von Gesundheitsdaten aus dem Versorgungsalltag aufgedeckt und erforscht werden. Dafür soll es in Zukunft die Möglichkeit geben, Gesundheitsdaten aus der elektronischen Patientenakte für die Forschung freizugeben.

Wer nutzt Gesundheitsdaten zu welchen Zwecken?

Gesundheitsdaten sollen für die wissenschaftliche Forschung, die Verbesserung des Gesundheitswesens und weitere im Gemeinwohl liegende Zwecke besser nutzbar werden. Das heißt, dass die Verwendung der Gesundheitsdaten möglichst vielen Menschen nutzen soll und nicht nur einzelnen Personen oder Unternehmen.

Das Forschungsdatenzentrum Gesundheit (FDZ) ermöglicht seit Oktober 2025 Forschungsgruppen, Institutionen oder Unternehmen, Gesundheitsdaten in einer gesicherten Arbeitsumgebung für bestimmte Zwecke zu nutzen. Zu diesen Zwecken gehören:

  • die Verbesserung der Gesundheitsversorgung
  • die Krankenhaus- und Pflegestrukturplanung
  • wissenschaftliche Forschung im Bereich der Medizin, der medizinischen Versorgung und Grundlagenforschung
  • die Berichterstattung und Information über die Gesundheit der Bevölkerung durch Bund und Länder
  • die Erfüllung gesetzlicher Aufgaben für die öffentliche Gesundheit
  • die Entwicklung und Überwachung neuer Behandlungsmethoden und Medikamente
  • die Entwicklung digitaler Gesundheitsanwendungen und Systemen der Künstlichen Intelligenz im Gesundheitswesen

Gesundheitseinrichtungen, wie Universitätskliniken und andere Krankenhäuser, die selbst Gesundheitsdaten erheben und speichern, dürfen diese Daten auch selbst weiternutzen. Sie dürfen damit etwa eigene wissenschaftliche Forschungsprojekte durchführen, ihre Patientenversorgung verbessern oder Gesundheitsberichterstattung leisten. Zuvor müssen die Daten anonymisiert oder pseudonymisiert werden.

Antworten auf Fragen rund um das Forschungsdatenzentrum Gesundheit finden Sie auf der Seite des Bundesgesundheitsministeriums.  

Unter welchen Voraussetzungen können Gesundheitsdaten für die Forschung genutzt werden?

Gesundheitsdaten können sensible persönliche Informationen enthalten. Sollen Gesundheitsdaten für die Forschung genutzt werden, müssen daher bestimmte Voraussetzungen erfüllt werden.

Persönliche Informationen, wie zum Beispiel der Name oder das Geburtsdatum, werden aus den Gesundheitsdaten entfernt, bevor diese für Forschungszwecke genutzt werden. So können keine Rückschlüsse auf die Person gezogen werden, von der die Daten stammen.

Forschende, die Gesundheitsdaten nutzen wollen, müssen für ihr Forschungsvorhaben einen Antrag stellen. Aus dem Antrag muss hervorgehen, dass die Gesundheitsdaten nur zu erlaubten Zwecken verarbeitet werden. Wird der Antrag genehmigt, dürfen sie die Gesundheitsdaten nur für das genehmigte Forschungsvorhaben verwenden und nicht an Dritte weitergeben. Anträge werden nur genehmigt, wenn durch das Vorhaben kein unangemessenes Risiko für den Schutz der Daten entsteht.

Die Nutzung von Gesundheitsdaten ist nur zu den gesetzlich gestatteten Zwecken erlaubt. Außerdem dürfen die Gesundheitsdaten natürlich zu dem Zweck verwendet werden, für den sie ursprünglich erhoben wurden, also meist für die Versorgung einer Patientin oder eines Patienten. 

Wichtig zu wissen: Die Gesundheitsdaten einer Person dürfen nicht zu ihrem Nachteil genutzt werden. Auch die Nutzung von Gesundheitsdaten für Marktforschung oder Werbung für Medikamente ist nicht erlaubt.

Gesundheitsdaten einer einzelnen Person, die in verschiedenen Kontexten erhoben wurden, können nur für spezifische Forschungsvorhaben miteinander verknüpft werden. Das heißt, dass beispielsweise Daten aus der elektronischen Patientenakte nur dann mit Daten aus einem Krebsregister zusammengeführt werden, wenn dies für ein bestimmtes Forschungsvorhaben notwendig ist. Ansonsten bleiben diese Daten an unterschiedlichen Orten gespeichert.

Was sind Anonymisierung und Pseudonymisierung?

Um sensible persönliche Informationen zu schützen, gibt es grundsätzlich zwei Möglichkeiten. Bei der Anonymisierung werden bestimmte Informationen einer Person wie der Name oder die Adresse aus dem Datensatz entfernt. Nach der Anonymisierung ist es kaum noch möglich, die Daten einer Person zuzuordnen. Die persönlichen Informationen einer Person sind dadurch gut geschützt. 

Bei der Pseudonymisierung werden sensible persönliche Informationen einer Person aus einem Datensatz entfernt. Diese Informationen werden jedoch durch ein Pseudonym ersetzt. 

Ein Pseudonym kann beispielsweise eine Folge aus Buchstaben und Zahlen sein, mit der ein Datensatz gekennzeichnet wird. Für diejenigen, die mit pseudonymisierten Daten forschen, ist es nicht möglich die Daten einzelnen realen Personen zuzuordnen. Anhand der fest zugeordneten Folge aus Zahlen und Buchstaben ist es aber weiterhin möglich, verschiedene Datensätze einer einzelnen Person miteinander zu verknüpfen. Das ist bei der Anonymisierung nicht möglich. 

Datensätze miteinander zu verknüpfen ist insbesondere notwendig, um neu gewonnene Gesundheitsdaten zu bereits erhobenen Gesundheitsdaten hinzuzufügen. So könnten beispielsweise Informationen über eine bestimmte Therapie bei einer Erkrankung mit den Ergebnissen einer Kontrolluntersuchung nach einigen Jahren verknüpft werden. Dadurch kann man dann etwa die Wirksamkeit verschiedener Therapien vergleichen.

Welche Zustimmungsverfahren sind möglich?

Für die Nutzung bestimmter Gesundheitsdaten gilt eine Widerspruchsregelung. Das ist zum Beispiel zukünftig für die Daten aus der elektronischen Patientenakte (ePA) der Fall. Der Verwendung der eigenen Daten aus der ePA für Forschungszwecke kann man widersprechen. Tut man dies nicht, wird das Einverständnis angenommen. Eine solche Widerspruchsregelung wird als Opt-Out bezeichnet.

Bei der Widerspruchslösung (Opt-Out) dürfen Daten genutzt werden, solange man nicht ausdrücklich widersprochen hat.

Das Gegenteil von Opt-Out ist ein Opt-In-Verfahren. Bei einem Opt-In-Verfahren muss man aktiv zustimmen, damit Daten verwendet werden dürfen.

Mit dem Opt-Out-Verfahren sollen Gesundheitsdaten für die Forschung besser nutzbar gemacht werden. Widerspruchsregelungen führen nämlich in der Regel dazu, dass die Daten von mehr Menschen zur Verfügung stehen, als wenn jeder und jede Einzelne aktiv zustimmen muss. 

Je mehr Daten von verschiedenen Menschen zur Verfügung stehen, desto besser eignen sich die Daten für bestimmte Forschungsvorhaben. Die Aussagekraft von wissenschaftlichen Studien kann häufig durch größere Datenmengen verbessert werden. Das ist wichtig, damit die Studienergebnisse auf die Allgemeinbevölkerung übertragbar sind.

Wie werden Gesundheitsdaten außerdem geschützt?

Gesundheitsdaten gehören zu den besonderen Kategorien der personenbezogenen Daten. Diese besonders sensiblen Daten werden streng geschützt und dürfen nur unter bestimmten Voraussetzungen überhaupt verarbeitet werden. Die Verarbeitung von Gesundheitsdaten wird unter anderem durch die europäische Datenschutz-Grundverordnung und durch das Bundesdatenschutzgesetz geregelt.

Weitere Informationen zum Schutz von Gesundheitsdaten finden Sie im Artikel Gesundheitsdaten im Alltag.

Welches Potenzial hat die Forschung mit Gesundheitsdaten?

Gesundheitsdaten enthalten wertvolle Informationen zur Erforschung von Gesundheit und Krankheit sowie zur Verbesserung der medizinischen Versorgung. Durch die Verwendung von Daten, die ohnehin bereits erhoben werden, können auch Kosten eingespart werden, die bei der anderweitigen Datenerhebung für Studien anfallen würden.

Insbesondere ist es wichtig, auch Daten aus Deutschland und Europa für die Forschung zu verwenden. Solche Daten können die regionalen Umwelteinflüsse, Krankheitshäufigkeiten und lokale Gesundheitsversorgung am besten abbilden. Forschungsergebnisse aus anderen Ländern lassen sich dagegen nicht immer auf Deutschland übertragen.

Besonders relevant sind Gesundheitsdaten für Forschung zu 

  • medizinischer Versorgung (Versorgungsforschung)
  • personalisierter Medizin
  • Seltenen Erkrankungen
  • klinischen Entscheidungs-Unterstützungssystemen
  • und vielen weiteren Themen
Besonders relevant sind Gesundheitsdaten für Forschung zu medizinischer Versorgung (Versorgungsforschung), personalisierter Medizin, Seltenen Erkrankungen, klinischen Entscheidungs-Unterstützungssystemen.

Versorgungsforschung

Die Versorgungsforschung beschäftigt sich damit, wie die Gesundheitsversorgung für alle verbessert werden kann. Es geht beispielsweise darum, wer Zugang zu bestimmten medizinischen Angeboten hat oder wie begrenzte Ressourcen im Gesundheitssystem gerecht verteilt werden. 

Gesundheitsdaten, wie die aus der elektronischen Patientenakte, bilden den tatsächlichen Alltag im Gesundheitssystem ab. Solche Daten sind deshalb besonders wertvoll für die Versorgungsforschung.

Personalisierte Medizin

Bei der personalisierten Medizin geht es darum, medizinische Behandlungen individuell an die Bedürfnisse und den Krankheitsverlauf des Einzelnen anzupassen. Medikamente wirken zum Beispiel unterschiedlich, je nach Alter, Geschlecht oder anderen individuellen Faktoren.

Durch die Auswertung großer Datenmengen kann verglichen werden, wie Medikamente unter bestimmten Voraussetzungen wirken oder wie sich die Blutwerte verschiedener Personen unter der Therapie verändern. Anhand dieser Ergebnisse kann man für einzelne Patientinnen und Patienten besser vorhersagen, wie sie auf eine Therapie reagieren und man kann das Vorgehen entsprechend anpassen.

Seltene Erkrankungen

Gerade für die Erforschung von Seltenen Erkrankungen sind große Datensätze erforderlich. Denn wenn Gesundheitsdaten von vielen unterschiedlichen Menschen in eine Studie einfließen, ist die Wahrscheinlichkeit höher, dass von diesen Menschen mehrere von der gleichen Seltenen Erkrankung betroffen sind. Dann können die Verläufe von diesen Erkrankungen untersucht und neue Erkenntnisse über Behandlungsmöglichkeiten gewonnen werden.

Klinische Entscheidungs-Unterstützungssysteme 

Systeme zur Unterstützung bei Entscheidungen sind Computersysteme, die Ärztinnen und Ärzten im klinischen Alltag bei der Versorgung von Patientinnen und Patienten helfen sollen. 

Solche Systeme warnen zum Beispiel, wenn sie im Medikamentenplan eines Patienten feststellen, dass sich die verordneten Medikamente in ihrer Wirkung gegenseitig beeinflussen. Das medizinische Personal bekommt dann einen Hinweis am Computer und hätte die Gelegenheit, die Medikamente bei Bedarf anzupassen. Systeme zur Unterstützung bei Entscheidungen sollen so unter anderem dabei helfen, Fehler zu vermeiden.

Um solche Systeme zu entwickeln, werden auch Gesundheitsdaten verwendet. Anhand von Gesundheitsdaten können Computer zum Beispiel Zusammenhänge zwischen Beschwerden und Krankheiten erlernen. Im Anschluss kann medizinisches Personal dann bei der Diagnosefindung für ihre Patientinnen und Patienten durch das Computersystem unterstützt werden.

Was sind Big Data und künstliche Intelligenz?

Nicht nur im Gesundheitswesen werden durch die zunehmende Digitalisierung des Alltags ständig viele verschiedene Daten erzeugt und gespeichert. Solche großen Datenmengen werden auch als Big Data bezeichnet. 

Bei der Auswertung dieser Datenmengen kann Künstliche Intelligenz (KI) helfen. Künstliche Intelligenz ist ein Teilbereich der Informatik. Als KI bezeichnet man Computersysteme, die lernfähig sind und Probleme lösen können.

Anwendungen, die auf KI basieren, können etwa anhand großer Datenmengen auch schwache Zusammenhänge erkennen. So könnten beispielsweise bisher unbekannte Vorboten für Erkrankungen gefunden werden.

Selbstlernende KI-Systeme werden zunächst anhand von Daten trainiert. Aus diesen Daten lernt ein KI-System Regeln und Muster, die es später anwenden soll. Je mehr Daten in guter Qualität für dieses Training vorhanden sind, desto zuverlässiger sind die Vorhersagen der KI.

Was hat die bisherige Forschung mit Gesundheitsdaten für Ergebnisse erbracht?

Es gibt bereits zahlreiche Beispiele für Forschung mit Gesundheitsdaten, die ursprünglich zu einem anderen Zweck erhoben wurden. 

Routinemäßig durch die Krankenkassen erhobene Daten werden in Deutschland in pseudonymisierter Form beispielsweise dazu genutzt, die alltägliche Gesundheitsversorgung abzubilden. Aus den Daten werden Informationen über die Versorgung mit Medikamenten bei bestimmten Erkrankungen oder über die Gründe für Arbeitsunfähigkeit gewonnen. Letzteres dient unter anderem als Grundlage für den Ausbau einer gezielten betrieblichen Gesundheitsförderung.

Weitere Forschungsprojekte mit einer sekundären Nutzung von Gesundheitsdaten gibt es beispielsweise im Bereich der Krebserkrankungen oder zu Therapieoptionen bei Thrombosen.

Früherkennung von Darmkrebs

Anhand von Blutuntersuchungen und mithilfe von Informationen aus Krebsregistern wurde ein neues Computermodell entwickelt. Dafür wurden die anonymisierten Daten von über 450.000 Menschen ausgewertet. Um ein erhöhtes Darmkrebs-Risiko zu erkennen, benötigt das Modell lediglich Ergebnisse einer Routine-Blutuntersuchung sowie Alter und Geschlecht einer Person. Die betroffenen Personen können dann über ihr erhöhtes Darmkrebs-Risiko informiert werden und sich gegebenenfalls weiteren Untersuchungen unterziehen.

Krebserkrankungen

Um zeitliche Zusammenhänge zwischen Krebserkrankungen und anderen Erkrankungen zu erkennen, wurden anonymisierte Daten von Arztbesuchen der taiwanischen Bevölkerung ausgewertet. Das Wissen um die zeitlichen Zusammenhänge kann Ärztinnen und Ärzten helfen, ein erhöhtes Krebsrisiko rechtzeitig zu erkennen und Begleiterkrankungen bei einer Krebsdiagnose frühzeitig zu behandeln.

Medikamentöse Therapie nach Thrombose

Für eine Studie über die Therapie nach einer Thrombose wurden Informationen ausgewertet, die aus der alltäglichen Gesundheitsversorgung in Deutschland und Kanada stammten. Anhand der Auswertung von anonymisierten Diagnosen und verschriebenen Medikamenten konnten beispielsweise die Nebenwirkungen verschiedener gerinnungshemmender Medikamente verglichen werden.

Stand:

Fanden Sie diesen Artikel hilfreich?