Elektronische Patientenakten, Registerdaten, Abrechnungsinformationen oder Daten aus Wearables – die moderne Medizin erzeugt täglich enorme Mengen an Gesundheitsdaten. Gerade in der Kardiologie gelten diese sogenannten Routinedaten als vielversprechende Quelle für neue Erkenntnisse. Sie ermöglichen Analysen großer Patientenkollektive, liefern Informationen über Langzeitverläufe und spiegeln die Versorgung im klinischen Alltag wider. Doch wie belastbar sind die daraus gewonnenen Erkenntnisse tatsächlich? Ein aktueller Beitrag im British Medical Journal (BMJ) kommt zu einer klaren Schlussfolgerung: Routinedaten bieten enorme Chancen für Forschung und Versorgung, ihre Aussagekraft hängt jedoch entscheidend von der Qualität der Daten und der methodischen Sorgfalt der Analysen ab.
Hoffnungsträger für die kardiovaskuläre Forschung
Die Attraktivität von Routinedaten liegt auf der Hand. Im Gegensatz zu klassischen klinischen Studien müssen die Daten nicht erst aufwendig erhoben werden. Sie liegen häufig bereits in elektronischen Systemen vor und umfassen oftmals Tausende oder sogar Millionen von Patientinnen und Patienten. Für die Herzmedizin ergeben sich daraus zahlreiche Anwendungsmöglichkeiten. So können seltene Ereignisse untersucht, Versorgungsrealitäten abgebildet oder langfristige Therapieergebnisse analysiert werden. Auch für die Entwicklung von Risikomodellen und den Einsatz Künstlicher Intelligenz spielen große Datenbestände eine zentrale Rolle. Die Autorinnen und Autoren des BMJ-Artikels warnen jedoch davor, Routinedaten mit hochwertiger Evidenz gleichzusetzen. Große Datenmengen könnten eine trügerische Sicherheit erzeugen. Präzise berechnete Ergebnisse seien nicht automatisch korrekt, wenn die zugrundeliegenden Daten zufällige Fehler und systematische Verzerrungen enthalten.
Wer ist überhaupt in den Daten vertreten?
Routinedaten stammen häufig aus bestimmten Versorgungskontexten – etwa Universitätskliniken, spezialisierten Herzzentren oder einzelnen Versicherungssystemen. Dadurch werden manche Patientengruppen überdurchschnittlich häufig erfasst, während andere unterrepräsentiert bleiben. Für die kardiovaskuläre Medizin kann dies erhebliche Folgen haben. Alter, Geschlecht, sozioökonomischer Status oder der Zugang zu medizinischer Versorgung beeinflussen sowohl Diagnostik als auch Therapieergebnisse. Werden solche Unterschiede nicht ausreichend berücksichtigt, lassen sich Studienergebnisse nur eingeschränkt auf die Gesamtbevölkerung übertragen. Besonders problematisch wird die Situation, wenn unterrepräsentierte Gruppen zugleich weniger vollständig dokumentiert sind. Dann droht die Gefahr, bestehende Ungleichheiten durch Forschungsergebnisse unbeabsichtigt zu verstärken.
Datenqualität bleibt der entscheidende Faktor
Noch wichtiger als die Repräsentativität ist oft die Qualität der erhobenen Informationen. Routinedaten werden primär für die Patientenversorgung oder administrative Zwecke dokumentiert. Forschungsfragen spielen bei der Erfassung meist keine Rolle. Entsprechend unterschiedlich können Vollständigkeit und Genauigkeit ausfallen. Laborwerte werden beispielsweise häufig nur bei bestimmten Patientengruppen erhoben. Fehlende Werte entstehen deshalb oft nicht zufällig. Sie können vielmehr selbst wichtige Informationen über den klinischen Zustand von Patientinnen und Patienten enthalten. Hinzu kommen unterschiedliche Dokumentationsstandards, Veränderungen im Zeitverlauf sowie mögliche Kodierungs- und Erfassungsfehler. Die Autorinnen und Autoren betonen deshalb, dass Forschende die Entstehungsgeschichte ihrer Daten genau verstehen müssen. Ohne systematische Qualitätskontrollen besteht das Risiko, dass scheinbar valide Ergebnisse auf fehlerhaften Grundlagen beruhen.
Die Herausforderung der richtigen Zeitachse
Ein weiterer kritischer Punkt ist die zeitliche Zuordnung klinischer Ereignisse. In randomisierten Studien existiert in der Regel ein klar definierter Studienbeginn. Bei Routinedaten fehlt ein solcher „Zeitpunkt Null“ häufig. Patientinnen und Patienten erhalten verschiedene Therapien zu unterschiedlichen Zeitpunkten, wechseln Behandlungen oder werden mehrfach stationär aufgenommen. Werden diese Abläufe nicht korrekt berücksichtigt, entstehen systematische Verzerrungen. Bestimmte statistische Fehler können dazu führen, dass Therapien besser oder schlechter erscheinen, als sie tatsächlich sind. Auch moderne Vorhersagemodelle sind hiervon betroffen. Werden Informationen verwendet, die zum Zeitpunkt einer prognostischen Entscheidung in der Realität noch gar nicht verfügbar gewesen wären, entstehen unrealistisch gute Ergebnisse. Solche Modelle funktionieren in wissenschaftlichen Auswertungen oft hervorragend, scheitern jedoch im klinischen Alltag.
Warum Beobachtungsdaten keine Randomisierung ersetzen
Besondere Aufmerksamkeit widmet die Arbeit dem Problem der sogenannten „Confounding by Indication“. Im klinischen Alltag werden Therapien nicht zufällig vergeben. Ärzte treffen Entscheidungen auf Basis zahlreicher Faktoren – darunter Krankheitsschwere, Begleiterkrankungen, Gebrechlichkeit oder individuelle Risikoprofile. Viele dieser Einflussgrößen sind in Routinedaten nur unvollständig dokumentiert oder gar nicht vorhanden. Dadurch kann der Eindruck entstehen, eine Therapie sei mit einer höheren Sterblichkeit verbunden, obwohl sie lediglich häufiger bei besonders schwer erkrankte Personen eingesetzt wurde. Selbst komplexe statistische Verfahren können solche Verzerrungen oft nicht vollständig korrigieren. Deshalb sehen die Autorinnen und Autoren randomisierte Studien weiterhin als unverzichtbaren Goldstandard für die Bewertung therapeutischer Effekte.
Künstliche Intelligenz: Lösung oder neues Problem?
Mit der zunehmenden Digitalisierung wächst auch die Hoffnung auf KI-gestützte Analysen. Maschinelles Lernen kann große Datenmengen verarbeiten, komplexe Zusammenhänge erkennen und neue Prognosemodelle ermöglichen. Gerade in der Kardiologie wird intensiv an Anwendungen gearbeitet, die Diagnostik, Risikostratifizierung und Therapieentscheidungen unterstützen sollen. Der BMJ-Beitrag zeichnet jedoch ein differenziertes Bild. KI-Systeme lernen nicht automatisch medizinisch sinnvolle Zusammenhänge. Häufig erkennen sie Muster, die lediglich Besonderheiten der Datenerfassung widerspiegeln. Ein Algorithmus könnte beispielsweise lernen, dass bestimmte Untersuchungen vor allem bei Hochrisikopatientinnen und -patienten durchgeführt werden. Die Vorhersage erscheint dann hochpräzise, basiert aber nicht auf pathophysiologischen Zusammenhängen, sondern auf klinischen Routinen. Darüber hinaus besteht die Gefahr, bestehende Ungleichheiten zu verstärken. Wenn bestimmte Bevölkerungsgruppen historisch seltener diagnostiziert oder behandelt wurden, können KI-Modelle diese Muster übernehmen und fortschreiben.
Was bedeutet das für die Praxis?
Die zentrale Botschaft der Publikation lautet: Routinedaten bieten viele Möglichkeiten, aber ihr Nutzen hängt davon ab, wie sorgfältig sie analysiert werden. Erforderlich sind transparente Studienprotokolle, eine genaue Kenntnis der Datenquellen, konsequente Qualitätskontrollen und die kritische Prüfung möglicher Verzerrungen. Ebenso wichtig ist die enge Zusammenarbeit zwischen klinischen Expertinnen und Experten, Epidemiologinnen und Epidemiologen, Statistikerinnen und Statistikern sowie Datenwissenschaftlerinnen und -wissenschaftlern.
Für die Herzmedizin eröffnet dies große Chancen. Registerdaten, elektronische Gesundheitsakten und digitale Gesundheitsanwendungen werden künftig eine immer wichtigere Rolle spielen. Sie können helfen, Versorgungslücken zu identifizieren, Hypothesen für klinische Studien zu generieren und die Versorgung von Patientinnen und Patienten mit Herz-Kreislauf-Erkrankungen weiter zu verbessern. Gleichzeitig erinnert die BMJ-Arbeit daran, dass wissenschaftliche Qualität nicht allein von der Größe eines Datensatzes abhängt. Entscheidend bleibt die Frage, ob die Daten geeignet sind, die jeweilige Forschungsfrage valide zu beantworten.
Die Autorinnen und Autoren formulieren daher eine bemerkenswert klare Schlussfolgerung: Manchmal ist keine Evidenz besser als irreführende Evidenz. Werden die methodischen Herausforderungen jedoch konsequent adressiert, können Routinedaten zu einem wichtigen Baustein einer modernen, datengetriebenen Herzmedizin werden.
Zur Person
Dr. Sabine Hoffmann
Dr. Sabine Hoffmann ist Leiterin des Statistischen Beratungslabors (StaBLab) der LMU München. Mit einem interdisziplinären Hintergrund in Statistik, Epidemiologie und Psychologie unterstützten sie und ihr Team Forschende bei der Planung, Analyse und Kommunikation empirischer Studien. Ihr Schwerpunkt liegt auf der Modellierung komplexer Unsicherheiten und auf transparenter und zuverlässiger Forschung.
Zur Person
Prof. Holger Thiele
Prof. Holger Thiele ist Direktor der Universitätsklinik für Kardiologie am Herzzentrum Leipzig. Er ist Professor für Kardiologie an der Universität Leipzig und Präsident der Deutschen Gesellschaft für Kardiologie (2023–2025). Seine Forschungsschwerpunkte sind u. a. akuter Myokardinfarkt, akute Herzinsuffizienz, kardiogener Schock und mechanische Kreislaufunterstützung.
Zur Person
Prof. Enzo Lüsebrink
Prof. Enzo Lüsebrink ist Oberarzt für kardiovaskuläre Intensivmedizin und interventionelle Kardiologie am Herzzentrum Bonn. Forschungsschwerpunkte sind u. a. Behandlungsstrategien bei der Hochrisiko-Lungenembolie und kardiologisch-intensivmedizinische Unterstützung der Herzfunktion, insbesondere im kardiogenen Schock.
Key Facts der Studie
Die Studie untersuchte, wie belastbar aus Routinedaten gewonnenen Erkenntnisse tatsächlich sind.
Routinedaten bieten erhebliche Vorteile hinsichtlich des Zeit- und Kostenaufwands für die Datenerhebung; jedoch fehlt es Forschenden oft an Wissen darüber, wie die Daten entstanden sind, und an Kontrolle darüber, wie sie erhoben wurden. Zu den häufigen Herausforderungen bei der Analyse zählen u. a. Repräsentativität und Datenqualität. KI-Algorithmen können zudem bei der Analyse von Routinedaten anfällig für bestehende Voreingenommenheiten sein.
Routinedaten bieten viele Möglichkeiten, aber ihr Nutzen hängt davon ab, wie sorgfältig sie analysiert werden. Erforderlich sind transparente Studienprotokolle, eine genaue Kenntnis der Datenquellen, konsequente Qualitätskontrollen und die kritische Prüfung möglicher Verzerrungen.
Referenzen
-
Hoffmann S, Morris T, Hermann M, Heinze G, Van Calster B, Bischl B, Schmid M, Shaw PA, Mathes T, Naudet F, Harrell FE, Niethammer M, Muli S, Zimmer S, Bakhtiary F, Leistner D, Schulze PC, Sedding D, Lurz P, Rassaf T, Kelm M, Baldus S, Bauersachs J, Nickenig G, Thiele H, Lüsebrink E. Using routinely collected data for research purposes: challenges and mitigation strategies. BMJ 2026;393:e087812 doi:10.1136/bmj-2025-087812
Zur Übersichtsseite Digitale Kardiologie