https://doi.org/10.1007/s00392-025-02625-4
1Krankenhaus Porz am Rhein gGmbH Klinik für Kardiologie, Elektrophysiologie u. Rhythmologie Köln, Deutschland
Hintergrund:
In Deutschland wird die Einrichtung nationaler Register für Ablationspatienten oft als komplex und kaum realisierbar angesehen, insbesondere aufgrund von Missverständnissen hinsichtlich der Datenschutzgesetze und des Aufwands der Datenerhebung. Gleichzeitig bieten große multizentrische Datenbanken in Kombination mit Künstlicher Intelligenz (KI) neue Möglichkeiten für die Datenanalyse und Risikostratifizierung bei Vorhofflimmern.
Zielsetzung:
Darstellung unserer Erfahrungen bei der Implementierung eines Ablationsregisters, dem effizienten Export anonymisierter Patientendaten und der internationalen Zusammenarbeit zur Verbesserung der Datenanalyse und -auswertung.
Methode:
Wir stellten bei der zuständigen Ethikkommission einen Ethikantrag für ein Ablationsregister, der genehmigt wurde. Unser Team erlernte die Nutzung einer Großdaten-Exportfunktion aus dem Krankenhausinformationssystem Orbis, um einen schnellen und effizienten Datenexport zu ermöglichen und den manuellen Aufwand zu minimieren. Diese ermöglichte den Export von bestimmten Feldern aus Befunden und Arztbriefen (wie Haupt- und Nebendiagnosen sowie Medikamentenlisten, etc.). Patientenidentifizierbare Daten wurden entfernt.
Anschließend wurde ein großes Sprachmodell auf einem lokalen Server verwendet, um relevante Schlüsselwörter zu extrahieren, die mit den spezifischen Diagnosen verbunden sind. Diese Schlüsselwörter wurden dann manuell auf ihre Richtigkeit überprüft und in einem umfassenden Wörterbuch zusammengestellt, das verschiedene Haupt- und Nebendiagnosen sowie Medikamente inklusive Wirkstoffe und Generikanamen enthielt. Dieses Wörterbuch wurde von einem auf Python basierenden Algorithmus zum Auffinden von Schlüsselwörtern verwendet, um verschiedene Diagnosen in den Patientenakten zu erkennen, wobei der Code so konzipiert wurde, dass Rechtschreibfehler durch den Einsatz flexibler Abgleichtechniken toleriert werden.
Sechs Doktorand*innen wurden in zwei Gruppen aufgeteilt: Eine führte die manuelle Datenextraktion durch, die andere kontrollierte und bearbeitete die automatisch exportierten Daten.
Ergebnisse:
In beiden Gruppen war eine Lernkurve bei der Datenbearbeitung sichtbar. Nach dem Sammeln ausreichender Erfahrung (nach 50 Einträgen) benötigten die Doktorand*innen in der Gruppe der manuellen Datenextraktion durchschnittlich 18 ± 7 Minuten pro Eintrag. In der zweiten Gruppe betrug die Bearbeitungszeit trotz der Tatsache, dass eine vollständige Automatisierung des Datenexports aufgrund der Heterogenität der Daten und der Ausdrucksweise nicht möglich war, nur 5 ± 2 Minuten.
Bei einer Patientenzahl von 1.100 pro Jahr entspricht das einer Einsparung von mehr als 10.000 Minuten durch die Datenexport-Pipeline. Ein Teil der anonymisierten Daten wurde erfolgreich mit einer anderen Abteilung für Computational Kardiologie zur weiterer Analyse geteilt, was aufgrund mangelnder Hardware und biostatistischer Erfahrung in unserer Einrichtung nicht möglich gewesen wäre.
Zusammenfassung:
Die Erstellung von Patientenregistern und die Einleitung internationaler Kollaborationen zur Datenbearbeitung und -analyse sind möglich. Die Automatisierung des Datenexports, welche auf internen Servern erfolgen kann, ist machbar und führt zu erheblichen Zeiteinsparungen. Die so gewonnene Zeit des Forschungspersonals und der Doktorand*innen kann in weitere Aufgaben investiert werden, die nicht automatisiert werden können, wie beispielsweise Follow-ups.