Hybride Qualitätsindikatoren mittels Machine Learning für die stationäre Versorgung des akuten Myokardinfarkts

Melissa Spoden (Berlin)1, P. Dröge (Berlin)1, T. Datzmann (Dresden)2, J. Schmitt (Dresden)3, C. Günster (Berlin)1

1Wissenschaftliches Institut der AOK Berlin, Deutschland; 2Technische Universität und Universitätsklinikum Dresden Nationales Centrum für Tumorerkrankungen (NCT) Dresden, Deutschland; 3Technische Universität und Universitätsklinikum Dresden Zentrum für Evidenzbasierte Gesundheitsversorgung Dresden, Deutschland

 

Fragestellung
GKV-Routinedaten erlauben eine Longitudinalanalyse des Behandlungsverlaufs beim akuten Myokardinfarkt (AMI) und werden deshalb zur stationären Qualitätsmessung genutzt. Um einen fairen Krankenhausvergleich trotz unterschiedlicher Patientenpopulationen zu ermöglichen, ist eine Risikoadjustierung notwendig. Bislang wurde vermutet, dass GKV-Routinedaten das Risikoprofil (insb. den Schweregrad des AMI) der Patient*innen nicht hinlänglich abbilden können und Daten aus der klinischen Dokumentation notwendig seien, um einen fairen Krankenhausvergleich zu ermöglichen. In dem laufenden Innovationsfondsprojekt Hybrid-QI (01VSF20013) wurden retrospektiv GKV-Routinedaten der AOK mit klinischen Daten verknüpft und auf Basis dieses hybriden Datensatzes Qualitätsindikatoren für den AMI entwickelt und evaluiert, inwieweit klinische Daten die Risikoadjustierung verbessern.
Methodik
In einem Expertenpanel wurden Outcomes und Risikofaktoren für AMI erarbeitet. Der hybride Datensatz wurde durch die Verlinkung der GKV-Routinedaten (pseudonymisierte KVNR) mit retrospektiv gelieferten Daten von 15 Kliniken gebildet. Der Datensatz wurde genutzt, um den Einfluss klinischer Variablen auf die Modellgüte (ROC-AUC u.a.), die Risikoadjustierung (Variablenselektion) sowie die Standardisierte Mortalitätsrate (SMR) der Kliniken zu evaluieren. Neben der Evaluation klinischer Variablen wurde analysiert, ob durch Machine-Learning (ML) Methoden (Elastic Net u. a.) höhere Modellgüten erzielt werden können, als anhand der konservativen Methode der logistischen Regression.
Ergebnisse
Für die Outcomes Versterben, MACCE und MACCE plus Herzinsuffizienz nach 30 und 365 Tagen nach Aufnahme wurden aus den klinischen Variablen die Hämoglobinkonzentration (Hb-Wert), die Glomerulären Filtrationsrate (eGFR) am Aufnahmetag und die Lokalisation der Perkutanen koronaren Intervention (PCI) als Risikofaktoren festgelegt, die über die aus den GKV-Routinedaten stammenden Diagnosen und Prozeduren hinausgehende relevante Informationen zur verbesserten Erfassung des Risikoprofils der Patient*innen darstellen könnten. Die Hinzunahme von Hb-Wert, eGFR und PCI Lokalisation mündeten über alle Outcomes hinweg in keiner signifikanten Steigerung der Modellgüte (Tab. 1). Lediglich die eGFR zeigte eine schwache Korrelation mit fünf der sechs Outcomes und wurde von den Modellen als Variable zur Risikoadjustierung gewählt. Ebenso zeigten sich im Vergleich der SMR keine wesentlichen Unterschiede zwischen der Risikoadjustierung basierend auf dem hybriden und dem GKV-Routinedatensatz.
Fazit
Die Risikoadjustierung basierend auf GKV-Routinedaten erzeugt hohe Modellgüten, welche durch die Hinzunahme der verfügbaren, klinischen Daten nicht weiter verbessert werden konnten. 

Danksagung an das Expertenpanel: Ekkehard Schuler, Heinz Theres, Uwe Zeymer

Tab. 1 Vergleich ROC-AUC Werte zwischen GKV und hybridem Datensatz und Methoden

Datensatz

GKV Datensatz

Hybrider Datensatz

Outcome         \          Methode

Logistische Regression

Elastic Net

XGBoost

Neuronales Netz

Logistische Regression

Elastic Net

XGBoost

Neuronales Netz

Tod 30 Tage*

0.930

0.943

0.940

0.911

0.921

0.949

0.896

0.860

MACCE 30 Tage*

0.811

0.847

0.836

0.836

0.831

0.864

0.838

0.839

MACCE + I50 30 Tage*

0.779

0.807

0.776

0.839

0.808

0.873

0.798

0.803

MACCE 365 Tage*

0.790

0.804

0.792

0.824

0.810

0.843

0.776

0.798

MACCE + I50 365*

0.789

0.804

0.784

0.784

0.757

0.797

0.742

0.808

* innerhalb von 30/365 Tagen nach Aufnahme
Diese Seite teilen