PDF enthält Tabellen und/oder Abbildungen
PDF enthält Tabellen und/oder Abbildungen
Hintergrund
Die Evaluation der Vortestwahrscheinlichkeit des Vorliegens einer obstruktiven Koronaren Herzkrankheit (KHK) ist eine Herausforderung im Alltag klinisch tätiger Kardiolog:innen. Diese kann mittels modifiziertem Diamond and Forrester Score eingeschätzt werden. Zur weiterführenden Abklärung kommen bildgebende Verfahren wie die CT-Untersuchung des Herzens, die Stress-Echokardiographie oder die Stress-MRT-Untersuchung des Herzens zum Einsatz, welche jedoch einen hohen Ressourcen-Bedarf haben. Die Elektrokardiographie (EKG) des Herzens, welche routinemäßig breit verfügbar ist, liefert zahlreiche strukturierte Informationen, die mittels Algorithmen basierend auf künstlicher Intelligenz die Vorhersage mehrerer kardiovaskulärer Erkrankungen ermöglicht.
Ziel
Wir wollen Methoden der multivariaten Statistik (logistische Regression, lineare Diskriminanzanalyse) und des maschinellen Lernens (neuronale Netze, random forests, support vector machines) hinsichtlich ihrer Eignung, aus strukturierten Daten des EKGs eine obstruktive KHK oder die langfristige Überlebenswahrscheinlichkeit vorherzusagen, vergleichen. Weiter werden wir evaluieren, wie die Vorhersagequalität dieser Methoden verbessert werden kann.
Methoden
Unsere Analyse basiert auf dem ECAD Register. Dieses enthält Daten von Patient:innen, die zwischen 2004 und 2019 am Westdeutschen Herz- und Gefäßzentrum Essen eine konventionelle Koronarangiographie erhielten. In die Studie wurden nur Patient:innen mit einem digital verfügbaren Ruhe-EKG, das maximal 90 Tage vor der Koronarangiographie durchgeführt wurde, eingeschlossen. Die Analyse der EKGs basiert auf den 648 Charakteristiken, die der MUSE-Algorithmus liefert.
Eine obstruktive KHK wurde definiert als Notwendigkeit einer Revaskularisationstherapie, entsprechend der Einschätzung des behandelnden interventionellen Kardiolog:innen. Zur Analyse der Sterblichkeit wurden alle Todesfälle während des Nachverfolgungszeitraums, unabhängig von der Ursache, herangezogen.
Ein erstes neuronales Netz (NN1) wurde durch dropout, weight regularization und Optimierung der Hyperparameter verbessert (NN2). Mittels feature reduction erhielten wir NN3. Random forests (RF1) wurden durch angepasste Gewichtung der Einflussgrößen (RF2) und feature reduction (RF3) verbessert. Weiter betrachteten wir logistische Regression (LR), lineare Diskriminanzanalyse (LDA) und support vector machines (SVM). Zum Vergleich der Verfahren wurde die über 100 Durchläufe gemittelte area under the receiver operating curve (AUC) in einer Validierungskohorte verwendet.
Ergebnisse
Wir werteten Daten von 7.076 Koronarangiographien aus. In 2.075 Fällen (29.3 %) wurde eine obstruktive KHK diagnostiziert. Während des Nachverfolgungszeitraums (median [Q1; Q3] 2,4 [0,8; 6,3 Jahre]) starben 1.137 Patient:innen (16.1 %). Ein Vergleich der verschiedenen statistischen Verfahren findet sich in Tabelle 1. Zwar liefern im ersten Versuch random forests die besten Resultate, allerdings werden diese nach feature reduction von den neuronalen Netzen überholt.
Zusammenfassung und Ausblick
Wir haben fünf Verfahren verglichen, um mit Hilfe von EKGs und kardiovaskulären Risikofaktoren vor einer Koronarangiographie eine KHK und die Sterbewahrscheinlichkeit vorherzusagen. Meistens schnitten random forests am besten ab, gefolgt von neuronalen Netzen. Verschiedene Vorgehensweisen, um neuronale Netze und random forests zu verbessern waren erfolgreich, insbesondere die feature reduction. Letztere führte auch dazu, dass neuronale Netze random forests überholten. Weitere Verbesserungen erhoffen wir uns zum einen davon, neuronale Netze auf die EKG-Rohdaten anstatt auf die Charakteristika des MUSE-Algorithmus anzuwenden, und zum anderen davon, die Ergebnisse verschiedener Methoden des maschinellen Lernens zu kombinieren (model ensembling).