Zur Abschätzung des Schlaganfallrisikos bei Vorhofflimmern-Patienten existieren mehrere Scores. In einer Analyse wurde nun die Vorhersagekraft unterschiedlicher Tools miteinander verglichen. Der CHA2DS2-VASc-Score schnitt dabei nicht am besten ab.
Zur Abschätzung des Schlaganfallrisikos bei Vorhofflimmern-Patienten existieren mehrere Scores. In einer Analyse wurde nun die Vorhersagekraft unterschiedlicher Tools miteinander verglichen. Der CHA2DS2-VASc-Score schnitt dabei nicht am besten ab.
Von Veronika Schlimpert
01.08.2022
Das Schlaganfallrisiko von Vorhofflimmern-Patienten wird in der Praxis üblicherweise mittels des CHA2DS2-VASc-Scores abgeschätzt, und daran die Indikation für eine orale Antikoagulation festgemacht. Das empfehlen auch die ESC-Leitlinien. Es existieren aber noch viele weitere Scores, die zur Beurteilung des Schlaganfallrisikos bei Vorhofflimmern-Patienten entwickelt worden sind. Könnte es unter denen einen geben, der das Risiko besser abschätzt als der CHA2DS2-VASc?
Das haben sich Wissenschaftlerinnen und Wissenschaftler der Universitätsklinik Leiden gefragt. Vera van der Endt und ihr Team durchforsteten die Literatur und identifizierten 19 Scores, die für die entsprechende Indikation entwickelt und validiert worden sind.
Von den 19 Scores schlossen die Autorinnen/Autoren die 10 am häufigsten in Studien validierten Risikomodelle in eine Random-Effects-Metaanalyse ein, um ihre Vorhersagekraft bzgl. des Schlaganfallrisikos im Rahmen einer externen Validierung miteinander zu vergleichen. Kalkuliert wurde die diskriminative Performance an insgesamt 6.267.728 an Vorhofflimmern erkrankten Patientinnen und Patienten und an 359.373 Ereignisse von ischämischen Schlaganfällen.
Diese Statistik offenbarte, dass der häufig verwendete, 2010 veröffentlichte CHA2DS2-VASc-Score nicht die beste Performance hinlegte. Als tendenziell zuverlässiger stellten sich die neueren, nach 2010 publizierten Scores wie der GARFIELD-AF heraus. Mit einer Ausnahme: Der modifizierte CHADS2 aus dem Jahr 2008 zeigte alles in allem die beste diskriminative Fähigkeit. Im folgenden sind die untersuchten Scores mit aufsteigendem Publikationsdatum und ihrer jeweils errechneten gepoolten C-Statistik aufgeführt:
Was heißt das nun für die Praxis? Sollten Ärztinnen und Ärzte zur Risikostratifizierung ihrer Vorhofflimmern-Patienten statt dem CHA2DS2-VASc-Score besser auf einen anderen Score zurückgreifen? Zu einem endgültigen Schluss können sich van der Endt und Kollegen nicht durchringen. „Neuere Risikoscores und Updates vorhandener Scores zeigten eine verbesserte Diskrimination und könnte daher für den Einsatz in der klinischen Praxis in Betracht gezogen werden“, lautet ihre vorsichtige Einschätzung.
Sie warnen aber vor voreiligen Schlüssen. Zum einen seien die gezeigten Unterschiede zwischen den Scores nur marginal, begründen sie ihre Zurückhaltung, und alle Scores hätten letztlich nur eine dürftige bis bestenfalls passable Performance hingelegt.
Zum anderen fehlten in den meisten Studien Angaben zur Kalibrierung („calibration“) der Modelle. Es wurden fast immer nur die diskriminativen Eigenschaften der Scores untersucht, also, wie gut das Modell zwischen Patienten mit hohem und solchen mit niedrigem Schlaganfallrisiko unterscheiden kann. Die Kalibrierung sagt wiederum aus, wie hoch das absolute Risiko eines Patienten am Ende tatsächlich ist, also wie gut das vorhergesagte mit dem beobachteten Risiko übereinstimmt. Diese Eigenschaft sei ein wichtiges Element in der Beurteilung von Risikoscores, machen die Autoren deutlich. Fehlen Daten zur Kalibrierung, kann die Anwendung eines Scores eine Über- und Untertherapie zur Folge haben (Beispielsweise kann ein Patient innerhalb einer Gruppe richtigerweise in eine hohe Risikogruppe fallen, sein absolutes Risiko für ein Ereignis kann aber trotzdem gering sein).
van der Endt V et al.: Comprehensive comparison of stroke risk score performance: a systematic review and meta-analysis among 6 267 728 patients with atrial fibrillation. Europace 2022; 00, 1–15