Die Studienkohorten umfassten 25.145 (linksatriale Dilatation) und 3.149 Personen (LVA), welche insgesamt 66.228 und 6.955 EKGs zur Studiendatenbank beisteuerten. Die Prävalenz der beiden Endpunkte im jeweiligen Testdatensatz lag bei 48,6 % (linksatriale Dilatation) sowie 38,1 % (LVA). Die Vorhersage beider Endpunkte gelang mit hoher Zuverlässigkeit, entsprechend einer area under the receiver operating characteristic curve (AUROC) von 0,779 für die Vorhersage einer linksatrialen Dilatation bzw. einer AUROC von 0,784 für die Vorhersage von LVA.
Bei der Fokussierung auf die Prädiktion einer schwergradigen strukturellen Veränderung des linken Vorhofs mit deutlicher Dilatation konnte eine noch höhere Vorhersagegenauigkeit des Modells demonstriert werden (AUROC 0,799 bei der Differenzierung ggü. aller anderen Subgruppen bzw. 0,871 für die Differenzierung ggü. einer normalen Größe des linken Vorhofs).
Im Rahmen von Subanalysen konnte gezeigt werden, dass bestimmte EKG-Merkmale wie das Vorhandensein einer Tachykardie (Herzfrequenz >100/min) sowie das Vorhandensein von Vorhofflimmern mit einer schlechteren Vorhersagekraft der Modelle für die untersuchten Endpunkte einhergingen. Dies lässt sich möglicherweise dadurch erklären, dass die P-Wellen die Bereiche des EKGs darstellten, die für die Vorhersage aller getesteten Modelle von besonderer Bedeutung waren, wie durch sekundäre Modellanalysen gezeigt werden konnte.
Ferner wurde untersucht, ob durch eine Übertragung des auf einer größeren Datenbasis trainierten Modells mit Methoden des transfer learnings eine Verbesserung der Modellgüte des Modells mit geringerer Datenverfügbarkeit (LVA) erreicht werden konnte. Dies gelang im konkreten Fall nicht. Ferner führte eine Kombination der Modellvorhersage mit unterschiedlichen klinischen Basisvariablen in ein gemeinsames Prädiktionsmodell nicht zu einer weiteren Verbesserung der diagnostischen Güte.