KI-basierte Vokalanalyse als Biomarker

Heart Failure 2026 | TIM HF3: In der prospektiven, multizentrischen Studie wurde ein KI‑basierter Voice‑Biomarker zur prädiktiven Erkennung von Herzinsuffizienz‑Hospitalisationen (HFH) bei ambulanten Herzinsuffizienz-Patientinnen und Patienten evaluiert. Die Daten wurden von Dr. Leonhard Riehle (Noah Labs, Berlin) vorgestellt.¹

Prof. Birgit Aßmus (Universitätsklinikum Gießen) berichtet und kommentiert.

Von:

Prof. Birgit Aßmus

Rubrikleiterin Herzinsuffizienz

11.05.2026

Bildquelle (Bild oben): CasualClicks / Shutterstock.com

Hintergrund und Studiendesign

Pathophysiologisch führen pulmonale und systemische Volumenüberladung zu Veränderungen der Stimmlippen‑Biomechanik und der oberen Atemwegsakustik, die sich in charakteristischen Stimmsignaturen manifestieren können. Querschnittsanalysen haben bereits gezeigt, dass akute dekompensierte von rekompensierten Herzinsuffizienzstadien anhand akustischer Merkmale unterschieden werden können, wobei der gehaltene /i/‑Vokal in englisch‑ und deutschsprachigen Kohorten das beste Signal‑zu‑Rausch‑Verhältnis aufwies. Vor diesem Hintergrund prüfte TIM‑HF3 die Hypothese, dass longitudinales Voice‑Monitoring HF‑Hospitalisationen im ambulanten Setting prospektiv vorhersagen kann.

TIM‑HF3 ist eine prospektive, multizentrische, beobachtende Studie, an der 3 deutsche Zentren mit einer Nachbeobachtung von mindestens 12 Monaten bis zu einem festen Stoppdatum teilnahmen. Eingeschlossen wurden 105 Patientinnen und Patienten mit chronischer Herzinsuffizienz (NYHA II–III) und mindestens einer HF‑Hospitalisation innerhalb der letzten 12 Monate, die im Rahmen eines etablierten telemedizinischen Programms bereits ein interventionales Remote Patient Monitoring (RPM) erhielten (einschließlich täglicher Gewichtsmessung, Blutdruck, EKG und Symptomabfrage), das bei Auffälligkeiten zu einer arztgeführten Tagesbewertung führte. Zusätzlich wurden wöchentliche Sprachaufnahmen des 5‑sekündigen gehaltenen /i/‑Vokals via Tablet erhoben, jedoch während der Studie nicht an das telemedizinische Zentrum zurückgespielt, sodass die Voice‑Daten rein beobachtend und retrospektiv analysiert wurden.

Für die Voice‑Analyse wurden sogenannte openSMILE‑basierte ComparE2016‑Akustikfeatures extrahiert, in ein XGBoost‑Modell mit Alter und Geschlecht als Kovariaten eingespeist, ein Patienten-dynamischer Schwellenwert (Standardabweichung vom individuellen Baseline‑Signal) verwendet und eine Leave‑one‑patient‑out‑Kreuzvalidierung implementiert. Aufnahmen innerhalb von 4 Wochen vor einer HF‑Hospitalisation dienten als „congested“‑Trainingslabel.

Ergebnisse

Von 105 eingeschlossenen Personen konnten 92 mit mindestens einer auswertbaren Voice‑Aufnahme in die Analyse aufgenommen werden. Die Kohorte war im Mittel im höheren Lebensalter, wies eine gemischte LVEF‑Verteilung mit Anteilen an HFrEF, HFmrEF und HFpEF auf und zeigte eine relevante Komorbiditätslast mit hoher Prävalenz von koronarer Herzerkrankung, Diabetes mellitus und chronischer Niereninsuffizienz. Die Nachbeobachtungsdauer lag im Median bei rund 10 Monaten mit insgesamt 44 HF‑Hospitalisationen; die wöchentliche Adhärenz für Voice‑Aufnahmen betrug knapp 70 %, die tägliche Adhärenz für Gewichtsmessungen über 80 %.

Für die primäre Endpunktanalyse konnten 25 von 44 HF‑Hospitalisationen berücksichtigt werden, für die mindestens 2 Voice‑Aufnahmen außerhalb des 30‑Tage‑Prä‑Event‑Fensters und mindestens eine Aufnahme innerhalb der 30 Tage vor dem Ereignis vorlagen. In dieser per‑Protocol‑Kohorte erreichte der Voice‑Algorithmus eine Sensitivität von 84,0 % (21/25 Ereignisse; 95%KI [65,3; 93,6]) für die Detektion einer HF‑Hospitalisation, definiert als mindestens ein Alarm im 30‑Tage‑Prä‑Event‑Fenster. Zum Vergleich zeigte das Gewichts-basierte Alarmsystem (≥2 kg in 3 Tagen oder ≥5 kg in 7 Tagen) eine Sensitivität von 36,0 % (9/25 Ereignisse; 95%KI [20,2; 55,5]) für dieselben Ereignisse.

Bei den sekundären Endpunkten lag die mediane Alert‑to‑Event‑Zeit beim Voice‑Algorithmus bei 29 Tagen (IQR 17–76), während Gewichts-basierte Alarme median 13 Tage (IQR 8–22) vor der Hospitalisation auftraten. Die Rate unerklärter Alarme pro Person und Jahr war mit 2,62 im Voice‑System niedriger als die 6,07 unerklärten Alarme pro Person und Jahr im Gewichtsmonitoring.

In der Überlappungsanalyse wurden 14 von 25 Hospitalisationen (56 %) ausschließlich durch Voice‑Alarme detektiert, 2 Ereignisse (8 %) ausschließlich durch Gewichtsalarme, und insgesamt 23 von 25 Ereignissen (92 %) durch mindestens eines der beiden Systeme, während 2 Ereignisse (8 %) von beiden Modalitäten verfehlt wurden.

Limitationen: Die Voice-Analyse erfolgte retrospektiv, und nur 25 von 44 Hospitalisationen konnten in die Analyse einbezogen werden (per-protocol Kohorte).

Fazit

TIM‑HF3 zeigte, dass KI‑gestütztes Voice‑Monitoring eine höhere Sensitivität und einen längeren Vorlauf zur Detektion bevorstehender HF‑Hospitalisationen bietet als Gewichts-basierte Standard‑Telemonitoring‑Algorithmen, bei gleichzeitig geringerer Rate an „false positives“ im Sinne unerklärter Alarme. Der Ansatz nutzt pathophysiologisch plausibel Volumenstatus‑bedingte Veränderungen der Stimmakustik und lässt sich technisch mit handelsüblichen Tablets und etablierter Feature‑Extraktion implementieren. Angesichts des beobachtenden Designs, der per‑Protocol‑Analyse von 25 aus 44 Ereignissen sind die Ergebnisse jedoch als hypothesengenerierend zu interpretieren. Ein prospektives, randomisiertes Interventions‑Design, in dem Voice‑Alarme in die klinische Entscheidungsfindung einfließen, ist der notwendige nächste Schritt, um den Einfluss dieses digitalen Biomarkers auf „hard endpoints“ und gesundheitsökonomische Parameter zu belegen.

Kommentar

Die TIM‑HF3‑Daten unterstreichen, dass klassische Gewichtsschwellen den bevorstehenden Dekompensationsprozess häufig erst spät und mit hoher Fehlalarmrate abbilden, während stimmakustische Signale eine frühere und offenbar sensitivere Markierung des Übergangs von kompensierter zu überlasteter Hämodynamik ermöglichen. Besonders klinisch relevant erscheint der hohe Anteil an Ereignissen, die ausschließlich durch Voice‑Alarme erfasst wurden, da gerade diese Patientinnen und Patienten mit einem reinen Gewichtsmonitoring unerkannt geblieben wären. Für die Praxis eröffnen Voice‑Biomarker Perspektiven einer niedrigschwelligen, sprachbasierten Telemonitoring‑Erweiterung, deren Implementierung aber zwingend in kontrollierten Endpunktstudien mit klar definierten Interventionsalgorithmen und Kosten‑Nutzen‑Analysen geprüft werden muss.

Zur Person

Prof. Birgit Aßmus

Prof. Birgit Aßmus ist leitende Oberärztin und W3-Professorin in der Klinik für Kardiologie und Angiologie am Universitätsklinikum Gießen (UKGM) sowie an der Kerckhoff-Klinik in Bad Nauheim. Ihre Forschungsschwerpunkte umfassen u. a. Telemedizin sowie evidenzbasierte Versorgungsoptimierung und Pathophysiologie bei Herzinsuffizienz.

Key Facts der Studie

Prospektive, multizentrische Studie zur Evaluierung eines KI‑basierten Voice‑Biomarkers zur prädiktiven Erkennung von Herzinsuffizienz‑Hospitalisationen (HFH).

Der Voice‑Algorithmus detektierte HF‑Hospitalisationen deutlich sensitiver (84 % vs. 36 %) und früher (Median 29 vs. 13 Tage) als tägliche Gewichtskontrollen, bei gleichzeitig geringerer Rate unerklärter Alarme.

Diese Daten zeigen das Potenzial von Stimm-basierter KI-Analyse als vielversprechende Ergänzung der Herzinsuffizienz-Telemonitoring‑Infrastruktur. Vor der Implementation in die klinische Praxis sind allerdings kontrollierte Endpunktstudien mit klar definierten Interventionsalgorithmen und Kosten‑Nutzen‑Analysen nötig.

Referenzen

Riehle L et al. TIM-HF3: voice-based prediction of HF hospitalization. Late-breaking science: Innovations in heart failure management, 09.05., Barcelona, HFA 2026

Zur Übersichtsseite Heart Failure 2026

KI-basierte Vokalanalyse als Biomarker

Hintergrund und Studiendesign

Ergebnisse

Fazit

Kommentar

Prof. Birgit Aßmus

Key Facts der Studie

Referenzen

Das könnte Sie auch interessieren

Erhöhte hsCRP-Werte auch bei HFrEF?

Eplontersen bei ATTR-CM

Dosisabhängige Effekte von Aficamten und Metoprolol bei HOCM

Starke Unterstützung*

KI-basierte Vokalanalyse als Biomarker

Hintergrund und Studiendesign

Ergebnisse

Fazit

Kommentar

Prof. Birgit Aßmus

Key Facts der Studie

Was war das Ziel der Studie?

Was waren die wichtigsten Ergebnisse?

Was ist das Fazit für die Praxis?

Referenzen

Das könnte Sie auch interessieren

Erhöhte hsCRP-Werte auch bei HFrEF?

Eplontersen bei ATTR-CM

Dosisabhängige Effekte von Aficamten und Metoprolol bei HOCM

Starke Unterstützung*