Pathophysiologisch führen pulmonale und systemische Volumenüberladung zu Veränderungen der Stimmlippen‑Biomechanik und der oberen Atemwegsakustik, die sich in charakteristischen Stimmsignaturen manifestieren können. Querschnittsanalysen haben bereits gezeigt, dass akute dekompensierte von rekompensierten Herzinsuffizienzstadien anhand akustischer Merkmale unterschieden werden können, wobei der gehaltene /i/‑Vokal in englisch‑ und deutschsprachigen Kohorten das beste Signal‑zu‑Rausch‑Verhältnis aufwies. Vor diesem Hintergrund prüfte TIM‑HF3 die Hypothese, dass longitudinales Voice‑Monitoring HF‑Hospitalisationen im ambulanten Setting prospektiv vorhersagen kann.
TIM‑HF3 ist eine prospektive, multizentrische, beobachtende Studie, an der 3 deutsche Zentren mit einer Nachbeobachtung von mindestens 12 Monaten bis zu einem festen Stoppdatum teilnahmen. Eingeschlossen wurden 105 Patientinnen und Patienten mit chronischer Herzinsuffizienz (NYHA II–III) und mindestens einer HF‑Hospitalisation innerhalb der letzten 12 Monate, die im Rahmen eines etablierten telemedizinischen Programms bereits ein interventionales Remote Patient Monitoring (RPM) erhielten (einschließlich täglicher Gewichtsmessung, Blutdruck, EKG und Symptomabfrage), das bei Auffälligkeiten zu einer arztgeführten Tagesbewertung führte. Zusätzlich wurden wöchentliche Sprachaufnahmen des 5‑sekündigen gehaltenen /i/‑Vokals via Tablet erhoben, jedoch während der Studie nicht an das telemedizinische Zentrum zurückgespielt, sodass die Voice‑Daten rein beobachtend und retrospektiv analysiert wurden.
Für die Voice‑Analyse wurden sogenannte openSMILE‑basierte ComparE2016‑Akustikfeatures extrahiert, in ein XGBoost‑Modell mit Alter und Geschlecht als Kovariaten eingespeist, ein Patienten-dynamischer Schwellenwert (Standardabweichung vom individuellen Baseline‑Signal) verwendet und eine Leave‑one‑patient‑out‑Kreuzvalidierung implementiert. Aufnahmen innerhalb von 4 Wochen vor einer HF‑Hospitalisation dienten als „congested“‑Trainingslabel.
Von 105 eingeschlossenen Personen konnten 92 mit mindestens einer auswertbaren Voice‑Aufnahme in die Analyse aufgenommen werden. Die Kohorte war im Mittel im höheren Lebensalter, wies eine gemischte LVEF‑Verteilung mit Anteilen an HFrEF, HFmrEF und HFpEF auf und zeigte eine relevante Komorbiditätslast mit hoher Prävalenz von koronarer Herzerkrankung, Diabetes mellitus und chronischer Niereninsuffizienz. Die Nachbeobachtungsdauer lag im Median bei rund 10 Monaten mit insgesamt 44 HF‑Hospitalisationen; die wöchentliche Adhärenz für Voice‑Aufnahmen betrug knapp 70 %, die tägliche Adhärenz für Gewichtsmessungen über 80 %.
Für die primäre Endpunktanalyse konnten 25 von 44 HF‑Hospitalisationen berücksichtigt werden, für die mindestens 2 Voice‑Aufnahmen außerhalb des 30‑Tage‑Prä‑Event‑Fensters und mindestens eine Aufnahme innerhalb der 30 Tage vor dem Ereignis vorlagen. In dieser per‑Protocol‑Kohorte erreichte der Voice‑Algorithmus eine Sensitivität von 84,0 % (21/25 Ereignisse; 95%KI [65,3; 93,6]) für die Detektion einer HF‑Hospitalisation, definiert als mindestens ein Alarm im 30‑Tage‑Prä‑Event‑Fenster. Zum Vergleich zeigte das Gewichts-basierte Alarmsystem (≥2 kg in 3 Tagen oder ≥5 kg in 7 Tagen) eine Sensitivität von 36,0 % (9/25 Ereignisse; 95%KI [20,2; 55,5]) für dieselben Ereignisse.
Bei den sekundären Endpunkten lag die mediane Alert‑to‑Event‑Zeit beim Voice‑Algorithmus bei 29 Tagen (IQR 17–76), während Gewichts-basierte Alarme median 13 Tage (IQR 8–22) vor der Hospitalisation auftraten. Die Rate unerklärter Alarme pro Person und Jahr war mit 2,62 im Voice‑System niedriger als die 6,07 unerklärten Alarme pro Person und Jahr im Gewichtsmonitoring.
In der Überlappungsanalyse wurden 14 von 25 Hospitalisationen (56 %) ausschließlich durch Voice‑Alarme detektiert, 2 Ereignisse (8 %) ausschließlich durch Gewichtsalarme, und insgesamt 23 von 25 Ereignissen (92 %) durch mindestens eines der beiden Systeme, während 2 Ereignisse (8 %) von beiden Modalitäten verfehlt wurden.
Limitationen: Die Voice-Analyse erfolgte retrospektiv, und nur 25 von 44 Hospitalisationen konnten in die Analyse einbezogen werden (per-protocol Kohorte).
TIM‑HF3 zeigte, dass KI‑gestütztes Voice‑Monitoring eine höhere Sensitivität und einen längeren Vorlauf zur Detektion bevorstehender HF‑Hospitalisationen bietet als Gewichts-basierte Standard‑Telemonitoring‑Algorithmen, bei gleichzeitig geringerer Rate an „false positives“ im Sinne unerklärter Alarme. Der Ansatz nutzt pathophysiologisch plausibel Volumenstatus‑bedingte Veränderungen der Stimmakustik und lässt sich technisch mit handelsüblichen Tablets und etablierter Feature‑Extraktion implementieren. Angesichts des beobachtenden Designs, der per‑Protocol‑Analyse von 25 aus 44 Ereignissen sind die Ergebnisse jedoch als hypothesengenerierend zu interpretieren. Ein prospektives, randomisiertes Interventions‑Design, in dem Voice‑Alarme in die klinische Entscheidungsfindung einfließen, ist der notwendige nächste Schritt, um den Einfluss dieses digitalen Biomarkers auf „hard endpoints“ und gesundheitsökonomische Parameter zu belegen.
Die TIM‑HF3‑Daten unterstreichen, dass klassische Gewichtsschwellen den bevorstehenden Dekompensationsprozess häufig erst spät und mit hoher Fehlalarmrate abbilden, während stimmakustische Signale eine frühere und offenbar sensitivere Markierung des Übergangs von kompensierter zu überlasteter Hämodynamik ermöglichen. Besonders klinisch relevant erscheint der hohe Anteil an Ereignissen, die ausschließlich durch Voice‑Alarme erfasst wurden, da gerade diese Patientinnen und Patienten mit einem reinen Gewichtsmonitoring unerkannt geblieben wären. Für die Praxis eröffnen Voice‑Biomarker Perspektiven einer niedrigschwelligen, sprachbasierten Telemonitoring‑Erweiterung, deren Implementierung aber zwingend in kontrollierten Endpunktstudien mit klar definierten Interventionsalgorithmen und Kosten‑Nutzen‑Analysen geprüft werden muss.
Zur Übersichtsseite Heart Failure 2026