Brain-Computer-Interface für Sprache in Echtzeit
neues Brain-Computer-Interface (BCI) kann Gehirnaktivität einer Schlaganfall-Patientin mit minimaler Verzögerung und hoher Fehlerrate in Sprache übersetzen
Sprach-BCIs sollen künftig zum Beispiel Schlaganfallbetroffenen die Kommunikation erleichtern
Experten halten Studie nur für einen Machbarkeitsbeweis und weisen auf spezielle Art von Schlaganfall der Patientin und noch großen Verbesserungsbedarf des BCI hin
Brain-Computer-Interfaces (BCIs) könnten Menschen, die etwa nach einem Schlaganfall zunächst nicht mehr sprechen können, helfen, ihre Stimme wiederzuerlangen. In der Entwicklung solcher Technologien sei laut Forschenden der University of California in Berkeley nun ein entscheidender Fortschritt gelungen. Sie stellten in der Fachzeitschrift „Nature Neuroscience“ ihre Technologie vor (siehe Primärquelle). Sie soll es ermöglichen, die Gehirnaktivität einer Patientin im Bereich für Sprechbewegungen nahezu in Echtzeit sowohl in Sprache als auch in Text auszugeben.
Einstein Professor, Oberarzt und Leiter der Arbeitsgruppe Klinische Neurotechnologie, Charité – Universitätsmedizin Berlin
Technologische Neuheiten
„Die Studie zeigt ein sehr schnelles und flüssiges Dekodieren von Sprache aus Hirnaktivität mit einer Geschwindigkeit von durchschnittlich 47 Wörtern pro Minute. Während ähnliche Ansätze bereits existierten, ist hier die kontinuierliche Online-Umsetzung entscheidend. Es handelt sich weniger um eine konzeptionell neue Technologie als um eine technische Machbarkeitsdemonstration. Der Fortschritt liegt in der Echtzeitfähigkeit und der erhöhten Geschwindigkeit des Dekodierens.“
Aktuelle Fragen des Forschungsfeldes
„Es handelt sich um einen technischen Bericht. Klinisch relevante Fragen, insbesondere wer in welchem Maß von einem solchen System profitieren kann, werden nicht behandelt. Entscheidend wäre, den Nutzen bei Patienten zu untersuchen, die tatsächlich auf eine solche Technologie angewiesen sind, wie etwa Complete-Locked-in-Patienten – Personen, die bei vollem Bewusstsein keinen einzigen Muskel mehr willentlich bewegen können. Dennoch ist die technische Demonstration bemerkenswert.“
Patientengruppe, für die das BCI geeignet wäre
„Praktisch für alle Menschen, die nicht mehr sprechen oder an einer Konversation teilnehmen können. Die meisten Betroffenen haben jedoch schwerere Schlaganfälle erlitten als der in der Studie beschriebene Fall, oft mit Schädigungen der Großhirnrinde. Genau diese Patientengruppe wurde bislang nicht mit solchen Systemen untersucht.“
Anwendung bei anderen Hirnschädigungen
„Inwiefern die Anwendung auf andere Patienten übertragbar ist, bleibt unklar. Die Studie zeigt Erfolge bei einer Person mit intakter Großhirnrinde, was keine Aussage über Patienten mit kortikalen Läsionen (Schädigung der Hirnrinde; Anm. d. Red.), wie bei einer Aphasie (Unfähigkeit zu sprechen, hier wegen einer Schädigung der Hirnrinde; Anm. d. Red.), erlaubt. Interessant wäre eine Anwendung dieses Ansatzes für Patienten mit minimalem Bewusstseinszustand oder Locked-in-Syndrom, doch dazu gibt es noch keine Daten. Hier sind weiterführende Studien erforderlich.“
Limitationen der Technologie
„Die größte Limitation ist die Implantation selbst, die Risiken wie Blutungen oder Infektionen mit sich bringt. Zudem bleibt unklar, ob sich der klinische Nutzen gegenüber nicht-invasiven Methoden rechtfertigen lässt. Die langfristige Stabilität und Sicherheit sowie der Nutzen solcher Implantate im Alltag sind noch nicht ausreichend erforscht.“
Publikation von Einzelfällen
„Ein vollständigeres Bild wäre natürlich wünschenswert, insbesondere bei Studien, die von vornherein nicht als Einzelfalluntersuchungen angelegt sind. Die Tatsache, dass ein Einzelfall im Rahmen eines ‚Technischen Berichts‘ schon vor Beendigung der eigentlichen klinischen Studie publiziert wurde, ist nicht unüblich oder überraschend, und zeigt den hohen Publikationsdruck in der Wissenschaft. Große Teams sind auf möglichst viele und gut sichtbare Veröffentlichungen angewiesen, was allerdings auch zur Fragmentierung von Ergebnissen führt.“
Zukünftige klinische Studien
„Studien mit invasiven BCIs sollten sich vorrangig auf Menschen konzentrieren, die tatsächlich darauf angewiesen sind – etwa Complete-Locked-in-Patienten, wenn es um die Wiederherstellung von Kommunikation geht. Viele Forschungsgruppen meiden diese Patientengruppe jedoch aufgrund des hohen Risikos, zu scheitern. Der enorme Aufwand solcher Studien begünstigt Ansätze mit höherer Erfolgswahrscheinlichkeit. Zudem besteht die Sorge, dass ein Misserfolg nicht nur die allgemeine Begeisterung für BCIs, sondern auch das Investitionsinteresse von Venture-Capital-Gebern verringern könnte.“
Nächste Schritte
„Ein natürlicheres Sprachbild erfordert wahrscheinlich mehr Elektroden über einer größeren Fläche, um die Genauigkeit der Voraussage von Silben und Wörtern zu erhöhen. Eine Reduktion des Wortschatzes kombiniert mit KI-gestützter Kontextmodellierung könnte die Dekodierung stabiler und schneller machen. Da Hirnaktivität über die Zeit variiert, sind regelmäßige Rekalibrierungen nötig – Feedback-Mechanismen könnten hier helfen, relevante Netzwerke durch operante Konditionierung zu stabilisieren. Insgesamt bleibt die Herausforderung aber groß und es braucht weitere Forschung, auch zu nicht-invasiven Ansätzen, zum Beispiel mit Quantensensoren, deren Einsatz wir an der Charité erforschen.“
Professor Translationale Neurotechnologie, Technische Universität München (TUM)
Technologische Neuheiten
„Die vorliegende Studie hat zum Ziel, einer Schlaganfall-Patientin mittels einer implantierten Hirn-Computer-Schnittstelle wieder flüssiges Sprechen zu ermöglichen. Die Studie erprobt sozusagen das ‚Streamen‘ von Sprache. Die Autoren verwenden dazu Algorithmen des maschinellen Lernens (‚KI‘), die mit elektrischen Signalen aus der Hirnrinde für Sprechbewegungen (‚Sprech-Motorkortex‘) trainiert wurden. Das Neue an dieser Studie ist, dass die Dekodier-Algorithmen achtmal schneller als bislang funktionieren. Damit ist noch keine Rekonstruktion von Sprechsignalen in Echtzeit möglich – die aktuellen Latenzen betragen immer noch circa eine Sekunde –, aber es ist ein deutlicher Fortschritt in Richtung einer klinisch nutzbaren Neuroprothese für Sprechstörungen.“
Übertragbarkeit auf andere Schlaganfalltypen
„Wichtig ist, dass der Schlaganfall dieser Patientin eher untypisch ist. Der Schlaganfall hat einen Bereich im Hirnstamm beschädigt, der für das Ausführen von Sprechbewegungen zuständig ist, also den Sprechapparat kontrolliert. Die motorische Hirnrinde, die für die Planung der Sprechlaute sorgt und als übergeordnetes Zentrum mit dem Hirnstamm kommuniziert, ist durch den Schlaganfall nicht beschädigt worden. Daher hat diese Patientin eine Sprechstörung, aber keine Sprachstörung. Die große Mehrheit der Schlaganfallpatienten, die nach dem Infarkt Schwierigkeiten mit der Kommunikation haben, haben aber eine Sprachstörung (eine sogenannte Aphasie), die insbesondere aus einer Schädigung der Hirnrinde resultiert. Daher werden Neuroprothesen in der Art, wie sie die vorliegende Studie erprobt, leider nur für sehr wenige neurologische Patienten in Frage kommen. Es ist trotzdem ein ermutigender Fortschritt, der zeigt, dass man bislang nicht zu behandelnde Störungen des Sprechens möglicherweise zukünftig mit einer Hirn-Computer-Schnittstelle überbrücken kann.“
Limitationen der Studie
„Erstens hat die hier entwickelte KI noch eine ziemlich hohe Fehlerrate von etwa 50 bis 60 Prozent in der Rekonstruktion von einzelnen Wörtern. Das ist im Alltag noch nicht wirklich brauchbar. Zweitens ist die Dekodier-Latenz zwar deutlich kürzer als bislang, aber mit circa einer Sekunde immer noch um ein Vielfaches höher, als für eine flüssige zwischenmenschliche Kommunikation notwendig ist. Drittens sollte der Fokus der Forschung zukünftig auch auf ‚typische‘ Schlaganfallpatienten gelegt werden. Wir benötigen noch sehr viel Forschung dazu, wie Sprachstörungen, welche neben Lähmungen das eigentliche Hauptproblem für Schlaganfall-Patienten darstellen, behandelt werden können. Dazu muss man besser verstehen, wie Sprache (und nicht Sprechen, wie in der vorliegenden Studie) im Gehirn erzeugt wird.“
Publikation von Einzelfällen
„Ich sehe keinerlei Probleme darin, dass es sich hier um einen Einzelfallbericht handelt. Die Autoren der Studie berichten, dass die KI-Algorithmen sogar mit neuronalen Daten von anderen Patienten funktionierten. Natürlich werden wir zukünftig größere Fallzahlen zum Testen dieser Neurotechnologie brauchen, aber es gibt keinen prinzipiellen Grund, warum nicht jeder Patient mit normalen kognitiven Fähigkeiten und einer intakten Hirnrinde eine solche Technologie nutzen kann.“
Zukünftige klinische Studien
„Die größten Entwicklungsschritte müssen im Bereich der KI gegangen werden (also in der ‚Software‘). Die Messtechnologie (also die ‚Hardware‘) und die neurochirurgischen OP-Techniken sind jetzt schon gut genug, um klinisch bedeutende Ergebnisse zu erzielen, wie die vorliegende Studie zeigt. Bessere KI wird und muss dafür sorgen, dass die Fehlerrate weiter reduziert wird und die Rekonstruktion von Sprechlauten quasi in Echtzeit funktioniert, also mit noch kürzerer Latenz. Dann wird daraus ein richtiges Medizinprodukt.“
Leiter der Sektion Experimentelle Neurorehabilitation, Klinik für Paraplegiologie, Universitätsklinikum Heidelberg
Technologische Neuheiten
„Es gibt Erkrankungen wie Hirnstamminfarkte oder die Amyotrophe Lateralsklerose, die neben Lähmungen der Extremitäten auch zu Einschränkungen der Willkürkontrolle der für das Sprechen notwendigen Muskeln führen. Der Verlust der Sprache und die fehlende Möglichkeit, ihre Gedanken zu artikulieren, werden nicht nur von den Betroffenen selbst, sondern auch von deren persönlichen Umfeld als einschränkend empfunden. Seit einigen Jahren wird erforscht, wie man mit Elektrodensystemen, die auf das Gehirn aufgelegt oder in das für die Steuerung der Sprechmuskeln zuständigen Bereich der Gehirnrinde implantiert werden, eine Art Brücke zur Text- oder Sprachausgabe realisieren kann. Diese Systeme werden Sprach-Neuroprothesen genannt und haben aktuell das Problem, dass sie eine große Verzögerung zwischen den gedacht gesprochenen Wörtern und der Text- oder Sprachausgabe haben. Dies wird von den wenigen Nutzern solcher implantierten Sprachneuroprothesen, als wenig natürlich empfunden, was die Akzeptanz solcher Systeme sehr begrenzt. An diesem Punkt setzt die vorgestellte Arbeit an, indem hier neuartige, auf Künstlicher Intelligenz basierende Algorithmen verwendet werden, um die Umwandlung von Hirnsignalen in eine Text- und Sprachausgabe zu beschleunigen. Die Verzögerung liegt dabei mit ein bis zwei Sekunden in einem Bereich, der achtmal kürzer ist als bei vorherigen Studien. Darüber hinaus waren bisherige Ansätze noch auf zumindest teilweise erhaltene Sprachfunktionen für das Training der KI-Algorithmen angewiesen, was bei den hier eingesetzten Methoden nicht benötigt wird.“
Anwendung bei anderen Hirnschädigungen
„Die Technologie ist bei allen Patienten einsetzbar, bei denen der Teil des Motorkortex (Teil der Gehirnrinde, der für Bewegungen zuständig ist; Anm. d. Red.) noch erhalten ist, der die Befehle für die Kontrolle der Sprechmuskeln generiert, aber diese aufgrund einer Erkrankung von Nerven oder Muskeln nicht in einer koordinierten Sprache resultieren. Die häufigsten Erkrankungen sind Schlaganfälle, Amyotrophe Lateralsklerose (ALS) und auch infantile Zerebralparesen (Lähmungen durch eine Hirnschädigung von Neugeborenen; Anm. d. Red.). Bei den Schlaganfällen sind Anwendungsbereiche aber vor allem die selten vorkommenden Hirnstamminfarkte (von dem auch die Studienteilnehmerin betroffen ist) und nicht der ‚klassische‘ Schlaganfall, der in den meisten Fällen zu einer halbseitigen Schädigung des Motorkortex führt.“
Limitationen der Technologie
„Die in der Arbeit nachgewiesene Verbesserung der Erhöhung der Schnelligkeit bei der Erkennung von Wörtern geht mit einer hohen Fehlerrate bei der Erkennung der einzelnen Wörter einher. Aus einem Wortschatz von 1.024 Wörtern wurden bis zu 40 Prozent der Wörter nicht richtig erkannt, obwohl bereits eine Korrektur des Satzinhaltes anhand eines hinterlegten Sprachmodels erfolgte. Ein Teil der Untersuchungen, zum Beispiel die Erkennung, ob fälschlicherweise ein Sprachausgabe gestartet wird, wurden nicht unter Live-Bedingungen, sondern nach der Aufzeichnung von Daten unter Ruhebedingungen – offline – vorgenommen. Dies lässt nur begrenzte Aussagen für die tatsächliche Verwendung im Alltag zu, da die ganze Studie nur unter Laborbedingungen durchgeführt wurde.“
Limitationen der Studienmethodik
„Die aus meiner Sicht größte Unzulänglichkeit der Studie ist, dass die Autoren die Nutzerin nicht nach ihren Eindrücken bei der Benutzung des Systems befragt haben. Sprache und verbale Kommunikation können nur bedingt durch objektive Zahlen repräsentiert werden, sondern stellen eine hochemotionale Komponente unseres zwischenmenschlichen Zusammenlebens dar. Hierzu wäre es unbedingt notwendig gewesen, die Nutzerin hinsichtlich ihrer Einschätzung zur Gebrauchstauglichkeit und Effektivität, aber auch zu möglicher Stigmatisierung und Frustration zu befragen. Bei einer Einzelfallstudie sollten solche Befragungen inzwischen Standard sein.“
Publikation von Einzelfällen
„Die Studie hat mit der Rekrutierung bereits 2018 begonnen, die Patientin wurde aber erst 2022 eingeschlossen. Die Arbeit enthält keine Informationen darüber, wie viele mögliche Studienpatienten angesprochen wurden und aus welchen Gründen diese dann doch nicht eingeschlossen wurden. Insofern ist vollkommen offen, inwieweit die Ergebnisse dieser Einzelfallstudie auf andere Patienten und Erkrankungen übertragen werden können. Eigentlich war geplant, mit dem Hirnimplantat einen Computer beziehungsweise einen Roboterarm zu steuern, die Anwendung mit der Sprachgenerierung wurde erst später hinzugenommen. Auch wurde die Patientengruppe zu einem späteren Zeitpunkt erweitert. All dies lässt auf erhebliche Rekrutierungsprobleme schließen. Es wäre sehr lehrreich gewesen, die Ablehnungsgründe von angesprochenen Patienten zu erfahren.“
Zukünftige klinische Studien
„Zum zweifelsfreien Nachweis der Möglichkeiten des Systems müssen deutlich mehr Patienten - mindestens zehn - mit unterschiedlichen Lähmungsursachen eingeschlossen werden und diese vor allem über einen längeren Zeitraum beobachtet werden. Hier macht es aber der Gesetzgeber speziell universitär Forschenden aus dem nicht-industriellen Umfeld mit sehr zeit- und ressourcenaufwändigen Vorgaben fast unmöglich, solche aufwändigen Studien mit implantierten Medizinprodukten in einem frühen Entwicklungsstand durchzuführen.“
Nächste Schritte
„Die Dekodierung von Sprachbefehlen aus Hirnsignalen erfordert eine hohe Rechenleistung, die aktuell nur von Rechnern in einer Laborumgebung erbracht werden können. Darüber hinaus unterliegen Hirnsignale einer gewissen Schwankung, die tagesformabhängig ist. Allgemeine Ermüdung oder Erschöpfung verschlechtert die Signalqualität erheblich. Es ist nicht klar, wie häufig die Algorithmen an die veränderten Rahmenbedingungen angepasst werden müssen und wie lange so ein Training dauert und wie zuverlässig dann die Sprachausgabe ist. Eine kurze Verzögerung vom Gedanken bis zur Sprachausgabe ist das Eine - Was aber wenn die Gedanken nicht richtig interpretiert werden und einfach falsche Wörter gesprochen werden? Wird im Alltag eine häufige Korrektur vom Umfeld akzeptiert oder wird man als Betroffener immer zurückhaltender, überhaupt etwas zu sagen? All diese Erfahrungen können nur in echten Alltagsanwendungen gewonnen werden, die erfahrungsgemäß hinsichtlich der Gebrauchstauglichkeit ganz neue Problemfelder offenlegen. Allerdings muss auch klar gesagt werden, dass es bei Menschen mit schweren Lähmungen und fehlenden Möglichkeiten zur Computerbedienung nur wenige Alternativen zu einer implantierten Sprachneuroprothese gibt.“
„Interessenkonflikte bestehen keine.“
„Ich habe keine Interessenkonflikte.“
„Ich habe keine Interessenkonflikte.“
Primärquelle
Littlejohn KT et al. (2025): A streaming brain-to-voice neuroprosthesis to restore naturalistic communication. Nature Neuroscience. DOI: 10.1038/s41593-025-01905-6.
Literaturstellen, die vom SMC zitiert wurden
[I] Metzger SL et al. (2023): A high-performance neuroprosthesis for speech decoding and avatar control. Nature. DOI: 10.1038/s41586-024-07735-z.
[II] Angrick M et al. (2024): Online speech synthesis using a chronically implanted brain–computer interface in an individual with ALS. Scientific Reports. DOI: 10.1038/s41598-024-60277-2.
[III] ClinicalTrials.gov: ECoG BMI for Motor and Speech Control (BRAVO).
Prof. Dr. Surjo R. Soekadar
Einstein Professor, Oberarzt und Leiter der Arbeitsgruppe Klinische Neurotechnologie, Charité – Universitätsmedizin Berlin
Angaben zu möglichen Interessenkonflikten
„Interessenkonflikte bestehen keine.“
Prof. Dr. Simon Jacob
Professor Translationale Neurotechnologie, Technische Universität München (TUM)
Angaben zu möglichen Interessenkonflikten
„Ich habe keine Interessenkonflikte.“
Prof. Dr. Rüdiger Rupp
Leiter der Sektion Experimentelle Neurorehabilitation, Klinik für Paraplegiologie, Universitätsklinikum Heidelberg
Angaben zu möglichen Interessenkonflikten
„Ich habe keine Interessenkonflikte.“