
„Metas KI kann Gedanken mit 80-prozentiger Genauigkeit lesen“, titelten die Online-Medien „futurezone.at“ und „MSN Microsoft News“. Ähnliche Schlagzeilen produzierten zahlreiche englischsprachige Nachrichtenportale, darunter „squaredtech.co“ und techdogs.com. Manche davon erwähnten später im Text, dass es sich um eine „bis zu 80-prozentige Genauigkeit“ handeln würde. Sie alle berufen sich auf eine Studie mit 35 Teilnehmerinnen und Teilnehmern, die in Zusammenarbeit von Meta, dem Konzern hinter Facebook, und dem Baskischen Zentrum für Kognition, Gehirn und Sprache durchgeführt wurde.
Die Technologie dekodiert Signale, die mittels Elektro- (EEG) oder Magnetoenzephalographie (MEG) generiert werden, während die Teilnehmerinnen und Teilnehmer verschiedene Sätze auf einer Tastatur eintippen. Wenn es gelingt, die Sätze anhand der Signale zu rekonstruieren, entspricht das einer Art „Gedankenlesen“ durch die Künstliche Intelligenz (KI) von Meta – wenngleich nur unter stark einschränkenden Laborbedingungen.
Dazu mussten sich die Probandinnen und Probanden in einem magnetisch abgeschirmten Raum an einen überdimensionierten Stuhl anschließen lassen, der ihre Gehirnströme messen konnte. Sie bekamen Wort für Wort kurze Sätze eingeblendet, die sie sich merken sollten; danach wurden sie durch ein visuelles Signal aufgefordert, den Satz in eine handelsübliche Tastatur einzutippen. Im Anschluss wurde verglichen, wie viel Prozent der Buchstaben von der KI richtig vorhergesagt wurden. Brain2Qwerty dekodiert dazu einerseits die motorischen Signale, die vom Gehirn gesendet werden, um die Fingerbewegungen auf der Tastatur auszulösen. Dazu kann man ausnutzen, dass bestimmte Buchstaben aufgrund ihrer Positionierung eher mit der rechten Hand, andere eher mit der linken Hand getippt werden. Fehler beim Dekodieren passieren oft, weil benachbarte Tasten von der Dekodierungs-Technologie verwechselt werden. Im Anschluss verknüpft die KI die dekodierten Buchstabenfolgen mit einem großen Sprachmodell (Large Language Model, LLM), um sicherzustellen, dass die vorhergesagten Wörter existieren und in ihrer Abfolge plausibel sind. Damit können Tippfehler von der KI korrigiert werden.
Von einer 80-prozentigen Gesamtgenauigkeit ist die KI (noch) weit entfernt
Nach einer Trainingsphase, in der die Technologie die Verbindung von Signalen und getippten Buchstaben erlernte, sollten neue, der KI unbekannte Sätze vorhergesagt werden. In den besten Einzelfällen konnte die KI 81 Prozent der empfangenen Signale richtig vorhersagen, in den schlechtesten hingegen nur 29 Prozent. Im Schnitt konnte die KI nicht – wie die Schlagzeilen suggerieren – 80 Prozent, sondern lediglich 68 Prozent der mittels MEG empfangenen Signale richtig vorhersagen; bei Verwendung von EEG waren es lediglich 33 Prozent. Von einer 80-prozentigen Genauigkeit insgesamt, also nicht nur in Ausnahmefällen, ist die Technologie also noch weit entfernt.
Nichtsdestotrotz sind das beachtliche Ergebnisse, die weit besser sind als bloßes Raten von Buchstaben. Insbesondere mit der Verbindung mit dem LLM hat man verglichen mit früheren Dekodierungs-Technologien – die schon seit knapp zehn Jahren existieren – einen großen Fortschritt erreicht. Derartige KI-Systeme könnten beispielsweise zukünftig Patienten helfen, die ihre Fähigkeit zu sprechen oder zu tippen verloren haben, aber sich Wörter noch Buchstabe für Buchstabe vorstellen und diese gedanklich auf einer Tastatur lokalisieren können. Aber es hat wenig mit dem zu tun, was wir üblicherweise unter „Gedankenlesen“ verstehen. Insbesondere „versteht“ die KI nicht den Sinn des Gedachten.
Der Zeitpunkt, an dem KI Ihre Gedanken lesen kann, liegt deshalb sicher noch ein ganzes Stück in der Zukunft. Gleichwohl könnte es gut sein, dass dieser Moment früher eintritt als derjenige, an dem Tech-Journalistinnen und -Journalisten solche Studien richtig lesen und interpretieren können.
Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“ finden Sie im Internet unter www.unstatistik.de und unter dem Twitter-Account @unstatistik. Unstatistik-Autorin Katharina Schüller ist zudem Mit-Initiatorin der „Data Literacy Charta“, die sich für eine umfassende Vermittlung von Datenkompetenzen einsetzt. Die Charta ist unterwww.data-literacy-charta.deabrufbar.
Weiterführende Literatur: „Grüne fahren SUV und Joggen macht unsterblich – Über Risiken und Nebenwirkungen der Unstatistik“, das zweite Unstatistik-Buch (ISBN 9783593516080), erhältlich im Buchhandel zum Preis von 22 Euro. Es wurde im Oktober 2023 mit dem „getAbstract-International Book Award 2023“ in der Kategorie Business Impact ausgezeichnet. Das Unternehmen getAbstract hat sich auf die Zusammenfassungen von Wirtschaftsbüchern und Klassikern der Weltliteratur spezialisiert und vergibt seine Awards jährlich im Rahmen der Frankfurter Buchmesse. Speziell mit der Bewertung von Risiken beschäftigt sich das Buch „Risiko: Wie man die richtigen Entscheidungen trifft“von Unstatistik-Autor Prof. Dr. Gerd Gigerenzer.
Quelle: rwi