Spracherkennungsprogramme halten selten was sie versprechen. Gesagtes verstehen sie oft falsch, das Vokabular lässt zu wünschen übrig und irgendwie hindern sie Kommunikation noch immer mehr, als sie zu vereinfachen. Die Lösung ist Deep Speech 2. Forscher der Universität Stanford haben zusammen mit dem chinesischen Unternehmen Baidu untersucht, ob das Spracherkennungsprogramm oder die Nutzer besser Nachrichten schreiben können. Das Ergebnis: Deep Speech 2 schreibt Nachrichten bis zu drei Mal schneller.
Das Programm schreibt nicht nur schneller, sondern macht auch weniger Fehler. Der relativ kleine Tester-Pool aus 32 Probanden bestand aus Neunzehn- bis Zweiundreizigjährigen, von denen 16 am Experiment in Mandarin und 16 in Englisch teilnahmen.
Obwohl alle laut eigenen Angaben sehr versiert im Verfassen von Nachrichten seien, tippte die Spracherkennung schneller und fehlerfreier. Ihre Fehlerquote war um 20,4 Prozentpunkte geringer als bei den US-amerikanischen Testpersonen und um 63,8 Prozentpunkte geringer als bei den chinesischen.
Die Software von Deep Speech 2 basiert auf einem neuralen Netzwerk, das mittels Maschinenlernen die Spracherkennung verbessert. Und das mit Erfolg. Die meisten Teilnehmer der Studie gaben an, Deep Speech 2 lieber benutzt zu haben, als zu tippen.
+++ Mehr von WIRED regelmäßig ins Postfach? Hier für den Newsletter anmelden +++
Bisher gibt es keine Pläne, das Spracherkennungsprogramm für alle zugänglich zu machen. Das chinesische Unternehmen Baidu, dem die Software gehört, will diese vorerst nur in seine chinesischen Apps einbauen.