/Gadgets

Was müssen smarte Assistenten tun, damit wir sie lieben lernen?

Dominik Schönleben 14.08.2017 Lesezeit 8 Min

Derzeit sind Sprachassistenten noch ziemlich dumm. Das könnte sich ändern, wenn sie sich zu echten Künstlichen Intelligenzen weiterentwickeln. Kann mehr aus ihnen werden als nur ein Hype?

„Paradigmenwechsel gibt es etwa alle zehn Jahre“, sagt Siri-Erfinder Adam Cheyer. In den 80ern veränderte der Desktop-Computer das Verhältnis von Mensch und Maschine. Dann in den 90ern kam das Internet mit dem Browser und brachte erneut alles durcheinander. Schließlich tauchte das iPhone auf. Per Touchsteuerung, App-Store und mobilem Internet machte es das Telefon zur wichtigsten Schnittstelle zwischen analoger und virtueller Welt. „Das iPhone feiert dieses Jahr seinen zehnten Geburtstag,“ sagt Cheyer. „Wir stehen also erneut vor einem Wechsel.“


Was aber kommt nach dem Smartphone? Cheyer ist sich sicher, bereits die Antwort zu kennen: Sprachassistenten. Also Künstliche Intelligenzen, die mit dem Menschen sprechen und ihm seine Wünsche automatisch erfüllen. Ohne lästiges Tippen in Suchfenstern, ohne Scrollen durch Apps und Menüs. Die Künstliche Intelligenz (KI) hat alle Details im Griff.


Die erste Generation dieser Helfer gibt es längst zu kaufen. Im Oktober 2016 brachte Amazon seinen Assistenten Alexa in Form eines Lautsprechers auf den deutschen Markt. Anfang August reichte Google mit Home ein ähnliches Gerät nach. Und von Apple wird der Siri-Speaker HomePod Anfang 2018 erwartet. KI-Alleskönner sind diese Geräte noch lange nicht. Sie starten Spotify-Playlisten, schalten das Licht ein, lesen das Wetter und die Nachrichten vor oder machen sich als teurer Küchenwecker nützlich. Noch, denn sie werden mehr zu tun bekommen.


Smarte Assistenten haben noch keinen großen Fortschritt gemacht

Adam Cheyer, Siri-Erfinder

Obwohl Apple mit Siri den ersten Assistenten hatte – damals noch auf dem iPhone 4s – hinkt das Unternehmen bei dieser Entwicklung hinterher. Cheyer verließ bereits kurz nach der Veröffentlichung von Siri das Unternehmen. 2012 gründete er das Unternehmen Six Five Labs. Er wollte mit VIV einen Assistenten bauen, der mehr können soll – der eine echte Künstliche Intelligenz darstellen soll. „Smarte Assistenten haben noch keinen großen Fortschritt gemacht und es ist eine Herausforderung“, sagt Cheyer. Damit sie wirklich schlau werden, müssten sie lernen, sich neue Fähigkeiten selbst beizubringen. Müssen zu komplexen KI-Systemen werden, die selbsständig Aufgaben meistern. Zu einer Software wie AlphaGo von Google, die sich beibringen kann, Go besser als jeder Mensch auf der Welt zu spielen. Das Problem: Der menschliche Alltag ist für einen Computer viel schwerer zu durchschauen als Go.

Bisher muss jeder neue Trick, jeder neue Befehl von Hand geschrieben werden. Das verschlingt Unmengen von Ressourcen. Weil sich Amazon und Google dabei von anderen Entwicklern helfen ließen, zogen deren Systeme dann auch an Apple vorbei. Erst Mitte vergangenen Jahres öffnete Apple schließlich auch Siri. Egal aber wie viel dieser Arbeit outgesourced wird, es bleiben Grenzen – es wird immer den Moment geben, an dem ein Sprachassistent sagt: „Dabei kann ich leider nicht helfen.“


Welcher Sprachassistent kann die meisten Wissensfragen beantworten?

Cheyers ehemaliger Siri-Kollege Babak Hodjat sieht das ähnlich. Auch er glaubt, dass Assistenten zu KIs werden müssen. Hodjat entwickelte die Spracherkennungssoftware von Siri. Heute ist er CEO der KI-Firma Sentient Technologies. Wenn ein Computer die natürliche Sprache verstehe, dann hätten die Menschen hohe Erwartungen, sagt Hodjat: „Über die menschliche Intelligenz hinaus. Die KI soll Unmögliches vollbringen.“

Noch ist etwa die Forderung absurd, dass ein solcher Sprachassistent einen ganzen Urlaub plant oder einen Abend im Kino, inklusive Reservierung und Anreise. Erst eine richtige Künstliche Intelligenz könnte das. Ihr müsste man nicht die Struktur jeder Website oder Ticket-App einzeln beibringen, sondern sie würde sich den Prozess einfach selbst erschließen. Wenn der Moment kommt, an dem Assistenten so etwas gelingt, dann würde der von Cheyer prophezeite Paradigmenwechsel einsetzen. Assistenten würden innerhalb kürzester Zeit die meisten alltäglichen Interaktionen zwischen Mensch und Computer einfach erlernen und von alleine klüger werden.

Weil diese Zukunft noch etwas weiter weg ist – das geben Cheyer und Hodjat zu – müssen sich die Assistenten jetzt erst einmal anderweitig nützlich machen. Was sie schnell lernen können: die Kontrolle über das eigene Smarthome. Denn viele Hersteller von solchen Gadgets haben ein Problem: Die Kunden sind von den vielen konkurrierenden Systemen und Apps überfordert.


Firmen wie Nest, Bosch oder Nespresso hätten ein Interesse daran, dass sich all ihre Haushaltsgeräte mit den gängigen Assistenten unterhalten können, sagt Simon Bryant, Experte für Heimelektronik bei der Marktanalysefirma Futuresource: „Es ist viel einfacher für Unternehmen, wenn sie sagen können, dass sie mit einem Assistenten kompatibel sind. Das verstehen Konsumenten.“ Im Zentrum des Smarthomes stehen also bald Google Home, Amazon Alexa oder Siri. Einen Kaffee brüht man dann nicht mehr über die Nespresso-App, sondern per Zuruf.

Der Markt für Sprachassistenten ist groß. Laut Analysen von Futuresource besteht der Audio-Markt bereits zu 30 Prozent aus Lautsprechern mit eingebauten Assistenten. 3,4 Millionen solcher Gadgets wurden im ersten Quartal 2017 verkauft. „Der Enthusiasmus auf solch einem neuen Markt ist stets hoch“, sagt Bryant. „Er wird vom Reiz des Neuen getrieben.“


Welcher Assistent hat den größten Marktanteil? Gerechnet auf die Zahl der Geräte, auf denen er vorinstalliert ist.

In 44 Prozent der bisher ausgelieferten Geräte ist der Assistent von Amazon verbaut. Die meisten werden derzeit noch in den USA und Großbritannien verkauft. Der Grund dafür: Die großen Hersteller entwickeln ihre Software zuerst in Englisch. Ein Assistent kann nicht einfach so in eine neue Sprache übersetzt werden. In jedem Land braucht der Assistent ein eigenes Team aus Redakteuren, die seine Texte schreiben.

Vor allem in Schwellenländern könnten Assistenten zum Erfolg werden. Bereits jetzt zeigt sich, dass die von den Tech-Firmen sogenannte „nächste Milliarde Menschen“, die bald online gehen werden, gar nicht lesen und schreiben können. Anstatt Textnachrichten zu verschicken, senden diese Nutzer dann Sprachnachrichten. Ein smarter Assistent wäre vermutlich ihr präferiertes Interface, um einen Flug zu buchen oder eine App herunterzuladen.


Sprachassistenten könnten einer einzigen Firma die Möglichkeit geben, den gesamten Markt zu beeinflussen

Futuresource, Marktanalysefirma

Wenn Sprachassistenten so erfolgreich werden, wie die Experten glauben, dann laufen Hotelbuchungen oder Bestellungen in Zukunft zuerst über den Google Assistenten, Alexa oder Siri ab. Diese großen Unternehmen können also ihre Ökosysteme weiter ausbauen. Nicht mehr was auf der ersten Seite der Google-Suchergebnisse steht, wird über den Erfolg eines Angebots entscheiden, sondern, ob der Assistent es kennt oder nicht. „Sprachassistenten könnten einer einzigen Firma die Möglichkeit geben, den gesamten Markt zu beeinflussen“, schreibt Futuresource in seiner Analyse.

Um nicht abgehängt zu werden, wollen immer mehr Unternehmen ihren eigenen Assistenten etablieren. Microsoft hat Cortana in Windows 10 sowie die Xbox integriert und Samsung kaufte 2016 die Firma von Siri-Erfinder Cheyer. Vermutlich, um so die bisherigen Misserfolge mit dem selbst entwickelten Assistenten S-Voice abzufangen. Bisher gibt es noch keine fertige KI von Cheyer und einen smarten Samsung-Speaker wird es laut aktuellen Gerüchten in naher Zukunft wohl auch nicht geben. Aber die Liste der Unternehmen mit eigenen Ambitionen ist lang: Baidu und JD.com aus China, Orange aus Frankreich und die South Korean Telecom, um nur die Größten zu nennen. Selbst Facebooks Chatbot-System könnte als ein erster Schritt in Richtung Smart Assistant gesehen werden.

Bisher nutzen die meisten Anwender nur wenige Funktionen ihrer Geräte, so sagt Analyst Bryant: „Die Konsumenten verwenden Sprachassistenten, um Musik oder Radio zu hören und um nach dem Wetter zu fragen.“ Neue Funktionen benutzen sie meist nur, wenn sie das Gerät gerade gekauft haben. Danach aber nie wieder.


Wenn mein Echo wie ein kleiner Androide aussieht, dann fällt es mir leichter, ihn zu akzeptieren

Babak Hodjat, CEO von Sentient Technologies

Damit Sprachassistenten sich wirklich durchsetzen, müssen vier Bedingungen erfüllt sein, sagt Cheyler: „Nutzer wollen einen einzigen Assistenten, den es auf jedem Gerät gibt, der mit jedem Dienst zurechtkommt und alles persönlich für den Nutzer zuschneidet.“ Sie müssen also immer verfügbar und leicht zu benutzen sein. Erst dann wird ihr Siegeszug kommen. „Assistenten werden in der Bildung, im Gesundheitswesen, im Bauwesen und in Unternehmen eingesetzt werden“, sagt Cheyer.

Doch es könnte noch eine fünfte Bedingung geben, die so ein Super-Assistent vorher erfüllen muss. Vor allem in Deutschland haben viele Menschen Sorge um ihre Privatsphäre. Ein Gadget von Google, Amazon oder Apple, das immer mitlauscht, ist da besonders problematisch. Die Lösung dafür hat KI-Experte Hodjat: Sprachassistenten müssen menschlicher werden. „Wenn mein Echo Augen hat und wie ein kleiner Androide aussieht, dann fällt es mir leichter, ihn zu akzeptieren.“ Es sei dann plötzlich nicht mehr so schlimm, wenn der kleine Roboter-Buddy ein stets aktives Mikrofon hat. Denn die Menschen könnten zu ihm ja ein Vertrauensverhältnis aufbauen, so wie sie es bei einem Haustier tun. Der Furby steht also vielleicht kurz vor seinem großen Comeback. Anstatt „Hihi, Gabo Gabo“ wird er dann „Das habe ich leider nicht verstanden“ krähen.

Dieses Gadget wurde von uns als eines der besten Gadgets 2017 ausgewählt. Die ganze Liste findet ihr hier.