Apps adé, jetzt kommen die Bots!

Der App-Boom ist vorbei. Es gibt mittlerweile mehr als 4,2 Millionen von ihnen für Android und iOS, doch drei Viertel der amerikanischen Smartphone-Nutzer laden sich pro Monat noch so viele herunter: null. Die meisten Apps mögen gratis sein und einfach zu verstehen, doch nur wenige neue landen noch auf unseren Telefonen und Tablets. Eine Untersuchung des US-Marktforschungsinstituts comScore hat ergeben, dass wir auf unseren Smartphones überwiegend lediglich drei Apps benutzen.

Der durchschnittliche Amerikaner verbringt gar die Hälfte der Zeit, in der er oder sie sich mit dem Telefon beschäftigt, in nur einer einzigen App. Die beliebtesten sind natürlich Messaging-Apps. Und während also die halbe Welt auf WhatsApp, Facebook Messenger und WeChat starrt, haben Entwickler begonnen, diese früher mal simplen Chat-Apps allmählich in komplexe Ökosysteme zu verwandeln. Und im Zentrum dieser Veränderung steht eine Horde dienstbarer Bots.

Wir schreiben Freitag, den 7. Dezember 2018. Nach einer langen Arbeitswoche hast du gerade zu Hause deine Küche betreten. „Spiel Etta James“, sagst du und hörst im nächsten Moment die ersten Töne von At Last durchs Haus wehen. In deiner Hosentasche vibriert dein Telefon, auf seinem Touchscreen erscheint die Meldung: „Hin- und Rückflug nach Toronto jetzt nur 300 Euro. Soll ich buchen?“ – „Ja“, du bestätigst per Daumenabdruck, dass wirklich du das bist, der da bucht. Du suchst den Küchenschrank vergeblich nach Zutaten fürs Abendessen ab. Also nimmst du dein Smartphone wieder zur Hand und gibst zwei Emojis ein: Pizza, Wein. 20 Minuten später klingelt es an der Tür.

Zurück in die Gegenwart. Erinnere dich an deine letzte Interaktion mit einer Software oder App: Vermutlich hast du dabei eine Maus, eine physische Tastatur oder einen Touchscreen bedient. Das ist so, weil die Regeln zur Bedienung mit Software vor 30 Jahren festgelegt wurden. Die Software diktiert bis heute diese Regeln. Doch das wird sich nun ändern, dank der Bots. Auf chinesischen Chat-Plattformen, beim Kontakt zu Behörden in Singapur und bei sprachgesteuerten persönlichen Assistenten überall auf der Welt übernehmen Bots die Regie.

Zukünftige User-Interfaces werden nicht mehr auf skeuomorphistischen Designs basieren, also auf solchen, die bekannte Gegenstände aus der Dingwelt zitieren, oder auf komplizierten Menüführungen. Sie werden eine Gesprächssituation zur Grundlage haben. Ob nun bei Slack oder WeChat, Kik oder Facebook Messenger, Telegram oder Alexa: Bots werden künftig die Verbindung zwischen Mensch und Maschine sein.

„Darin liegt eine riesige Chance“, sagt Phil Libin, der ehemalige CEO von Evernote. „In den kommenden Jahren werden Bots überall eingesetzt werden.“ Libin, der heute Geschäftsführer des Venture-Capital-Fonds General Catalyst ist, arbeitet als Investor mit einer Reihe von Startups zusammen, die seiner Meinung nach Bots entwickeln, die für den allgemeinen Gebrauch taugen. Die Bots, für die sich Libin interessiert, sind keine intelligenten Assistenten, sondern erheblich simpler gestrickt.

Er nennt sie conversational interfaces und meint damit die Möglichkeiten, um nicht nur per Sprachsteuerung mit einer Software zu interagieren, sondern auch per Text, Emojis, Fotos oder Videos. „Man muss nicht erst lernen, mit diesen Schnittstellen umzugehen, man benutzt sie einfach“, sagt Libin. „Du bist mit einer Software in Kontakt, und die lässt dich tun, was du möchtest – ohne dass du dich durch einen Haufen von Optionen durchhangeln musst.“

Den Autor und Verleger Tim O’Reilly erinnert der Aufstieg der Bots an die frühen Tage des Computerzeitalters: „Wenn wir künftig conversational interfaces nutzen, kehren wir eigentlich zurück in die Welt der alten Computerbefehle“, sagt er. Deren Begrenztheit auf vorgegebene Kommandos machte sie unbrauchbar für komplexere Aufgabenstellungen. Doch gerade durch diese Beschränktheit ist die Eingabe von Befehlen noch immer die einfachste Art, mit einem Computer zu inter-agieren. „Man kann die lange Historie von User-Interfaces als eine Annäherung daran begreifen, was Maschinen in der Lage sind, zu begreifen, und wie sehr die Menschen den Maschinen dabei helfen müssen“, sagt O’Reilly. „Früher mussten Befehle eindeutig sein, heute ist das immer weniger nötig. Maschinen kommen nun auch mit schwammiger formulierten Befehlen zurecht.“

Die Definition dessen, was ein Bot ist, hängt davon ab, wen man fragt. Für manche Entwickler und Investoren muss ein Bot eine hoch entwickelte, mit künstlicher Intelligenz ausgestattete Schöpfung sein, die so ungefähr jede Art der Interaktion beherrscht. Andere betrachten Bots als absichtlich dumm gestaltete Schnittstellen, die nur eine begrenzte Anzahl von vorgegebenen Befehlen kapieren. Während Erstere es am liebsten hätten, dass Bots den Turing-Test bestehen und also mit Menschen ein Gespräch führen können, ohne dass der die Maschine dahinter erkennt, finden Letztere es völlig ausreichend, wenn ein Bot einem ein paar Optionen gibt: „Welche Pizza willst du? Drücke eins für Margherita, zwei für Diavolo, drei für Hawaii oder vier für Quattro Formaggi.“

Ich will mit Bots nicht wie mit Menschen reden, es soll besser sein

Tim O'Reilly

Für O’Reilly sollten Bots eher „einen kleinen Spritzer KI“ besitzen, als ganz auf künstlicher Intelligenz zu basieren. Betrachtet man Bot-Toolkits, so seien viele von ihnen in Wahrheit eigentlich nur smarte Programmierungen von Ja-Nein-Optionen. Libin stimmt dem zu: „In der öffentlichen Wahrnehmung existieren falsche Vorstellungen davon, wohin die Entwicklung geht“, sagt er. „Die weitverbreitetste ist vermutlich die, dass Bots wie Menschen reden sollten. Wenn ein Bot etwas für mich erledigen soll, will ich keine menschliche Interaktion mit ihm simulieren. Ich will mit Bots nicht wie mit lebenden Personen reden. Ich erwarte von Bots ein besseres Erlebnis.“

Eines von Libins Investments ist das in Growbot, einen Messaging-Bot, der Slack gezielt nach lobenden Aussagen durchsucht und Teilnehmer dazu auffordert, andere zu loben. „Der Bot nimmt an den Unterhaltungen dort teil und hilft dabei, ihnen Struktur zu geben und sie funktional zu gestalten“, sagt Libin. Wenn Growbot ein Lob aufspürt, merkt er sich das und gibt Vorgesetzten entsprechendes Feedback, welcher der Mitarbeiter was gesagt hat. Der Dienst wird bereits von mehr als 2000 Unternehmen benutzt, darunter etwa Starbucks. Slack, das besonders für firmeninterne Kommunikation benutzt wird, ist einer der Schrittmacher der Entwicklung. Erst im Juli hat das Unternehmen verkündet, es werde zwei Millionen Dollar in insgesamt 14 Startups stecken, die an Slack-Bots arbeiten.

Der Aufstieg von Slack seit seinem Launch im August 2013 ist rasant, der Dienst hat heute drei Millionen User täglich und 930 000 zahlende Abonnenten. „Wir haben bereits eine Reihe von Bots, die einzig in Slack existieren“, sagt April Underwood, die bei Slack Vice President of Product ist. Die Bots helfen Nutzern bei Dingen, die nicht zu ihrem eigentlichen Aufgabenbereich gehören, bei Reiseabrechnungen etwa oder dem Bestellen von Bürobedarf. Dabei dient Slack anderen längst als Vorbild. „Solche Eigenschaften werden auch die Grundlage für alle Microsoft-Plattformen bilden“, sagt O’Reilly. „Auf diese Weise wird man auf dem Computer zukünftig Handlungen einleiten – ob das nun in gesprochenen oder geschriebenen Unterhaltungen geschehen wird, macht keinen Unterschied.“

Das Entscheidende an den Bots auf Slack ist, dass sie simpel sind. Man sagt ihnen als Nutzer schlicht, was sie zu tun haben. „Man sollte sie nicht als Menschenersatz betrachten, sondern eher wie Nutztiere“, sagt Libin. „Ein Schäferhund ist übermenschlich gut in seinem Job, er hütet Schafe wesentlich besser, als ein Mensch es könnte. Aber schlau ist der Hund nicht.“

Da ist zum Beispiel Envoy, ein Slack-Bot, der Angestellten eine Nachricht schickt, wenn jemand sie im Büro besucht. Envoy erfüllt eine einfache Aufgabe auf einfache Weise, ohne dass die Mitarbeiter ein neues System erlernen müssten. „Wenn wir für alles solche Lösungen hätten“, sagt April Underwood, „würde sich unser Arbeitsalltag sehr viel angenehmer gestalten.“

Außerhalb von Betrieben und Büros besteht für Bots gar ein noch größeres Betätigungsfeld dafür, unseren Umgang mit Technologie zu verändern. „Viele Leute glauben, dass sie heute am Tag schon mehr Wörter tippen als sprechen“, sagt Sarah Guo von der Investmentfirma Greylock Partners. „Das ist ein grundsätzlicher Wandel: Ein Großteil unserer Kommunikation wird nun digital aufgezeichnet. Doch die meiste Software fängt mit den großen Datenmengen, die wir so produzieren, überhaupt nichts an. Stattdessen zwingt sie uns weiter dazu, Daten unnatürlich so einzugeben, wie es ihren Strukturen entspricht.“

Dabei interagieren wir alle bereits seit dem Jahr 1998 mit einem Bot – er heißt Google-Suche. Warum aber müssen wir, bloß, um eine Pizza zu bestellen, bis heute eine App herunterladen, einen Account einrichten und dann die Speisekarte danach absuchen, ob wir die Pizza auch extrascharf haben können?

Binnen von nur drei Monaten haben Facebook, Google und Microsoft nun im Jahr 2016 das Bot-Rennen der Großen ge-startet. Im März hat Microsoft seine Bot-Entwicklertools gelauncht; im April hat Facebook seine Entwicklerplattform für den Messenger angekündigt; und im Mai hat Google den Assistant präsentiert, einen neuen KI-Assistenten. Doch die drei laufen der Entwicklung schon hinterher. Chinesische Messaging-Plattformen, die auf keine app economy Rücksicht nehmen müssen, sind ihnen voraus.

Viele Leute glauben, dass sie heute am Tag schon mehr Wörter tippen als sprechen

Sarah Guo

Weixin, so der chinesische Name von WeChat, ermöglicht seinen derzeit 806 Millionen Benutzern so ungefähr alles: Sie können (außer bloß zu chatten) ein Taxi bestellen, sich für einen Flug einchecken, Konzertkarten kaufen, Wohltätigkeitsorganisationen etwas spenden und Games spielen – und das alles, ohne dass die Nutzer eine andere App als die von Weixin öffnen müssen. Bots sei Dank.

„Der Bot bildet nun die Verbindung zur Offline-Welt“, sagt Ted Livingston, der Gründer der Messaging-App Kik. „Mit anderen Worten: Weixin ist in China das Internet selbst.“ Kik ist eine Partnerschaft mit Weixin eingegangen und hat von dessen Besitzerunternehmen Tencent Kapital in Höhe von 50 Millionen Dollar erhalten. Damit ist Kik eine von mehreren westlichen Firmen, die derzeit von Chinas aufkeimender Bot-Ökonomie zu lernen versuchen.

Im April hat Kik seinen eigenen Bot-Store eröffnet, in dem sich bereits 20.000 Bots befinden, die unter anderem für CNN, Victoria’s Secret und H M ihren Dienst tun. Schon 1,8 Milliarden Messages sind so zwischen Menschen und Maschinen hin und her gewandert in der Chat-App. Bots geben Stilratschläge, helfen beim Finden der richtigen BH-Größe und verschicken Wetter-Updates. „Das Potenzial ist grenzenlos“, sagt Livingston. „Chat-Apps sind die neuen Browser, und Bots sind die neuen Websites.“ Livingston gibt aber zu, dass alles noch in den Kinderschuhen steckt. „Doch schon in den kommenden sechs bis zwölf Monaten wird der nächste Stoß von Bot-Ideen veröffentlicht“, sagt Phil Libin. „Sie werden gut durchdacht und designt sein – und man wird sie ernst nehmen müssen.“

Die derzeit verfügbaren Bots seien noch nur beschränkt einsetzbar, sagt auch Livingston, aber bessere Entwicklertools würden bald auch umfangreichere Möglichkeiten zulassen: „Bots sind heute in dem Zustand, in dem Browser vor 20 Jahren waren – da gab es nur einen Haufen bunten Text auf Websites, und nach und nach kamen dann Bilder dazu, Videos und weitere Elemente, die sich schnell bewegen. 15 Jahre später konnte man jede erdenkliche App in einem Browser bauen. Chat-Apps werden eine ähnliche Entwicklung nehmen.“

Damit Bots wirklich zu einer revolutionären Technologie werden können, brauchen sie jedoch ein riesiges back end. „Es wird große Cloud-Plattformen geben“, sagt O’Reilly, „die den nötigen Wissensschatz liefern werden.“ Und damit kommt dann der große Moment für Apples Siri, Googles Now und Microsofts Cortana – lauter Assistenten, bei denen riesige Summen in die Entwicklung von künstlicher Intelligenz und Spracherkennung gesteckt wurden. Die Datenmengen, die bereits von diesen Plattformen gesammelt wurden, könnten den Unterbau bilden für die conversational user interfaces, wenn sie sich in verschiedenen Technologien verbreiten.

„Wäre ich bei der Google Cloud Platform oder bei Cortana beschäftigt, würde ich mich fragen: ,Wie können wir jedes Gerät, das da draußen in der Welt existiert, zum Sprechen bringen?‘“, sagt O’Reilly. „Die big players werden auf ihren Plattformen viele Funktionen integrieren, und die werden besser und besser werden. Und dabei wird mehr und mehr KI eingesetzt werden. Es gibt ja bereits Azure Machine Learning und Google Cloud Machine Learning. Vieles von dem, was heute komplex erscheint, wird künftig auf diesen Plattformen gelöst werden.“

„Bots sind die neuen Apps“, so hat es Microsoft-CEO Satya Nadella im März 2016 formuliert. Von allen großen Tech-Firmen hat seine sich bislang am weitesten vorgewagt dabei, Bots fortzuentwickeln. Microsofts open-sourced Bot Builder ist ein Vabanquespiel, und doch könnte das Unternehmen mit ihm zum führenden Anbieter dessen werden, was O’Reilly den „Wissensschatz“ nennt. Was also verspricht sich Microsoft davon? Nun, wann immer ein Nutzer auf der Microsoft-Plattform mit einem Bot interagiert, und sei es auf Slack, dem Facebook Messenger oder sonst wo, wird Microsofts KI ein wenig klüger. „Je mehr Traffic wir in unser System kriegen, desto intelligenter wird es“, sagt Derrick Connell, der als Corporate Vice President bei Microsoft für Bing zuständig ist.

Die aktuelle Fixierung auf Bots hat bei Microsoft auch etwas mit einem Überraschungserfolg zu tun, den die Firma in China erzielt hat. Seitdem sie dort im Mai 2014 Xiaoice gestartet hat, ihren KI-angetriebenen Chatbot, haben 40 Millionen Menschen bereits mehr als 20 Milliarden Gespräche mit ihm geführt. „Wir haben uns vorab gefragt: Kann er sich mit einem menschlichen Wesen unterhalten?“, sagt Connell, der auch das Ingenieurteam führt, das den Bot steuert. Um seinen Erfolg messen zu können, ist ein entscheidendes Kriterium, wie lange der Bot die Unterhaltung mit Menschen am Laufen halten kann.

„Bei der ersten Version kamen wir auf zwölf Botschaften pro Wortwechsel. Drei Jahre später sind es durchschnittlich 23.“ Xiaoice lebt auf Weixin und kann unterdessen geschriebenen Text, gesprochene Sprache, Fotos und Videos prozessieren. Im Dezember 2015 hat die mittlerweile in ganz China bekannte weibliche Stimme des Bots morgens zum ersten Mal die Wettervorhersage beim Newskanal Dragon TV gesprochen, nun liest sie auch die Nachrichten vor.

Microsofts Experiment mit einem anderem Bot namens Tay war nicht ganz so erfolgreich. Tay basierte auf Xiaoice, er war dazu auserkoren, die Sprachmuster eines 19-jährigen amerikanischen Mädchens zu imitieren, und sollte auf Twitter mit Menschen interagieren. Am 23. März 2016 wurde Tay auf Twitter und die Menschheit losgelassen, doch innerhalb von nur einem Tag eignete sich der Bot die schlechte Seite der sozialen Medien an – seine Tweets waren eine üble Mischung aus rassistischen Ausfällen und sexuellen Gewaltfantasien. Zwei Tage später, nachdem mehr als 96.000 anstößige Tweets aus Tays Timeline gelöscht worden waren, nahm Microsoft ihn offline.

Das Unternehmen ließ sich davon aber nicht abschrecken und verkündete im Mai eine Partnerschaft mit den Behörden von Singapur, die zum Ziel hat, einen Bot für öffentliche Dienstleistungen zu entwickeln. „Er kann Fragen beantworten und nimmt Beschwerden auf“, sagt Connell. „Der Bot fungiert als behördlicher Vertreter des Staates Singapur.“

Im Westen gelang Amazon ein ähnlicher Achtungserfolg wie Microsoft in Asien. Das im November 2014 vorgestellte Audio-Gerät Amazon Echo benutzt den Sprachassistenten Alexa. Du willst Daft Punk hören? Dann sage: „Alexa, spiele Daft Punk.“ Du willst die Stoppuhr aktivieren, damit dir gesagt wird, wann dein Ei weich gekocht ist? Dann sage: „Alexa, setze den Timer auf vier Minuten.“ Du willst ein Taxi bestellen? Dann sage: „Alexa, rufe mir ein Taxi.“ Amazons Bot hört immer zu und versteht Befehle. Anders als Microsofts Xiaoice, der eine menschliche Interaktion simuliert, folgt das Konzept von Echo den gleichen „dummen“ Bot-Grundsätzen, wie Weixin sie anwendet: Alexa will nicht mit dir reden, Alexa wartet auf deine Befehle.

„Spracherkennung wird die Sache mehr verändern, als die Leute zunächst geglaubt haben“, sagt Tim O’Reilly. „Es gibt sie seit einer Weile schon bei Siri, Google Now und Anwendungen von Nuance, aber meiner Ansicht nach sind erst Alexa und Amazon Echo echte game changer.“ Das scheint Google auch so zu sehen. Im Mai 2016 kündigte es Home an, einen sprachgesteuerten Lautsprecher, der Amazon Echo irgendwie ähnelt.

Im Oktober 2009 hat Apple erstmals In-App-Käufe möglich gemacht. Für die Software-Industrie war das eine Veränderung, die bis heute nachwirkt. Laut der Marktforschungsfirma IDC wurden im Jahr 2015 mit Mobile-Apps rund 34,2 Milliarden Dollar umgesetzt. Das wirtschaftliche Potenzial von Bots könnte sogar noch größer sein. „Bots könnten ein vielversprechender Vertriebskanal für mobile Services werden“, sagt Sarah Guo. Es ist nicht nur so, dass Messaging-Apps eine riesige Benutzerschar besitzen, Bots sind auch viel günstiger in der Entwicklung als Apps.

„Der Fortschritt von einer gewöhnlichen zu einer hoch entwickelten Anwendung wird bei Bots schneller gehen, als das bei Apps der Fall war“, sagt April Underwood. Und Phil Libin hat nicht den geringsten Zweifel, wohin die Entwicklung geht: „Es wird 100 Millionen Bots geben, es wird wie beim App-Goldrausch sein, nur noch größer.“ Und so wie es bei Apps heute der Fall ist, werden auch die meisten der künftigen Bots eher nutzlos sein, glaubt Libin. „Aber die paar Hundert, die wirklich gut sein werden – die werden die Welt verändern.“

Dieser Artikel erschien zuerst in der Winterausgabe 2016 des WIRED-Magazins. Wenn ihr die Artikel aus unserem Heft als erste lesen wollt, könnt ihr hier WIRED-Member werden.

Teilen