/Blockchain

Dieser Mann will Amazons Alexa zerstören – mit einem Sprachassistenten, der eure Privatsphäre schützt

Achim Fehrenbach 04.12.2018 Lesezeit 13 Min

Rand Hindi, der Chef und Co-Gründer des Start-ups Snips, verfolgt ehrgeizige Ziele. Mit dem Snips-Sprachassistenten, der keine Cloud braucht und keine Nutzerdaten abgreift, will er den Google Assistant und Amazons Alexa angreifen. Heute Nachmittag wird er auf der Tech-Konferenz Slush in Helsinki seine Visionen für die Zukunft der Sprachsteuerung vorstellen. Mit WIRED sprach er schon vorher.

Für Rand Hindi sind die Sprachassistenten von Google und Amazon das Ergebnis von 20 Jahren mit einer falschen Einstellung zu Datenschutz und Privatsphäre. Er ist geschockt, dass sich Millionen von Menschen ein ständig mithörendes Gerät von einem der größten Konzerne der Welt freiwillig in ihr Wohnzimmer stellen. Und er sieht im Interview mit WIRED nur eine Lösung dafür: Technik, die genau so gut funktioniert wie die datenhungrigen Dienste der Internetkonzerne, aber die Privatsphäre der Nutzer achtet. Genau daran arbeitet sein Start-up Snips mit Sitz in Paris und New York.

WIRED: Mr. Hindi, Sie sind ein scharfer Kritiker von Sprachassistenten wie Alexa oder Google Home. Was stimmt mit denen nicht?

Rand Hindi: An Sprachassistenten sind drei Gruppen von Akteuren beteiligt. Erstens sind da die Konsumenten, also die Leute, die deine Systeme nutzen. Konsumenten, die diese Geräte nutzen, genießen überhaupt keine Privatsphäre. Wann immer du mit Alexa, Google Home oder einem anderen Assistenten sprichst, werden deine Stimme und alles, wonach du fragst, in die Cloud übertragen und von der Firma aufgezeichnet, die den Service anbietet. Darüber hinaus gibt es die Entwickler, die Apps für diese Sprachassistenten programmiert haben. Auch sie füttern die Firma mit Daten – und müssen dafür oft auch noch Gebühren zahlen. Schließlich gibt es auch noch die Firmen, die diese Sprachassistenten in ihre eigene Hardware integrieren - und ebenfalls Daten an die Firma mit dem Sprachassistenten übermitteln. Wenn Amazon also Alexa pusht, dann geht es der Firma nicht wirklich um die Nützlichkeit der Anwendung, sondern um Daten.

WIRED: Sie wollen den ersten „ethischen“ Sprachassistenten erschaffen. Was verstehen Sie darunter?
Hindi: Für Snips stehen Privatsphäre und Datenschutz seit jeher im Mittelpunkt. Wir haben die Firma auf der Idee aufgebaut, dass sich Privatsphäre mit Künstlicher Intelligenz verknüpfen lässt. Wir haben die erste Technologie für Sprachassistenten erschaffen, die nicht auf die Verarbeitung von Sprachdaten in der Cloud angewiesen ist – denn alles wird lokal auf dem Gerät verarbeitet, mit dem man spricht. Wir garantieren den Konsumenten also privacy by design – niemand kann mithören, über was man spricht. Als Entwickler muss man nicht befürchten, dass jemand anders die Daten der Nutzer abgreift. Und als Gerätehersteller integriert man Snips. Das Gerät arbeitet dann nicht nur offline. Man hat auch die komplette Kontrolle über die User und ihre Daten – denn niemand anders erhält Zugang.

WIRED: Das klingt vielversprechend. Wie funktioniert es technisch?
Hindi: Die Technologie, die wir nutzen, ähnelt sehr stark der von anderen Sprachassistenten. Der große Unterschied zwischen Snips und Alexa ist, dass Snips keine Nutzerdaten für kommerzielle Zwecke sammelt. Wir haben ein ganz anderes Geschäftsmodell: Wir verkaufen Lizenzen für unsere Technologie an Firmen, die diese in ihr Gerät integrieren. Man merkt also gar nicht mal unbedingt, wenn man unsere Technologie nutzt, weil es noch keinen Sprachassistenten der Marke Snips für Verbraucher gibt. Unsere Technologie basiert auf Deep Learning. Da gibt es unterschiedliche Modelle – je nachdem, an welchem Punkt der Sprachverarbeitungs-Pipeline man sich befindet. Wenn man zum Beispiel Weckworte wie „Hey, Snips“ oder „Hey, Jarvis“ erkennen will, braucht man dafür ein spezielles Deep-Learning-Modell. Weitere Modelle gibt es für die Sprache und dafür, die eigentlichen Nutzerfragen zu verstehen. Wir erschaffen den Code und die Technologie, mit deren Hilfe die Stimme übersetzt wird. Die Antworten auf die User-Fragen sind allerdings komplett den Entwicklern überlassen. Das hängt davon ab, in welches Produkt Snips integriert wird. Es ist nicht unsere Aufgabe zu entscheiden, was geantwortet wird. Wir kümmern uns darum, dass die Fragen der Nutzer verstanden werden.

Für uns geht es bei der Blockchain nicht um Geld.

Rand Hindi

WIRED: Für die Sprachverarbeitung nutzt Snips keine Cloud. Wie funktioniert es stattdessen?
Hindi: Viele Leute sind der Meinung, dass man die Leistung der Cloud braucht, um Sprachdaten effektiv zu verarbeiten und Deep Learning zu nutzen. Wir erreichen jedoch die Leistung der neuesten Sprachassistenten mit Cloud-Anbindung und übertrumpfen sie sogar, indem wir alles lokal auf dem jeweiligen Gerät berechnen – und zwar mit einem Bruchteil der sonst nötigen Hardware-Leistung. Im Prinzip können wir einen kompletten Sprachassistenten, der alles kann, was andere Sprachassistenten auch können, auf einem Raspberry Pi laufen lassen. Wir sprechen hier von rund 100 MB RAM, also einer sehr niedrigen Rechenleistung. So weit ich das überblicken kann, schafft das außer uns niemand.

WIRED: Ich dachte immer, einer der Vorteile der Cloud wären die ständigen Updates...
Hindi: Sie haben Recht. Einer der Vorteile der Cloud ist, dass man ein Modell ständig updaten und mit den Nutzerdaten verbessern kann. Rein technisch ist das Update der Software genauso einfach wie das Update einer App auf dem Smartphone. Kniffliger ist allerdings, ein Modell mit Nutzerdaten zu updaten. Denn wie lässt sich die Qualität des Sprachassistenten verbessern, ohne auf Nutzerdaten zuzugreifen? Das klingt ein bisschen paradox. Wir arbeiten gerade an einer neuen Technologie, die Federated Learning mit Multi-Party Computation verbindet. Die Idee dabei ist, dass man ein neurales Netzwerk ganz ordentlich trainieren kann, indem man ausschließlich verschlüsselte Nutzerdaten verwendet. Technisch gesehen gibt es dabei kein Problem mehr mit der Privatsphäre – selbst dann nicht, wenn das Machine-Learning-Modell verbessert wird. Den die Nutzer schicken auch dann keine Daten an die Server.

WIRED: Sie planen den Einsatz von Blockchain-Technologie. Welche Rolle spielt die bei Ihnen?
Hindi: Für uns geht es bei der Blockchain nicht um Geld. Viele Leute denken beim Thema „Blockchain“ an Kryptowährung. Ich finde, das ist eine falsche Sichtweise. Mit Tokens in der Blockchain lassen sich Anreize für Leute schaffen, auf Gemeinwohlebene zusammenzuarbeiten. Es geht gewissermaßen um die Schaffung von dezentralen, autonomen Communities. Bei Snips wollen wir die Blockchain für zwei Dinge nutzen. Erstens für das dezentrale Machine Learning, über das ich vorhin gesprochen habe. Denn man muss Nutzer dafür belohnen, dass sie verschlüsselte Daten beitragen. Aber man muss Computern im Netzwerk auch einen Anreiz schaffen, diese Daten zu verarbeiten. Die Blockchain ist dafür sehr gut geeignet. Die zentralisierten App Stores, die es momentan gibt, haben eine ganze Reihe größerer Probleme. Entweder EINE Firma betreibt den App Store, überprüft jede App und entscheidet, wer leben darf und wer sterben muss. Daraus entsteht eine Diktatur bei Inhalten – im Grunde wie bei Apple. Oder aber man hat offene Marktplätze und App Stores, in denen jeder seine Apps veröffentlichen kann, deren Qualität dann aber meist sehr niedrig ist, weil es keine durchgängige Bewertung usw. gibt. Wir wollen dieses Problem lösen, indem wir einen mit Tokens kuratierten App Store schaffen. Die Idee dahinter ist: Niemand gehört der App Store. Er ist im Wesentlichen dezentral. Indem sie ein Token nutzt, kann die Community sich selbst organisieren und den Inhalt des App Stores überprüfen – und so sicherstellen, dass die Qualität der Apps hoch bleibt.

WIRED: Was garantiert, dass die Entwickler hochqualitative Apps beisteuern?
Hindi: Das Grundprinzip ist sehr einfach, es nennt sich „Staking“. Staking ist so etwas wie eine Kaution. Wenn man als Entwickler eine Anwendung im App Store veröffentlichen will, muss man Tokens als Kaution hinterlegen. Wenn die Community die Anwendung als schlecht einstuft, kann sie deine Kaution konfiszieren. Die Veröffentlichung schlechter Apps wird also finanziell bestraft – und genau deshalb funktioniert diese Community-Kuratierung. Genau deshalb finde ich die Blockchain so interessant. Bitcoin ist mir wirklich egal. Mich interessieren Tokens als Kitt der Community. Und Geld, um Leute in die richtige Richtung zu stupsen.

WIRED: In einem anderen Interview haben Sie gesagt, dass Sie „Technik verschwinden lassen“ wollen. Wie das?
Hindi: Das ist eine übergeordnete Vision – nicht nur eine von Snips. Es geht darum, wie wir über Technik denken sollten. Momentan bedeutet es sehr viel Aufwand, Technik zu nutzen. Erst lernt man mit ihr umzugehen, dann muss man Knöpfe drücken... man muss einfach sehr viel ganz bewusst tun, wenn man möchte, dass eine Maschine etwas für uns leistet. Folglich muss sehr viel Hirnschmalz in den Technikgebrauch investiert werden – und es ist sehr schwierig, sie zu ignorieren, denn du hast sie gewissermaßen die ganze Zeit vor Augen. Wir glauben aber, dass Künstliche Intelligenz die Schaffung von natürlichen, intuitiven Interfaces mit Maschinen ermöglichen wird – über Sprache, Blicke etc.. Dinge also, die man als Mensch intuitiv nutzt. Dahin wollen wir mit allen vernetzten Geräten kommen, die um uns herum sind. Wir wollen TVs, Kühlschränke, Smartphone und Lautsprecher so einfach nutzbar machen, dass man gar nicht mehr merkt, dass sie da sind.

Alexa ist ein geschlossenes Ökosystem, das einer Diktatur gleicht.

Rand Hindi

WIRED: Warum ist Privatsphäre für den technologischen Fortschritt so wichtig?
Hindi: Dafür gibt es zwei Gründe. Erstens: Wenn Leute Technik vergessen wollen, müssen sie sich bei deren Nutzung sicher fühlen. Und je mehr Daten die Geräte aufzeichnen, desto größer wird das Risiko, dass dein Leben gehackt wird und jemand die Daten gegen dich verwendet. Deshalb ist es für die Menschen sehr schwierig, Technik zu vergessen, und sie müssen häufig daran denken, was mit ihren Daten in den Backends passiert. Vor allen Dingen ist Privatsphäre also das Gefühl, in den eigenen vier Wänden sicher zu sein. Der zweite Grund ist etwas subtiler: Ich glaube, dass das Fehlen von Privatsphäre grundsätzlich zu einem Mangel an Freiheit führt. Denn je mehr die Firmen über dich wissen, desto genauer ist das Profil, das sie von dir erstellen können. Und je genauer das Profil ist, desto mehr können sie dich zu einem bestimmten Verhalten drängen, ohne dass du es überhaupt bemerkst. Online-Werbung ist ein gutes Beispiel dafür. Oft kaufst du letztlich Dinge, nach denen du gar nicht gesucht hast, und von Firmen, die dir völlig egal sind. Die meisten Menschen haben noch nicht einmal das Geld für diesen Kauf. Für mich ist das ein großes Thema. Denn je weniger Daten aus deinem Leben du den Firmen gibst, desto weniger können sie dich ins Visier nehmen und manipulieren. In manchen Fällen ist es noch schlimmer. Denken Sie nur an Cambridge Analytica und Facebook. Cambridge Analytica hat politische Ansichten mit den gleichen Targeting-Methoden manipuliert, mit denen andere Leute Konsumgüter verkaufen. So weit ist es schon gekommen!

WIRED: Sagen Sie deshalb, dass Alexa „zerstört“ werden muss?
Hindi: Nun ja, ich bin gerne ein bisschen provokant (lacht). Aber es geht nicht nur um Alexa. Ich finde, dass die Menschen ihre Haltung zu Privatsphäre und Daten grundsätzlich ändern müssen. Alexa ist für mich aber eine der schlimmsten Sachen: Sie verkörpert 20 Jahre einer falschen Einstellung. Alexa ist ein geschlossenes Ökosystem, das einer Diktatur gleicht, das in nie gekannter Weise auf deine Daten zugreift – all das mit dem Ziel, dir mehr Dinge zu verkaufen, die du nicht brauchst. Irgendwie haben uns 20 Jahre technologischer Fortschritt an einen Punkt gebracht, an dem wir ein Mikrofon in unser Wohnzimmer stellen, das mit der größten Firma der Welt verbunden ist. Und nebenbei bemerkt: Dieses Mikrofon ist nicht nur für dich persönlich da. Es ist ein Spion, der potenziell jeden im Haus aufnimmt, ob das nun deine Kinder oder deine Freunde sind. Haben sie dem zugestimmt? Das bezweifle ich doch stark!

WIRED: Das klingt nach Big Brother...
Hindi: Ich finde das so falsch. Und ich glaube, die Leute fühlen, dass es falsch ist. Sie haben nur einfach keine Wahl. Ich glaube, dass Komfort immer Privatsphäre schlagen wird. Wir müssen uns darüber klar sein: Wenn das Produkt gut ist und die Leute es mögen, werden sie es auch benutzen – ohne Rücksicht auf ihre Privatsphäre. Ich selbst bin zwar ein großer Befürworter von Privatsphäre, nutze aber Facebook, weil das für mich der beste Weg ist, mit meinem Netzwerk zu kommunizieren. Und ich habe keine Wahl, es gibt keine Alternative. Dennoch glaube ich, dass sich gerade ein großer Wandel darin vollzieht, wie wichtig Privatsphäre genommen wird. Das bedeutet: Wenn die Menschen eine Alternative haben, die genauso gut funktioniert, die genau das Gleiche leistet, dann werden sie wechseln. Und die kürzlich verabschiedete Datenschutz-Grundverordnung ist dafür extrem wichtig, weil sie uns die Möglichkeit gibt, unsere Daten mitzunehmen. Wenn die Leute also erst einmal von Alexa zu Snips wechseln – sobald wir ein Produkt für Endverbraucher haben –, dann werden sie ihre Alexa-Daten mitnehmen können. Und haben dann einen neuen Sprachassistenten, der genauso gut ist wie der, den sie ursprünglich verwendet haben. Das ist eine große Sache, denn es gibt Menschen die Möglichkeit, reibungslos zu wechseln. Von einer Firma, mit der sie nicht länger arbeiten wollen, hin zu einer Firma, die mehr ihren Wertvorstellungen entspricht.

WIRED: Kommen wir noch einmal zum Geschäftsmodell von Snips. Bitte beschreiben Sie das genauer.
Hindi: Unser Geschäftsmodell ist sehr einfach. Wir verkaufen Sprachtechnologie als White-Label-Lösung. Erstausrüster, die Sprachsteuerung zu ihren Geräten hinzufügen möchten, können dafür unsere Technologie nutzen. Momentan ist Snips kein Sprachassistent für Endkonsumenten, sondern eher eine Sprachplattform, die Firmen in ihren Konsumprodukte integrieren können. Pro Gerät erheben wir eine Lizenzgebühr, das übliche Lizenzmodell bei Software. Darüber hinaus bieten wir auch eine Developer Suite. Für Entwickler, die Snips nicht kommerziell nutzen, ist es komplett kostenlos. Im ersten Jahr, in dem wir Snips mit Werkzeugen für die Community geöffnet haben, ist diese von 0 auf 18.000 Entwickler gewachsen. Völlig organisch und ohne, dass wir für die Akquise gezahlt haben – einfach nur durch Mundpropaganda. Die Leute mögen es. Wenn man Entwicklern eine Plattform gibt, auf der sie wirklich coole Sachen bauen können, die keine Daten an große amerikanische Firmen senden, dann sind sie glücklich (lacht). Die Entwickler sind zentraler Bestandteil unserer Vision, weil sie die Anwendungsfälle erschaffen. Sehr häufig kommen Unternehmenskunden über die Entwickler-Community zu uns: Ihre Entwickler und Ingenieure testen unsere Technologie und prüfen, wie stabil sie ist, und dann beginnen wir mit der Zusammenarbeit. Die Entwickler-Community ist für uns wirklich sehr wichtig. Wissen Sie, ich bin selbst ein Geek und tausche mich mit der Community bei jeder nur möglichen Gelegenheit aus.

Unsere Firma wird wachsen und noch mehr Investorengelder organisieren.

Rand Hindi

WIRED: Welche Schritte plant Ihre Firma als nächste?
Hindi: Für 2019 bin ich sehr positiv gestimmt. Wir haben ein Produkt für Entwickler, dass unglaublich schnell wächst, und auch bei den Unternehmenskunden ist die Nachfrage hoch. Jetzt denken wir darüber nach, wie wir die Endkonsumenten erreichen. Vor ein paar Wochen wurden wir als CES 2019 Best of Innovation Awards Honoree ausgezeichnet, in der Kategorie Embedded Technologie bei Sprach-Interfaces für vernetzte Geräte. Darauf bin ich sehr stolz. Wir werden auf der CES eine Reihe neuer Produkte für unsere Unternehmenskunden lancieren. Darüber hinaus werden wir uns 2019 mit der Konsumentenperspektive unseres Geschäfts befassen. Unsere Firma wird wachsen und noch mehr Investorengelder organisieren. Also das, was eine schnell wachsende Technologiefirma üblicherweise macht.

WIRED: Und Sie werden nach weiteren Partnern für Ihre Software suchen...
Hindi: Wir haben schon eine Menge Kunden. Einige sehr prominente Kunden werden in den nächsten zwei bis drei Monaten verkündet werden. Wann das geschieht, wenn der Kunde bereit dazu ist, denn wir bieten ja eine B2B-Lösung an. Wir können es also erst ankündigen, wenn sie das tun. Ich denke, wir werden 2019 den Übergang von einer interessanten, bahnbrechenden Technologie hin zur Massentauglichkeit schaffen. Es wird also richtig spannend.