/Hacker

Memex ist die neue Super-Suchmaschine des Pentagons

Katharina Brunner 21.04.2015 Lesezeit 3 Min

Laut der US-Behörde DARPA können Suchmaschinen wie Google nur fünf Prozent des Webs durchsuchen. Mit Memex hat DARPA deswegen ein Programm entwickelt, das auch die restlichen Informationen auslesen kann. Der Code dafür ist nun frei verfügbar. Neben Programmierern freuen sich darüber vor allem die Ermittlungsbehörden.

#1 Was ist Memex?

Memex wird als ein Google für das Darknet beschrieben. Doch der Vergleich ist nicht ganz richtig: Memex ist keine Webseite mit einer Suchmaske, die nach Relevanz sortierte Links auswirft, sondern ein Bündel von verschiedenen Programmen, die das Internet zu bestimmten Themen durchsuchen und analysieren.

Gegen die Power von Memex wirkt Google wie ein Projekt von Anfängern.

Gegen die angebliche Power von Memex wirkt Google wie ein Projekt von Anfängern. Kommerzielle Suchmaschinen wie Google würden nur fünf bis zehn Prozent des Webs abbilden, erklären die Macher. Memex dagegen könne auch solche Seiten finden, die von Google gar nicht erst erfasst werden — entweder, weil sie keinen kommerziellen Nutzen, nicht lange genug online sind oder beispielsweise im Tor-Netzwerk versteckt laufen.

„Die derzeitigen Websuchen benutzen einen zentralisierten, one-size-fits-all- Ansatz, der für alle Suchen die gleiche Methode verwendet“, heißt es auf der Memex-Webseite. Dass Memex es anders macht, sieht man schon daran, auf wie viel frei verfügbare Software das Projekt zurückgreift: mehr 40 Tools von fast 20 verschiedenen Organisationen.

 

#2 Wer hat Memex entwickelt?

Memex ist das Ergebnis von Militärforschung der Behörde DARPA (Defense Advanced Research Projects Agency), die so etwas wie die Forschungsabteilung des US-Verteidigungsministeriums ist. Die Behörde hat unter anderem einen Vorläufer des Internets entwickelt: Das ARPA-Net verband ab 1969 Universitäten dezentral miteinander, die wichtig für die militärische Forschung waren.

Wir betreiben kein Hacking.

Christopher White, Leiter des DARPA-Programms

#3 Wofür nutzt die DARPA die Suche?

Bisher vor allem, um Hinweisen auf Menschenhandel nachzugehen. Memex sammelt dabei alle Inhalte, die es im Web finden kann, zum Beispiel Anzeigen, die Opfer anlocken sollen oder Telefonnummern möglicher Mittelspersonen. Basierend auf diesen Informationen erstellt Memex unter anderem Karten und Grafiken, die Verbindungen zwischen Verdächtigen herstellen können. Erste Ermittlungserfolge gibt es schon: In New York konnten dank Memex mutmaßliche Menschenhändler festgenommen werden.

#4 Hilfreich oder noch mehr Überwachung?

Ein Teil des amerikanischen Verteidigungsministeriums will das Internet durchsuchen und Informationen sichtbar machen, die bisher im Dunkeln blieben. Spätestens, seit den Snowden-Leaks, läuten da bei vielen Menschen die Alarmglocken. Christopher White, Leiter des DARPA-Programms, sagt: „Wir betreiben kein Hacking.“ Was passwortgeschützt sei, werde von Memex nicht in die Suche einbezogen. Das Internet biete genügend öffentlich zugängliche Inhalte. Diese auszuwerten, sei Herausforderung genug.

Jede Big-Data-Anwendung, die Informationen über Bürger sammelt, beschneidet früher oder später auch deren Persönlichkeitsrechte.

Christopher Furton, Cyber-Sicherheits-Experte

Sogar der Memex-Kritiker und Cyber-Sicherheits-Experte Christopher Furton räumt ein, dass die Nutzung für Ermittlungsbehörden naheliegend und sinnvoll sei. Dass sich Memex beim Datensammeln rein auf Informationen beschränkt, die mit illegalen Tätigkeiten in Zusammenhang gebracht werden können, kann er sich jedoch nicht vorstellen. „Jede Big-Data-Anwendung, die Informationen über Bürger sammelt, beschneidet früher oder später auch deren Persönlichkeitsrechte“, schreibt er in seinem Blog. Wer die eigene Website nicht bei Google gelistet sehen will, kann das Google mitteilen: ein „noindex“ an der richtigen Stelle dazu reicht. Für Memex gibt es so eine Option nicht.

Furton möchte außerdem wissen: „Wie lange werden Daten gespeichert?“ Noch bevor Memex als freie Software veröffentlicht wurde, kritisierte er, dass neben Ermittlungsbehörden auch Nicht-Regierungsorganisationen Zugang zu Memex bekommen hätten — Organisationen, die völlig außerhalb staatlicher Verantwortlichkeit stünden.

#5 Memex ist Open-Source: Wie kann ich es ausprobieren?

So leicht ist das nicht. Fast 40 verschiedene Projekte, die auf die Darpa-Memex-Software aufbauen, sind im sogenannten Open Catalogue aufgeführt. Diese verweisen teilweise auf GitHub-Accounts, auf denen der Code zu finden ist. Für den Heimgebrauch mit einer Installation in zwei Minuten ist Memex also nicht geeignet. Da bleibt einem doch nur Google.