Hinweis zu Affiliate-Links: Alle Produkte werden von der Redaktion unabhängig ausgewählt. Im Falle eines Kaufs des Produkts nach Klick auf den Link erhalten wir ggf. eine Provision.

Hund oder Hautkrebs? Die nächste Stufe der Bilderkennungs-Software setzt auf Big Data

von Max Biederbeck
Am Anfang war es schon ein Erfolg, wenn Computer Katzen und Hunde auf einem Bild unterscheiden konnten. Software scannte, was im Foto abgebildet war und suchte dann von allein das richtige Tier heraus. Ein vorher programmierter Algorithmus erkannte eingegebene Rassenmerkmale: Schnauze, Haare, Größe. Das System selbst stellte fest: Das hier muss eine Katze sein. Für Daten-Unternehmen war das aber erst der Anfang.

Mittlerweile sind die Erkennungsprogramme für Foto-Daten intelligenter geworden. Bald könnte die automatisierte Bildersuche unseren Alltag revolutionieren und massenhaft Inhalte von Bildern logisch auswerten. Angewendet wird dieses Prinzip schon jetzt in der medizinischen Forschung. IBM hat eine Zusammenarbeit mit dem Memorial Sloan Kettering Cancer Center angekündigt.

Tödlicher Hautkrebs soll allein durch Bilddaten erkannt werden.

Das Ziel: Die beteiligten Forscher wollen eine Technologie auf den Markt bringen, die die tödlichsten Formen von Hautkrebs schon in ihrer Frühphase erkennen kann. Das funktioniert im Grunde genau wie beim Hund und der Katze, mit Big-Data-Analysen von Bildern — oder anders ausgedrückt: Picture Big Data.

In den USA sterben im Jahr 9000 Menschen an Hautkrebs, die Kosten zur Behandlung belaufen sich auf acht Milliarden Dollar. In Deutschland sind es zum Vergleich 3000 Opfer pro Jahr. Die Heilungschancen der Krankheit steigen, und Therapiekosten fallen, wenn sie möglichst früh diagnostiziert wird.

In Tests hat der Ansatz von IBM genau das geschafft. Zur Überprüfung der Technik fütterte das Unternehmen seine Software mit 3000 Fällen von gefährlichem Schwarzem Hautkrebs und auffälligen, aber harmlosen Hautveränderungen. Das System schaffte es in über 95 Prozent der Fälle, die gefährlichen von den ungefährlichen Pigmentflecken zu unterscheiden.

Der Algorithmus könnte in Zukunft weiter mit Daten aus der Memorial-Stiftung und anderen medizinischen Einrichtungen gefüttert werden. Ärzte könnten Merkmale aller bekannten Arten von Hautkrebs einspielen und dann mit individuellen Patientendaten abgleichen. Jede Veränderung der Haut würde so erfasst und ausgewertet. Dazu muss es das Projekt aber noch raus aus den Labors und hinein in die Arztpraxen und Krankenhäuser schaffen.

Die Technik ist effektiver als jeder menschliche Arzt.

Noel Codella, Projektentwickler bei IBM

Dass es dem Softwarehersteller IBM mit solchen medizinischen Projekten durchaus ernst ist, zeigte sich schon beim Einsatz seines Supercomputers Watson in Südafrika. Anhand von BigData hilft er dort bei der Behandlung von Tuberkulose (mehr dazu in der Multimedia-Story von WIRED Germany). Am aktuellen Hautkrebs-Projekt ist der legendäre Computer, der schon bei Jeopardy mitmachte, allerdings nicht beteiligt. Die Technik sei dennoch wesentlich effektiver als jeder menschliche Arzt, sagte Projektentwickler Noel Codella gegenüber VentureBeat. Während die menschliche Genauigkeit bei 84 Prozent liege, schafften es automatische Ansätze auf bis zu 90 Prozent Effektivität. 

Codellas Projekt ist allerdings nur eines von mehreren Beispielen für Picture Big Data. Ein anderes ist die Arbeit der Wissenschaftler Andrej Karpathy und Li Fei-Fei am Stanford Vision Lab. Sie erforschen, wie Computer in Zukunft visuelle Daten in Textform interpretieren könnten. Um zum Bild von Katze und Hund zurückzukommen: Während bisherige Ansätze vor allem Einzelteile eines Bildes erkennen konnten, analysiert der von Karpathy und Fei-Fei Bildzusammenhänge. Das Programm sieht also nicht nur die Tiere sondern wüsste auch: Der Hund jagt der Katze durch den Garten hinterher und bellt.

Nicht nur einzelne Objekte, sondern auch Zusammenhänge können erkannt werden.

„Unser Ansatz erkennt die am besten passenden Wörter zum Bild und setzt sie dann sinnvoll zu Sätzen zusammen“, schreiben die Forscher auf ihrer Website. Solche Sätze könnten dann wiederum massenhaft ausgelesen werden, wie es Suchmaschinen auch heute schon tun. Die Folgen, die das unter anderem auf unsere Suchgewohnheiten im Internet, auf Werbung, Forschung oder die Privatsphäre haben könnte, sind kaum abzuschätzen.

In der Medizin werden gerade mit Anbietern wie IBM oder dem britischen Unternehmen Imaging Trials die ersten Schritte für die standardmäßige Anwendung gemacht. Andere denken hingegen schon an die nächste große Möglchkeit zur Massenanalyse: Video-Data-Mining. 

GQ Empfiehlt