/Big Data

Google veröffentlicht eine Künstliche Intelligenz zur DNA-Sequenzierung

WIRED Staff 05.12.2017 Lesezeit 2 Min

Eine der großen Herausforderungen moderner Genanalysen ist die Interpretation der Daten. Mit DeepVariant hat Google jetzt eine KI entwickelt, die aus Milliarden von Datenfetzen das Genom eines Menschen rekonstruieren kann und dabei Messfehler von Mutationen unterscheidet.

Seit den frühen 2000er Jahren können Menschen Daten aus dem Genom eines Lebewesens erfassen. Forscher schaffen es aber noch immer nicht, den kompletten menschlichen Gencode zu sequenzieren. Der besteht aus rund drei Milliarden Basenpaaren – heutzutage arbeitet man aber nur mit etwa einer Milliarde Sequenzen auf der Basis von 100 Paaren. Dazu kommen Fehlerquoten von bis zu zehn Prozent. Die neue Künstliche Intelligenz (KI) Google DeepVariant nutzt Deep Learning, also ein kompliziertes digitales Lernmuster, um aus der geringen Datenmenge dennoch das tatsächliche Genom auszulesen.

Bereits Mitte 2016 hatte DeepVariant einen Wettbewerb der US-Behörde Food and Drug Administration gewonnen, bei dem es um die möglichst fehlerfreie Zusammensetzung von DNA-Sequenzen ging. Die KI vergleicht neu ausgelesene Datenfetzen mit Referenzdaten aus einer Datenbank des so genannten Genome in a Bottle-Konsortiums. Dank ihrer Lernfähigkeit hat die KI ihre Fehlerquote seit diesem Wettbewerb laut Google noch einmal um 50 Prozent gesenkt und ist damit die präziseste Methode der Welt.

DeepVariant ist das Produkt einer Kooperation der Alphabet-Töchter Google Brain und Verily. Letztere ist für Fortschritte in der Biologie zuständig. Big Data ist dabei ein wichtiges Thema, weil bei vielen modernen medizintechnischen Sensoren gewaltige Datenmengen anfallen, die sich auf klassische Art kaum im Detail analysieren lassen.

Für die Verarbeitung der enormen Datenmengen, die bei DNA-Sequenzierungen anfallen, eignet sich die Herangehensweise per Deep Learning besonders gut. Da die Software quelloffen ist, kann sie auch von anderen Forschern genutzt werden. So sollen künftig bessere Genanalysen einzelner Patienten möglich werden — und Studien, mit denen sich genetische Ursachen für unterschiedlichste Erkrankungen finden und möglicherweise auch bekämpfen lassen.