Der Herr der Daten
Mit ausgeklügelten Algorithmen krankmachende Gene aufstöbern
Ulf Leser und sein Team durchsuchen riesige Datenarchive nach Informationen. Die Bioinformatiker an der Humboldt-Universität zu Berlin entwickeln dafür ausgeklügelte Strategien.
Die Suche nach der Nadel im Heuhaufen erscheint als Kinderspiel im Vergleich zum Aufspüren spezieller Funktionen in einer menschlichen Zelle. Ulf Leser zeichnet in seinem Adlershofer Büro bunte Kreise auf Papier und verbindet diese „Knoten“ mit geraden Linien, den „Kanten“. Mit einem derartigen „Graphen“ lassen sich – so der Professor für Wissenschaftsmanagement in der Bioinformatik – auf abstrakte Weise Gene und die dazugehörigen Proteine sowie die Signalwege und Reaktionen repräsentieren, wie sie sich in lebenden Zellen abspielen.
Solche Abstraktionen dienen den Bioinformatikern als Grundlage, um pfiffige Algorithmen zu entwickeln. Die dazu notwendigen Daten lassen sich in den weltweit rund 2.000 öffentlich zugänglichen Datenbanken und Millionen von Fachtexten finden. Dies bringt Informationen an den Tag, die – richtig interpretiert – verstehen helfen, wie Zellen entarten und Tumore sich bilden können. So kann man auch gezielt Therapien finden, die auf einzelne Patienten zugeschnitten sind.
„Es gibt eine schier unendliche Menge an Wissen über die Vorgänge im menschlichen Körper“, sagt Leser: Millionen von Publikationen, etwa über das menschliche Erbgut mit seinen rund 22.000 Genen, und faktisches Wissen, gespeichert in riesigen Datenbanken. „Der Versuch, dieses Wissen zugänglich zu machen, ist eine Wissenschaft“, erklärt er. Diesem Thema hat sich der 44-jährige Informatiker mit seinem etwa 20-köpfigen Team verschrieben. Über das bloße Erfassen, Verarbeiten und Speichern von Informationen hinaus geht es darum, neues Wissen zu gewinnen, indem bisher unbekannte Zusammenhänge in den Daten aufgedeckt werden.
Dies liefert etwa Informationen zu Genen, die mit bestimmten Krankheiten in Verbindung gebracht werden. Wie stark die einzelnen Gene beteiligt sind, lässt sich aus Datenbanken allein nicht herauslesen, weil es einfach nicht bekannt ist. „Das müssen wir berechnen“, sagt Leser. Dazu wird der Computer so programmiert, dass er Gesetzmäßigkeiten in Ergebnissen von Experimenten erkennen kann, in denen Tausende von Genen gleichzeitig beobachtet werden. „So können wir mit einer gewissen Wahrscheinlichkeit vorhersagen, welche Gene möglicherweise bei einer bestimmten Krankheit eine Rolle spielen“, erklärt der Informatiker. Wie gefragt die Expertise der Adlershofer Bioinformatiker ist, zeigen die vielen Projekte, an denen sie beteiligt sind. Fast alle haben mit Medizin zu tun, meist ist die Berliner Charité dabei. So auch im Projekt ColoNet. Hier geht es um Biomarker, das sind genetische Merkmale oder körpereigene Substanzen, die Hinweise auf optimale Behandlung von Darmkrebs geben können. Lesers Team durchforstet Publikationen weltweit per „Text-Mining“, fügt experimentelle Ergebnisse und Modellbetrachtungen über Reaktions- und Signalwege in der Zelle hinzu. Diese Informationen werden auf Plausibilität geprüft, sodass sich die Aussagekraft der Biomarker für Diagnose und Therapie beurteilen lässt.
So etwa bei KRAS, einem Onkogen, das zur Krebsentstehung beiträgt. Mit Chemotherapie lässt sich das ungehemmte Tumorwachstum behindern. Das gelingt jedoch nicht, wenn KRAS in einer mutierten Form vorliegt, wie bei etwa 35 Prozent der Darmkrebspatienten. Mit einem Test lässt sich der Zustand von KRAS feststellen und die Therapie individuell ausrichten. ColoNet versucht nun, derartige Zusammenhänge auch für andere Medikamente und andere Gene festzustellen.
Von Paul Janositz
Internet: www.informatik.hu-berlin.de/institut