Auf der Suche nach einem besseren Google

Von Tobias Wenzel · 04.02.2009
Google ist die wohl meist gewählte Suchmaschine im Netz und "googeln" ein Synonym für Recherchieren im Internet. Das Recherchewerkzeug ist dennoch nicht perfekt. In Berlin arbeitet der Professor für Informatik, Volker Markl, daran dass Suchmaschinen besser verstehen, wonach wir suchen - auch Google interessiert sich für seine Arbeit.
Überall gelb lackierte Türen und weiß gestrichene Backsteinwände im siebten Stock eines hohen Gebäudes auf dem Campus der TU Berlin. Die Adresse, Einsteinufer, soll Ansporn sein, auch für Volker Markl. Der Informatiker hat hier im Sommer 2008 sein Büro bezogen. "Ich habe auch manchen wissenschaftlichen Plan überlegt, während ich Dich im Kinderwagen spazieren schob!", schrieb Albert Einstein einst in einem Brief an einen seiner beiden Söhne. Fragt sich also, ob auch Volker Markl Kinder hat und sie zum Forschen braucht:

"Nein, Kinder habe ich keine. Daher: Ich bin wahrscheinlich selbst ein verspieltes Kind und mach das selbst."

Der 37-jährige Markl kneift seine Augen kurz zusammen, rückt seine Brille mit den ovalen Gläsern zurecht und begibt sich an seinen Arbeitsplatz, um die Google-Startseite zu öffnen:

"So, ich tippe jetzt einfach mal hier ein einen Begriff, und zwar 'Paris Hilton'. Und was Sie jetzt hier sehen zunächst mal bei 'Paris Hilton' ist die Person. Also hier sehen wir mal ein paar Bilder, denke ich mal. Aber jetzt ist ja das Problem bei 'Paris Hilton': Es gibt ein Hotel und es gibt eine Person. Und es könnte jetzt sein, dass ich in Paris Urlaub machen will und das Hotel gesucht habe."

Die Suchmaschine hat aber vorausgesetzt, dass die Suche der Person Paris Hilton galt. Und so finden sich dann auch unzählige Einträge zum millionenschweren Glamourgirl. Wer nach dem Hilton-Hotel in Paris gesucht hat, kann da regelrecht verzweifeln. Das will Volker Markl ändern. Gemeinsam mit Partnern aus anderen Forschungseinrichtungen in Berlin und Potsdam will der Spezialist für Datenbankensysteme und Informationsmanagement Mehrdeutigkeiten wie 'Paris Hilton' ausschalten, und zwar durch einen Zwischenschritt:

"Dann könnte das System rückfragen: Meinen Sie das Hotel oder meinen Sie die Person?"

Voraussetzung ist allerdings, dass die Suchmaschine weiß, dass "Paris Hilton" einerseits eine Person ist und andererseits ein Hotel in Paris. Für eine Suchmaschine sind Worte aber nur leere Hülsen, die sie wiedererkennen, aber nicht verstehen kann. Erst wenn diese Worthülsen mit ihren Bedeutungen und Kategorien verknüpft werden, kann eine Suchmaschine intelligent damit umgehen. Man spricht hier von Metadaten. Computerlinguisten versuchen, ganze Bedeutungsnetze zu erzeugen. Die Datenbank "freebase" stellt zum Beispiel kostenlos Metadaten, nämlich Klassifikationen, zur Verfügung:

"Das heißt, ich kann erkennen, bestimmte Personen sind Präsidenten oder bestimmte Personen sind CEOs von Firmen. Und diese Metadaten kann ich dann nutzen für meine Anfrageverarbeitung. Das heißt, ich muss in meinem Text zum Beispiel gar nicht wissen, dass – ich sag jetzt mal – Barack Obama ein Mensch ist oder ein Präsident oder was auch immer, sondern das kann ich unter Umständen ableiten durch Verwendung von öffentlich verfügbaren Metadaten."

Er hat Obama noch als Wahlkämpfer erlebt. Acht Jahre lang arbeitete Markl im Silicon Valley für IBM. Ihm ist es zu verdanken, dass gewisse Datenbankabfragen heute schneller vonstatten gehen. Während für viele Wissenschaftler das Silicon Valley so etwas wie ein Informatikhimmel auf Erden ist, zog es Volker Markl aber an die TU Berlin.

"Ich habe mich entschieden für Berlin wirklich aus dem Grunde heraus, dass hier auch so eine kritische Masse, denke ich, vorhanden ist: zum einen aus Wissenschaft, IT. Hier sind ja auch sehr viele industrienahe Forschungsinstitute, die Fraunhofer Institute zum Beispiel, die Telekom Labs. Und in sofern ist hier ein Standort entstanden, der durchaus mit dem Silicon Valley konkurrieren kann, gerade im universitären Bereich."

Das Studium der Informatik und die Promotion an der TU München, später die Arbeit im Silicon Valley, das Anmelden zahlreicher Patente für IBM – ein bisschen hätte man den Werdegang Markls schon in seiner Jugend erahnen können, als er andauernd mit seinem Commodore 64 programmierte:

"Es ging los mit so kleinen Datenverarbeitungssystemen, die Finanzbuchhaltung oder derartige Dinge betreiben. Das war damals noch für meine Mutter. Das war so eine kleine Spielerei, um mal zu sehen, wie man Haushaltsfinanzen verwaltet. Aber dann auch zu einem kleinen Programm, das natürliche Sprache versuchte zu verstehen so gut als möglich, mit Texteingaben umgehen konnte und darauf dann reagieren konnte."

Heute ist Markl Spezialist für Datenbanksysteme, Suchmaschinenanfragen und das so genannte Cloud computing. Dabei laufen viele Rechner parallel. Ohne diese Technologie würden Suchmaschinenanfragen unerträglich lange dauern. Markls Forschung könnte unter anderem für Firmen interessant sein, die Marktanalysen über das Internet erstellen wollen. Bleibt die Frage, wie lange es noch dauert, bis Suchmaschinen wie Google und Yahoo mit Datenbanken so verknüpft sind, dass sie Bedeutungen und Mehrdeutigkeiten erkennen können. Dann würde auch das Suchen mehr Lust als Frust bereiten:

"Es wird immer mehr funktionieren für bestimmte Anwendungsgebiete. Ob wir mal dahin kommen, dass das ganz allgemein funktioniert, da müssen wir mal sehen... Das ist eine wirkliche Herausforderung."