Metaweb-Deal: Kann Google weniger als wir dachten?

by Eric Kubitz on Juli 16, 2010

in Internet

Die Meldung: Google hat eine US-Firma namens Metaweb gekauft. Damit gehört ihnen auch die Dinge-Datenbank “Freebase“. In ihren Blogs freuen sich alle öffentlich – aber ich denke, dass Google damit im Grunde eingesteht, weniger zu können, als wir immer denken.

Wie komme ich darauf? In stolzgeschwelltem Blog bloggt jede Woche mindest ein Googler, von einer grandiosen Neuentwicklung im Index. Wenn der Robot etwa den Geburtstag von Barack Obama kennt oder die Events in San José aufzählen kann. Hier z.B. bekommt man gleich die Information und nicht nur den Verweis auf eine Seite, die die Information hat.

Ich habe ja schon mehrfach gesagt, dass ich davon ausgehe, dass die Quellen, von deren Seiten das Geburtsdatum stammt, vermutlich nicht glücklich sind, wenn nun niemand mehr zu ihnen kommen muss. Und das sollte auch bei deutschen Publishern für Kopfschmerzen sorgen. Denn wer mit einer englisch eingestellten Suche nach “cinema” sucht, erhält gleich das ganze Programm und wird Google-intern weiter geführt auf eine Seite mit den lokalen Kino-Gegebenheiten und sogar Reviews:

Man könnte also meinen, dass Google sehr genau versteht, wonach gerade gesucht ist und dementsprechend weiter Informationen anbietet. Auch das für Leser des Blogs hier nichts Neues und auch mein Aufruf, deshalb bitte von nun an immer über Rich Snippets nachzudenken, ist keine Neuigkeit.

Doch jetzt kauft Google Metaweb.

Der Suchgigant, dem wir zutrauen, das ganze Web zu verstehen und die semantische Nähe von Begriffen zueinander und die Einordnung in Themenwelten lässig zu erledigen. Genau dieser Suchgigant kauft eine Crawling-Firma, die das macht, was meiner Kenntnis nach gerade noch X andere für sich und selber machen: Inhalte von anderen Seiten crawlen und die so gewonnenen Inhalte schick zusammen zu basteln. Das sieht im Fall von Freebase dann so aus:

Das ist ein Snippet, dass man sich zum Namen von T.C. Boyle auf die eigene Seite holen kann, ganz nach YouTube-Embedd-Strategie. Keine Frage: eine schöne Sache!

Woher kommen die Informationen?

Nun, im Wesentlichen werden die von der Wikipedia gescrapt und noch etwas besser strukturiert, als sie dort vorliegen. Ebenso holt sich der Metaweber Daten und Infos von offenbar handselektierten Seiten – soweit ich das sehen kann, meist immerhin mit Quellenangabe. Außerdem können User die Datenbank veredeln. Ich habe z.B. einfach mal die Postleitzahl von Bad Tölz hinzu gefügt. Ging ganz flott (über das Google-Konto) und schon habe ich eines der 12 Millionen dort verzeichneten “Dinge” noch besser beschrieben, als es vorher war.

Aber, hää? Warum sollte ich das machen – wenn ich nicht gerade für einen Blogbeitrag recherchiere? Immerhin, das Ergebnis kann sich sehen lassen:

Na gut, das Metaweb wird wohl nun die Produktmanager in Film, Musik und IT-Industrie damit beschäftigen, die Angaben dort aktuell zu halten (und möglicherweise gegen die Info-Angriffe der Konkurrenz zu verteidigen). Aber wer macht das so als Hobby? Das ist ja nicht die Wikipedia… Und geprüft wurde meine Eingabe offenbar auch nicht.

Egal, es gibt dort eine Menge Informationen, die wiederum kostenlos auf andere Plattformen wandern werden. Momentan sucht ja jeder Content, wo es nur geht. Doch Vorsicht! Falls jemand hofft, damit sein Contentproblem auf der Webseite billig lösen zu können: Falsch! Ich hoffe, euch ist klar, warum…

Nun zur Kernfrage: Warum kauft Google Metaweb?

Die Stärke dieser Datenbank ist wohl, dass Produkte, Namen, Orte u.s.w. schon entsprechenden “Entities” zugeordnet sind. Von T.C. Boyle wusste Freebase, dass das ein Autor ist, von Bad Tölz, dass es eine Stadt ist. Und was ist mit “Boston”? Ist das eine Stadt? Eine Band? Beides gibt es und wenn jemand nach Boston sucht, weiß man nicht auf Anhieb, was er eigentlch will.

Hier kann die Metaweb-Truppe offenbar Google helfen. Die Frage ist nur: wobei? Denn bisher dachten wir alle, dass Google semantische Zusammenhänge eigentlich recht gut erkennen kann. Und dann kann man “Golf” schnell einem Spiel, einem Land oder einem Autokonzern zuordnen. Aber ganz offensichtlich muss man sich da von einem Unternehmen wie Metaweb helfen lassen. Oder die Firma ist in irgend einer Weise eine Bedrohung geworden und musste weg gekauft werden. Aber das kommt auf das Gleiche raus:

Google hat die Sortierung der Inhalte viel schlechter im Griff, als gedacht. Das ist ein bisschen eine Genugtuung. Wenn auch nur eine vorübergehende. Denn offensichtlich wird gerade hier nachgerüstet. Und so was kann natürlich schnell gehen bei Google…

Verwandte Artikel

Comments on this entry are closed.

blog comments powered by Disqus

Previous post:

Next post: