In der vergangenen Woche hat die Matrix um uns herum einige Rückschläge hinnehmen müssen. Ja, mir scheint, dass die Wetware (also die hauptsächlich mit Wasser gefüllten Hautsäcke mit den zwei Ohren und dem wachen Blick vor den Bildschirmen) ein wenig gegen Soft- und Hardware gewonnen hat. Das ist nur so ein Gefühl. Und der stärkste Verbündete im Kampf um den “Faktor Mensch” im Internet ist derzeit – offensichtlich – Google.
Ich veruche mal zu erklären, was ich damit meine und warum mich dieses Thema an eine alte Studienliebe erinnert.
Wie komme ich überhaupt auf dieses Thema?
- Mindestens zwei unserer Kunden arbeiten gerade an Crawlern, um möglichst automatisiert und massenhaft Informationen von anderen Webseiten zu generieren. Ich würde jetzt gerne sagen, dass diese beiden Kunden No-Quality-Seiten betreiben, aber das wäre gelogen.
- Von mindestens zwei anderen Kunden habe ich in dieser Woche gehört, dass sie ihre Anstrengungen, Inhalte automatisiert zu generieren, eingestellt haben.
- Schon seit Wochen nimmt Google viele Seiten mit extrem viel automatisiert generiertem Content aus dem Index (siehe Bilder unten). Und die Ironie dabei: Man kann sich hierbei fast sicher sein, dass dies durch den Knopfdruck von Wetware und nicht durch eine Entscheidung eines Sofware-Algorithmus erfolgt.
- Google hat “Metaweb” gekauft. Das ist eine Firma, die semantische Nähe zwischen “Dingen” herstellen möchte – und darauf unter anderem auch auf den Einsatz von echten Menschen zum Veredeln der Inhalte setzt.
Ein großer Text-Automat von Google abgestraft...
Mister Wong: kein eigener Inhalt, kein Ranking mehr bei Google...
Ich könnte so weiter machen: Die Menge der Ereignisse, bei denen auf der einen Seite eine möglichst hohe Automatisierung von allem und menschliches Steuern auf der anderen Steite steht, ist nur durch unsere geringe Aufnahmekapazität limitiert. Den in der Webseitenbetreiber-Industrie tobt derzeit der Krieg um den Longtail. Und den kann eigentlich nur gewinnen, wer mit möglichst geringen Kosten möglichst viele Seiten zu noch so exotischen Suchbegriff-Kombinationen herstellt. Und weil Maschinen halt einfach billiger als Menschen sind, möchten viele Publisher möglichst viele maschinengenerierte Seiten für den Longtail produzieren.
Ist also Automatisierung von Inhalte der Köngisweg im Web?
Dazu eine kleine Geschichte: In meinem Studium saß ich in einem großen Vorlesungssaal auf der einen Seite und hatte immer wieder das Gefühl, dass mich von der anderen Seite häufig zwei schöne Augen anblickten. Doch die dunkelhaarige Mit-Studentin konnte auf diese große Entfernung nicht zweifelsfrei identifizieren und war mir nicht sicher, wen ich in der Pause ansprechen sollte.
Aha: Ich konnte sie also nicht einmal erkennen – woran sollte ich also die exakte Richtung ihres Blicks sehen? Dazu reichte die Auflösung meiner Retina offenbar nicht aus. Aber ich spürte ihren Blick…
Und tatsächlich: Einige Wochen später waren wir tatsächlich (leider sehr kurz nur) ein Paar und sie bestätigte mir diesen ominösen Blickkontakt.
Kennt ihr nicht auch dieses Gefühl, dass jemand einem in die Augen blickt – obwohl das physikalisch gar nicht zu erkennen ist? Schon, oder? Man fühlt sich irgendwie berührt, könnte aber nicht genau sagen, warum.
Und genau dieser Faktor scheint auch bei anderen Kommunikationsformen gut zu funktionieren. Siehe auch den Turing Test, bei dem man Computer darauf testet, ob sie menschliches Verhalten simulieren können. Momentan ist der Spitzenwert aus dem Jahr 2008, da schaffte es das beste Programm, 25 Prozent der menschlichen Versuchsteilnehmer zu täuschen. Das ist schon ganz ordentlich… Trotzdem können wir wohl festhalten: Menschen können ganz gut zwischen Automaten und Menschen unterhalten.
Nun, was hat das mit Webseiten zu tun?
Auch sie sind eine Form der Kommunikation zwischen Publisher und Leser. Wer sich den automatisiert gecrawlten Schwachsinn Longtail-Teil (siehe Kommentare unten) von Personensuchmaschinen wie Yasni oder 123people anschaut, spürt doch gleich das Fehlen einer Seele. Das ist für diese Seiten nicht besonders schlimm, denn es gibt offenbar genug Idioten, die vor lauter Verzweiflung über die unterirdische Qualität Unpersönlichkeit der Inhalte schnell auf eine Werbung klicken um zu flüchten. Aber, ganz ehrlich, nur unter uns: Willst du mit deiner Webseite dahin, wo Yasni & Co schon sind?
Aber die erfolgreichsten Longtail-Webseiten sind doch automatisiert, das geht doch nicht anders!
Das stimmt nicht. Was sind denn die erfolgreich, automatisierten Webseiten? Yasni? Bitte, nein! Aber etwa auf Google News darf man ja verweisen. Hier wird tatsächlich ganz automatisierte die Nachrichtenwelt abgebildet. Das funktioniert gut, so gut, dass alle Nachrichtenmagazine alles dafür tun, um dort aufgelistet zu sein. Und trotzdem: Die Reichweite von “Google News” als News-Aggregator-Seite, weiß man, ist nicht besonders hoch, nur ein Buchteil von Focus Online oder sueddeutsche.de. In meinem Seminaren frage ich alle Teilnehmer immer nach der wichtigsten Nachrichtenwebseite – und Google News wurde noch nie genannt.

Die Macht des News-Aggregators strahlt von den “normalen” Suchergebnissen aus, wenn in diesen die News-Onebox eingeblendet wird, sehen das die User. Die Seite http://news.google.de besuchen nur wenige. Denn wer aktuelle Nachrichten lesen möchte, wünscht sich eine redaktionelle, also menschliche Zusammenstellung.
Also weiter: Wer automatisiert erfolgreich?
Wenn man sich mal die top-sichtbaren Seiten im Google-Index anschaut (im Bild rechts die Top-20 des Sistrix Sichtbarkeits-Index), dann findet man dort reichlich wenig Automatisierung. Idealo vielleicht, gutefrage und ciao auch, preisroboter natürlich! Doch Wikipedia, Amazon, Ebay, YouTube, Holidaycheck und natürlich die großen Publisher wie Chip, Focus, Spiegel, Welt und Bild: Content, bei dem man sich von Menschen berührt fühlt. In der ersten Gruppe kümmern sich viele Menschen um viele Longtail-Inhalte, in der zweiten Gruppe sind es Redaktionen, die schalten und walten.
Ich weiß zufällig von einigen Automatisierungs-Projekten einiger dieser Seiten – aber keines war wirklich erfolgreich. Jedenfalls bislang nicht.
Dann ist vielleicht Demand Media die erfolgreiche Form des automatisierten Publishing? Jedenfalls zittert die Verlagswelt vor diesem amerikanischen Modell, bei dem die Anzahl der Suchanfragen nach Keywords zu einer automatisierten Bestellung und Veröffentlichung von schnell erstelltem Content führt.
Nun, man kann in diesem Zusammenhang natürlich über Qualität und Nicht-Qualität streiten. Aber automatisiert sind hier eigentlich nur die Prozesse. Denn von Demand Media werden eben NICHT irgendwelche Themen veröffentlich sondern genau die Themen, die von MENSCHEN bei Google nachgefragt werden. Das ist der menschliche Faktor dort, und natürlich die Schreiber. Wobei man sich natürlich schon fragen muss, von was Autoren leben, die für 11 Dollar pro Text arbeiten….
Zur Sache also: Was heißt das alles?
Vielleicht nicht viel. Aber ich verspüre Genugtuung, wenn ich darüber nachdenke, dass – genauer betrachtet – der Erfolg im Internet dann doch noch von Menschen gemacht wird und nicht von Maschinen. Und wenn ich Investor wäre, würde ich derzeit einem Crawling-Projekt nicht allzu viel Finanzierungs-Budget versprechen…
Einen schönen Sonntag noch!
Könnte passen: