Suchmaschinen-Qualität (Warum Google Marktführer ist)

Microsoft will Google bei Suchmaschinen überholen – immer noch. Wenn Microsoft das ernst meint, ist es ein großer Fehler, das Such-Geschäft von Yahoo nicht zu kaufen! Yahoo ist zwar nicht so gut drauf wie Google, aber doch um Welten weiter.

Man kann die Qualität von Suchmaschinen verschieden testen. Zwei unterschiedliche Bereiche sind da wichtig: Der Web-Index & der Ranking-Algoritmus. Algoritmen sind ein bisschen subjektiv, da gibt’s Studien, nach denen Suchresultate als “besser” gesehen werden, sobald sie im Google-Design präsentiert sind.

Die Index-Größe und -Aktualität hat da mehr Einfluss. Nicht, weil groß gleich gut bedeutet – sondern weil nur bei einem großen Index garantiert werden kann, dass für unbekanntere Suchabfragen Ergebnisse gefunden werden.

Beispiel Presentify.at

Wir haben vor ca. einem Monat von Presentify.com auf Presentify.at umgestellt. Ohne jetzt überheblich sein zu wollen: Wir haben (unbekanntere) Events, die sonst kaum zu finden sind und sind auch der Meinung, dass unsere Event-Seiten genau so in Erwägung gezogen werden sollten wie bekanntere.

Das ist außerhalb von Google aber kaum möglich.

Wir haben Sitemaps bei Google Webmaster Tools, Yahoo Site Explorer und Live Webmaster Center eingereicht (Ask hat sowas nicht) – nur Google und Yahoo kommen auf mehr als 1.000 indexierte Websites.

Aber gut, zu erwarten, dass Presentify gefunden wird, kommt vielleicht überheblich rüber.

Beispiel Facebook.com

Hier schaut die Situation aber ähnlich aus – beim zweitgrößten Social Network.

Ich kann also von Google alleine deshalb schon bessere Suchresultate erwarten, weil sie ganz einfach mit einer höheren Wahrscheinlichkeit die Seiten im Index haben, die ich suche!

Wenn Microsoft ernsthaft gegen Google eine Chance haben will, wären sie gut damit beraten, Yahoo’s Suchgeschäft aufzukaufen!

Persönliche Daten im Internet

Ich bin ein Web-Freak, habe Profile bei einem ganzen Haufen Websites, habe einen Blog, den ich unter meinem echten Namen schreibe, und so weiter. Ich bin aber auch ein Freund meiner Privatsphäre. Mir ist klar, dass Google mittlerweile viel über mich wissen muss. Aber bekomme ich diese Informationen auch wieder raus?

Ich hab das Experiment gemacht, und versucht, möglichst viele (unnötige bzw. unerwünschte) Informationen über mich aus der Google-Suchmaschine rauszubekommen.

Meine konkreten Ziele waren:

  1. Weg mit unnötigen Informationen (Profile, die ich nur zu Testzwecken angelegt habe, die keine Informationen beinhalten, außer, dass sie existieren)
  2. Weg mit unerwünschten Informationen (zB Aussagen, die mir im Berufsleben schaden könnten bzw. mir im Nachhinein peinlich sind)
  3. Prominentere Platzierung der erwünschten Profile (mein Blog, Twitter, Presentify – die sollen sich nicht hinter anderen Seiten verstecken)
  4. Vermischen mit anderen, gleichnamigen Personen (damit können Suchergebnisse ohne Foto nicht mehr eindeutig zugeordnet werden)

Schritt 1

Ich hab auf www.google.com und www.google.at nach meinem Namen und meinen häufig gewählten Synonymen gesucht und geschaut, was angezeigt wird. Flickr-Profil, alter Blog, ehemaliger Projekt-Blog, neuer Blog, viele verschiedene Website-Profile – alles mögliche ist aufgetaucht.

Diese Websites habe ich in eine Liste eingetragen und ihnen eine “Lösch-Priorität” zugewiesen. Leere, wertlose Seiten hatten eine niedrige Priorität, “problematische” Seiten eine hohe.

Schritt 2

Die Websites auf dieser Liste bin ich dann eine nach der anderen durchgegangen. Ich hab mich eingeloggt, versucht, die Accounts zu löschen oder wenigstens die einzeln angebenen Daten zu löschen oder so weit zu ändern, dass sie nichts mehr mit meiner Person zu tun haben. (Geburtsdatum auf 01.01.1970 geändert, Geschlecht auf “Bitte auswählen…” zurück gesetzt, etc.)

Wo das Löschen direkt auf der Website nicht möglich war, hab ich mir eine Support-E-Mail-Adresse gesucht und per E-Mail gebeten, meinen Account zu löschen. (Das funktioniert fast überall innerhalb weniger Tage.)

Die Profile, die ich löschen konnte, hab ich in der Liste entsprechend markiert. Die, wo ein “einfaches” Löschen (direkt auf der Website) nicht möglich war, ebenfalls.

Schritt 3

Jede Woche habe ich wieder in Google gesucht und geschaut, welche Profile noch vorhanden sind und welche schon gelöscht wurden. Auch diese Änderungen habe ich wieder in die Liste eingetragen.

Meine Erfahrung

Google löscht Suchergebnisse, die als Websites nicht mehr existieren (logisch) und indexiert regelmäßig alle Websites neu, dadurch war ich relativ schnell relativ erfolgreich beim Löschen meiner Daten. Es lohnt sich aber auch, mit Windows Live Search, Yahoo! und Ask zu suchen. Nicht, weil diese Suchmaschinen mehr Ergebnisse anzeigen (ganz im Gegenteil), sondern weil sie durch andere Ranking-Algoritmen auch andere Websites anzeigen.

Ausnahmen & Probleme

Benutzernamen

Die Benutzernamen sind Probleme. Ich habe bei einigen Websites meinen vollen Namen als Benutzernamen verwendet. Das war beim Versuch, die Profile zu löschen, bei manchen Websites ein Problem, da ich den Account nicht löschen konnte!

Profil-Bilder

Viele Websites, bei denen ich zwar mein Profil nicht löschen konnte, aber wenigstens die Daten “zerstörte”, hatten keine Funktion, um das Profil-Bild zu löschen. Das lässt sich leicht umgehen: Nehmt ein leeres Bild (Ich hab eine transparente 1×1 Pixel große GIF-Grafik genommen.) und ladet es hinauf – Problem gelöst.

Unlöschbare Accounts

Ein Grundsatzproblem, das ich oft entdeckt habe ist, dass man Accounts ganz einfach nicht löschen kann. Ich habe selbst mehrere Community-Websites entwickelt und weiß, dass man schwer einfach alle Daten einer Person aus einer Website entfernen kann. Ich weiß aber auch, dass es trotzdem möglich ist, persönliche Daten unerkennbar zu machen. Es lohnt sich, im Zweifelsfall nachzufragen und um eine Account-Löschung zu bitten.

Langzeit-Speicher

Während ich von den Suchmaschinen meine Daten runter bekommen habe, gibt es einen zweiten Typ an Websites, die sich davon nicht beeindrucken lassen, weil sie diese Suchresultate längst gespeichert haben: Profil-Aggregatoren wie Spock (aber nicht wie 123people und Yasni) und Langzeit-Suchmaschinen wie das Web Archive. Letzteres ist zwar unbekannt, langsam und schwer zu durchsuchen, bietet aber trotzden Potential zur missbräuchlichen Verwendung.

Auch die Profil-Aggregatoren sind nicht zu unterschätzen. Sie durchsuchen das Web und löschen alte Ergebnisse nicht, da sie nicht nach den Websites, sondern nach den Informationen suchen. Spock (ich setze keinen Link, da ich kein großer Fan mehr bin – eine Google-Suce nach dem Namen findet die Website ohnehin) kann man zwar beeinflussen – es gibt aber das Risiko, Daten nicht mehr aus dem System zu bekommen. Am Klügsten ist es hier, das Profil für sich zu nützen und zu beeinflussen, um unerwünschte Informationen zu entfernen oder erwünschte Informationen hervorzuheben.

Presentify.at

Dieses Experiment hat mir für Presentify die Augen geöffnet, das naturgemäß ebenfalls persönliche Informationen sammelt. Wir ermöglichen es unseren Mitgliedern aber, ganz einfach ihren Account zu löschen – in diesem Fall werden bis auf den Namen alle Profil-Informationen (Alter, Geschlecht, Homepages, Profil-Bild, etc.) sowie Events (inkl. alle damit zusammenhängenden Daten) und Freundschafts-Einträge vollständig gelöscht, der Name wird zusammengestutzt (aus “Sebastian Moser” wird “Sebastian M.”). Was wir nicht löschen, sind die vom Mitglied erstellten Daten. (Nachrichten, Gästebuch-Einträge, Kommentare)

Ich denke, das ist ein vernünftiger Mittelweg.

Local Search: Inhalte besitzen, nicht sortieren

Google, Yahoo!, Microsoft, Ask – sie alle versuchen, den nächsten großen Such-Markt zu bekommen – die lokale Suche.

Während man mit der klassischen Web-Suche primär nach Informationen ohne lokale Referenz sucht, geht es bei der lokalen Suche darum, lokale Bilder, Restaurants, Nachrichten und Geschäfts zu finden. Man kann also sagen: Lokale Suche ist etwas völlig anderes. Denn während es kein Problem ist, alle möglichen Websites zu durchsuchen und die Inhalte irgendwie aufzulisten (was eine Web-Suchmaschine tut), muss man bei lokalen Suchmaschinen viele Informationen erst einmal ins Internet bringen.

Google versucht dieses Problem zu beheben, dass die meisten Firmen keine statistisch erfassbaren Adressen online haben, und Telefonbücher nicht ausgelesen werden dürfen, und startet das Google Local Business Referrals-Programm, das einfach gesagt Leute dafür bezahlt, Geschäfte zu fotografieren, die Öffnungszeiten zu notieren und mitsamt der Adresse auf Google’s Server hinauf zu laden. (Das Programm wurde Ende 2008 eingestellt.)

Also das gleiche, das manche Projekte (zB Tupalo) uns gratis machen lassen. Interessant – leider aber vorläufig nur für die USA. Google hat davon einiges. Nicht nur erhalten sie eine Unmenge an Daten, der Großteil der Zahlung (8 Dollar) findet nur dann statt, wenn der Kontakt überprüft und bestätigt wurde. Ergo: Google hat einen Unternehmer mehr, der seine Kontaktdaten bestätigt, und dabei sicher auf die günstigen Werbemöglichkeiten mittels AdWords hingewiesen wurde.

Wer wird davon profitieren?

Die Unternehmen, denn sie werden automatisch in die Datenbank von Google eingetragen.

Die Personen, die die Arbeit machen. (Diese Arbeit benötigt nur eine Digitalkamera und einen Computer – das ist für Studenten und Arbeitslose eine tolle Sache!)

Google. Sie bekommen einen Datenbestand, glückliche Unternehmer, die vielleicht Werbung buchen und einen Haufen Studenten, die sicher begeistert ihren Freunden von Google Maps erzählen werden.

Start-Ups, die es schaffen, ihre Mitglieder dazu zu bringen, diese Informationen gratis zur Verfügung zu stellen. Sie werden interessante Übernahmekandidaten für Google, bald aber auch Yahoo! und Microsoft.

Wer wird darunter leiden?

Microsoft und Yahoo!, weil Google die Latte höher legt. Sie können sich von ihrem Leiden aber auch durch ähnliche Programme freikaufen.

Local Search-Konkurrenten & -Start-Ups, die nicht das Geld haben, sich wie Yahoo! und Microsoft aus diesem Dilemma freizukaufen.

Webmaster: Sie werden deutlich weniger von Local Search profitieren, da die Informationen ja schon im Besitz von Google sind. Wozu also zu Seiten weiterleiten

Der Markt: Die Eintrittsbarriere für diesen Markt steigt gerade um einige Millionen Dollar an. Und es wird täglich mehr.

Was Google hier macht, bestätigt mich in mehrerlei Hinsicht.

  1. Viele Daten im Local Search-Bereich sind noch gar nicht im Internet verfügbar. Sie müssen erst erzeugt werden.
  2. Man muss andere Leute dazu bringen, die Daten zusammen zu tragen.
  3. Google schafft es einfach nicht, eine Community aufzubauen.

Was Google hier macht, ginge auch anders und billiger. Google könnte eine Community entwickeln, und die Mitglieder wesentlich billiger für ihre Arbeit belohnen. Monatliche Preise, etc. Vielleicht wäre mehr Aufwand notwendig, um die Einträge zu verifizieren, aber es wäre schlussendlich sicher billiger.

Aber gut. Google kann das einfach nicht. Die verstehen soziale Netzwerke nicht oder haben bestimmte Gründe, wieso sie keines entwickeln. Klar, es gibt Gründe, kein Social Network zu entwickeln – es könnte scheitern. Aber es wäre das Risiko wert und hätte mehr Erfolgschancen, als Google Video jemals hatte. (Übrigens: Google Video wurde eingestellt. Wusste eigentlich jemand, dass man dort Videos kaufen konnte? Wie auch immer…)