Neues vom Google-Algorithmus

22.Juni 2008

Ein Interview mit dem Forschungsleiter von Google (Peter Novrig) gibt neue Einblicke in die Funktionsweise des Google-Algorithmus. So besteht das Ranking bei einer Suche mit Google aus zwei Phasen.Die erste Phase bezeichnet Novrig als die „Offline-Phase”. Hier werden vom Googlebot indizierte Seiten analysiert und anschließend – auf der Analyse basierend – 200 Signale herausgerechnet. Als solche Signale bezeichnet er beispielsweise den allseits bekannten Google PageRank, oder die Linkstruktur einer Seite. Diese Berechnungen und Analysen sind sehr zeit- und rechenaufwändig betont er.

Die zweite Phase des sogenannten Ranking-Algorithmus ist die „Online-Phase”. Diese Phase kommt erst zu Einsatz, wenn ein Google-Suchender einen Suchbegriff bei der Suchmaschine eingibt. Für das Keyword erstellt Google zunächst eine Liste mit allen Dokumenten, die das gesuchte Wort beinhalten. Die gesamten Dokumente werden dann anhand eines eigens konzipierten, schnellen Algorithmus mittels der extrahierten Signale aus der Offline-Phase geranked.

Spannend ist, dass die nötigen Optimierungen der Online-Phase nach wie vor von menschlicher Hand durchgeführt werden. Spannend deswegen, weil sich eigentlich gerade hier ein technischer, lernender Algorithmus anbieten würde. Novrig betonte, dass Google sehr wohl über solche maschinellen Algorithmen verfüge, die teilweise sogar bessere Ergebnisse bringen, als der Mensch. Das große Manko des Algorithmus sei allerdings, dass er nur mit im Training vorgekommen Situationen fertig wäre. Eine unerwartete Suchanfrage, die er im Training nicht durchgemacht hat, hätte demzufolge fatale Auswirkungen.

Interessant ist auch, dass Google eine riesige Anzahl an Daten vom User speichert. Vor allem, wie der User mit den Suchmaschinenergebnissen umgeht, ob er sie beispielsweise klickt, oder nicht. Darüber wurde schon lange spekuliert und ist somit auch nichts Neues. Neu dürfte den meisten allerdings die Tatsache sein, dass diese gespeicherten Daten (noch?) keinen Einfluss auf die Positionierung einer Seite haben. Für solche Bewertungen hat Google immer noch ein eigenes Team von Ratern engagiert, die sich mit diesen Dingen befassen.

Der Grund liegt darin, dass bei einem Versuch, das Userverhalten mit in das Ranking einfließen zu lassen, keine großen Veränderungen mit sich brachte. Das liegt wahrscheinlich darin, dass User von Vorn herein eher auf die ersten Ergebnisse klicken, unabhängig davon, ob deren Qualität nun gut ist, oder nicht. So haben Seiten, die weiter hinten in den Suchmaschinenergebnissen gelistet sind, weniger Chancen ein positives Ranking zu bekommen, auch wenn deren Inhalt vielleicht sogar besser ist, als der Inhalt der Webseite auf Platz Eins.

Da liegt dann auch der Vorteil der Google-Ranker. Sie bewerten die einzelnen Seiten unabhängig von deren Platzierung, was somit eine objektivere Bewertung mit sich bring. Die daraus gewonnen Daten fließen dann wieder in den neuen Algorithmus mit ein.

Artikel gespeichert unter: Algorithmus

Ihr Kommentar

Pflichtfeld

Pflichtfeld, anonym

Folgende HTML-Tags sind erlaubt:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackback diesen Artikel  |  Kommentare als RSS Feed abonnieren


Kalender

Juli 2017
M D M D F S S
« Mrz    
 12
3456789
10111213141516
17181920212223
24252627282930
31  

Virtualrank Werbung

Aktuelle Artikel