Seit Kurzem ist eine neue Suchmaschine im Internet. Der Name dieser Suchmaschine ist Cuil und hat laut der Daten von TechCrunch 120 Milliarden Websites in seinem Index. Für den Start einer neuen Suchmaschine ist dies eine beträchtliche Zahl, die Cuil gleich in die Profiliga hochschießt.Diese neue Suchmaschine geht dabei nicht wie Google vor, sondern hat sich etwas anderes einfallen lassen, um zu relevanten Ergebnissen zu kommen. Es werden nicht die Backlinks einer Seite analysiert, sondern der Inhalt einer Seite wird genauer unter die Lupe genommen und dann in Bezug zu der vom User gestellten Suchanfrage gebracht. Die Linkpopularität ist hierbei nicht so entscheidend, weil die Qualität einer Seite nicht über ihre Backlinks ermittelt werden kann, sondern eben auf die Güte des Inhalts.
Die Suchmaschinenergebnisseite sieht zudem ebenfalls anders aus, als man dies von den konventionellen Suchmaschinen gewohnt ist. Die Ergebnisse werden wie eine Art Magazin ausgegeben, wo sogar längere Textauszüge der Seite zu lesen sind. Häufig werden diese Textpassagen mit Bildern illustriert. Darüber hinaus werden die Ergebnisse – vor allem bei sehr breiten Suchanfragen – in Kategorien zusammengefasst und es werden gleichzeitig auch alternative Vorschläge gemacht.
Vor allem Datenschützer dürfte es freuen, dass Cuil auf die Speicherung von Nutzerdaten ganz verzichtet (Google speichert die IP zum Beispiel 18 Monate lang).
Die Suchmaschine steckt allerdings noch in ihren Kinderschuhen. Experten verheißen der Suchmaschine allerdings unter Umständen eine große Zukunft. Cuil wird bereits mit „Google Killer” betitelt. Das ist vielleicht noch etwas zu hoch gegriffen. Allerdings sind sich Experten darüber einig, dass Cuil bei seinem Start schon besser sei, als die meisten anderen Suchmaschinen dies bei ihrem Start gewesen sind.
Vielleicht noch interessant zu erwähnen ist, dass die Entwickler von Cuil fast alle ehemalige IBM und Google Mitarbeiter sind. Vor allem aus diesem Grund kann man auf eine große Zukunft der Suchmaschine hoffen, da die Ex-Mitarbeiter von Google sicherlich einiges an Know-How mitbringen und eventuell auch wissen, wo die Schwächen bei Google liegen und wie diese ausgebessert werden können.
01. August 2008
Google ist wohl unumstritten eine der Suchmaschinen mit den besten Suchergebnissen. Das hat wohl auch damit zu tun, dass der Google Index mittlerweile über eine unglaubliche Zahl von 1.000.000.000.000 – also 1 Billionen oder auch anders ausgedrückt eine 1 mit zwölf Nullen – Seiten in seinem Index verfügt. Diese Seiten werden innerhalt von Bruchteilen einer Sekunde auf Relevanz hinsichtlich eines Suchbegriffes durchsucht.Wie kommt es allerdings dazu, dass Google so viele Seiten in seinem Index hat? Eigentlich lässt sich das ganz einfach erklären: Google geht nämlich so vor, dass der Bot auf einige bekannte Seiten geschickt wird, um diese zu durchsuchen. Dabei wird dem Bot die Anweisung mit auf den Weg gegeben, dass er alle Links, die auf einer Seite stehen, verfolgen soll. Auf die Seiten, auf die er anhand der Links gelangt, geht das Spiel wieder von Vorne los und alle Links, die wieder auf dieser Seite stehen, werden verfolgt. So breitet sich der Bot – ähnlich einem Virus – exponentiell über das Internet aus und kommt zu so einer Vielzahl an verschiedenen unique Seiten. Unique deshalb, da es zahllose Seiten gibt, die zwar eine andere Domain haben, aber den exakt gleichen Inhalt haben, wie eine andere Seite. Laut Nissan Hajaj und Jesse Alpert kommen täglich ein paar Milliarden solcher Seiten, die im Grunde genommen nur Duplikate sind, im Internet hinzu. Der Bot von Google durchsucht diese Seiten zwar auch, nimmt die meisten von ihnen allerdings nicht in seinen Index auf.
Man muss aber auch dazu sagen, dass laut der Meinung vieler Experten die von Google indexierten Seiten nur einen Bruchteil vom eigentlichen Internet darstellen. So vermuten diese Experten, dass Google nur circa 10 – 25 Prozent (die Meinungen gehen hierbei weit auseinander) des gesamten Internets repräsentiert. Diese Seiten, die von den Suchmaschinen nicht im Index aufgenommen worden sind, bilden einen Teil des sogenannten Deep Webs.
Abschließend noch ein kleiner Blick in die Vergangenheit: Im Jahre 1998 hatte Google gerade einmal 26.000.000 Seiten in seinem Index. Im Jahr 2000 allerdings schon eine Milliarde. Man sieht also wie schnell sich das Internet vergrößert und es dürfte auch klar sein, dass es deshalb immer unumgänglicher wird eigene Maßnahmen (Stichwort Suchmaschinenoptimierung) zu setzen, um nicht in den unendlichen Weiten des Internets verloren zu gehen, oder schlimmer noch, gar nicht erst auffindbar zu sein.
01. August 2008