Suchmaschinenmarkt vor Paradigmenwechsel – Was kommt nach dem Webgraphenmodell?

Ein viel zitiertes Gerücht besagt: Suchmaschinen werden künftig die Relevanz einer Website für eine Suchanfrage nicht mehr anhand von Backlinks abschätzen.

Der aktuelle Webmaster-Video-Post von Matt Cutts (Google) geht dieser Thematik nach:

Vor kurzem gab es mal eine Meldung über Yandex, dass man dort (in Russland, genauer gesagt erst mal für die lokale Suche um Moskau) auf Backlinks verzichten will. Ergebnisse kennen wir noch nicht.

Für Google wäre ein solcher Schritt ein Paradigmenwechsel, ist aber wohl kurzfristig nicht zu erwarten. Der ganze Erfolg der Suchmaschine beruht, wenn man so will, auf der Idee, dass wichtige und relevante Webdokumente von anderen Webdokumenten aus verlinkt werden und unwichtige nicht. Das lässt sich mit dem Webgraphenansatz, also graphentheoretisch modellieren und maschinell sehr gut umsetzen. Man muss nur sehr, sehr viele Webdokumente finden und auswerten. Das kostet Zeit und Rechenkapazität. Dann hat man aber eine gute Suchmaschine, wie Google.

Natürlich gibt es eine Reihe weiterer Kriterien. Aber im Zentrum stand bisher immer der PageRank, wie dieses Graphenmodell bei Google heißt. Offensichtlich gibt es noch nichts besseres, was praktikabel wäre.

Man fragt sich natürlich, welches Kriterium sonst eine Rolle spielen könnte. Immer noch können Suchmaschinen den Sinn von Wörtern schlecht erfassen. Das semantische Web bleibt wohl vorerst Träumerei. Hübsch im Labor, untauglich in der Praxis. Diese semantische Information tragenden und dennoch maschinenkompatiblen Microformats sind auch viel zu unhandlich, um sie in Webdokumenten einzusetzen (dazu hat man als Mensch ja eigentlich die Sprache).

Yandex will auf Backlinks zur Festlegung der Suchergebnisposition verzichten

Die russische Suchmaschine Yandex möchte offensichtlich neue Wege gehen, um die Reihenfolge der Suchergebnisse auf der Suchergebnisseite festzulegen. Es sieht so aus als würde Yandex, die mit 61 Prozent Marktanteil meistverwendete Suchmaschine in Russland, zumindest zunächst für die Region Moskau, wie es heißt, auf das Ranking-Kriterium Backlinks verzichten wollen.

http://seograd.com/2013/12/yandex-turns-seo-business-upside-down/
http://www.design4u.org/russland-gus/seo-russland/yandex-mini-faq-zum-ranking-ohne-backlinks/ 

Statt dessen sollen, wie es in einer Unternehmens FAQ heißt, 750 andere Kriterien herangezogen werden, um wichtige von unwichtigen Seiten zu unterscheiden.

„Wir hoffen, dass wir mit der Neuausrichtung zu einem zivilisierteren Internet-Marketing beitragen können“, heißt es in einer Übersetzung der FAQs, die auf design4u.org veröffentlicht ist. Weiter: „Wir erwarten eine deutlich steigende Nachfrage nach Leistungen im Bereich Usability, mit dem Ziel Konversionsraten zu steigern.“

Ziel dieses Experiments ist wohl, den „Überoptimierungen“ entgegen zu wirken. Offensichtlich sollen Kriterien, die als Onpage-Faktoren bekannt sind, wichtiger werden. Die Ankündigung von Yandex hat SEO-Agenturen in zwei Lager geteilt: Es gibt sowohl viele Befürworter als auch strikte Ablehner des neuen Kurses. Die lokale Suche ist für Yandex sehr wichtig, denn die Ergebnisse gelten hier als besser im Vergleich zu denen von Google.

Zwar ist die Überoptimierung durch eingehende Links, die gekauft oder gemietet werden können, schon seit vielen Jahren ein Problem. Eine überzeugende Lösung hatte bisher jedoch noch keine wichtige Suchmaschine. Große Hoffnungen liegen in der semantischen Suche, oft auch als „Internet der Dinge“ apostrophiert.

Mit der Anzahl und Wertigkeit eingehender Links wird die „Wichtigkeit“ einer Domain oder einer einzelnen Webseite abgeschätzt. Das zugrundeliegende Paradigma ist, dass eine Webseite umso wichtiger ist, je mehr Links darauf zeigen.  Googles zentraler PageRank Algorithmus basiert auf dieser graphentheoretischen Idee und hat Anfang der 2000er Jahre die Suchmaschinenlandschaft weltweit revolutioniert. Im Laufe der Zeit gab es viele Korrekturen und Anpassungen, aber nach wie vor wird die Reihenfolge der Ergebnisse hauptsächlich durch die Anzahl der Links auf diese Seite bestimmt. Andere Faktoren sind untergeordnet wichtig.

Der Freilandversuch von Yandex kann als Experiment gewertet werden. Vermutlich deshalb ist der Einsatz zunächst auf die Region Moskau beschränkt. Man darf also gespannt sein, wie sich die Ergebnisseiten verändern werden.

Altavista: eine weitere Suchmaschine geht den Bach runter

Es hat sich wohl schon länger abgezeichnet, nun ist es amtlich: Die Suchmaschine Altavista wird es nicht mehr lange geben.

http://www.heise.de/newsticker/meldung/Yahoo-macht-Altavista-dicht-1908789.html

Damit ist die Suchmaschinenwelt um eine Alternative zu Google ärmer.

Altavista hat eine lange und wechselvolle Geschichte hinter sich. In den 90er Jahren des vergangenen Jahrtausends gehört Altavista zu den bekanntesten und leistungsfähigsten Volltext-Suchmaschinen.Gestartet aus einem Forschungsprojekt heraus und genutzt als Demonstration für Servertechnologie, hat Altavista im Laufe der Zeit versucht, sich von der Suchmaschine zum Portal zu wandeln, um sich dann wieder auf Suche zu fokussieren.

Hier ist ein Screenshot von 1996 (Screenshots von http://archive.org/)

Das Web und das Usenet konnte man mit Altavista durchsuchen. Altavista sprach von 275.600 Servern und 30 Millionen Webseiten, die damit durchsuchbar waren plus 4 Millionen Artikel in 14.000 Usenet Groups.

1997 sah Altavista nahezu genauso aus. Es kamen mehr Links und Contentelemente dazu.

Ein Jahr später hat Altavista Tabs eingeführt, um damit Spezialsuchen zu ermöglichen. Es gab eine „Business Search“ und eine „People Search“:

Screenshot 1999

Was ist passiert? Die Internetnutzung ist populär geworden und diese Zeit war die große Zeit der Portale und der Walled Gardens (AOL, Compuserve etc.). So wurde auch Altavista portaliger. Dahinter steckte sicher der Versuch, die Nutzer an die Marke zu binden, um den vielen Traffic, den Suchmaschinen damals hatten, zu monetarisieren. Der Versuch war, die User zum Klicken auf den Content zu bewegen, wo man mehr Werbung als auf der Startseite zeigen konnte.

Screenshot 2000
Der Portalansatz hat sich noch mehr durchgesetzt. Die Seiten wurden breiter und breiter. In der Version von 2000 konnte sich die Altavista-Website an die Breite des Bildschirmfensters anpassen. Es gab Spezialsuchen u.a. für MP3, Bilder und Video. 
Die Jagd nach Klicks wurde immer wichtiger: Wichtige Begriffe wurden oben unter der Suchbar platziert. Man hat Suchreiter eingeführt, Shoppinglinks wurden integriert und im zentralen Teil der Seite wurde der Katalog angezeigt. Links sieht man Newsheadlines und den Versuch, die Monetarisierung zu verbessern, indem man Aktionen und externen Content eingebunden hat. Die Suchfunktion als eigentliches Kernfeature geriet fast schon in den Hintergrund.  
Screenshot von 2001
Die Suchtabs wurden offensichtlich wieder aufgegeben, steigenden Bildschirmauflösungen und größeren Monitoren hat man Rechnung getragen. Das Design State of the Art zielte damals auf eine verschlankte Optik (weiße Ränder links und rechts) ab. Die Contentspalte wurde in der Mitte zentriert. 
Meiner Meinung steckte bei diesem redesign hier auch der Versuch dahinter, der Websuche wieder mehr Gewicht zu geben. Google ist im Jahre 2001 ungefähr 4 Jahre auf dem Markt und verzeichnet wachsende Erfolge. Die Portalstrategie von Altavista scheint nicht aufzugehen. 
In Erinnerung dürfte vielen noch der Altavistas Babelfish sein, ein Onlineübersetzungstool. 
2003 war ein entscheidendes Jahr für Altavista. Overture hat die Firma übernommen. Overture gehört zu Yahoo. 
Das Altavista Redesign von 2003 kehrt zu einer sehr schlichten Website mit der Suche im Mittelpunkt zurück – ein Paradigmenwechsel, sicher als Reaktion auf Googles Erfolg. Einige Kategorien werden mit Links darunter gezeigt. Die Suchtabs für die Spezialsuchen sind wieder da. 
Wie man in diesem Screenhsot von 2008 sieht, ist man diesem Weg treu geblieben. Das Directory (der von Redakteuren betreute Webkatalog) ist verschwunden. 
Ab 2010 wird einfach der Yahoo-Suchindex verwendet. Altavista ist nur noch ein Frontend. 
Noch ein bisschen reduzierter präsentierte sich Altavista zuletzt 2013. 
Nun zieht Yahoo den Stecker: Am 8.7.2013 geht Altavista offline. 

Und noch eine neue Suchmaschine

Microsoft lebt ja doch noch! Die Livesearch kommt einfach nicht an Googles Vormachtstellung heran, teilweise durchaus berechtigt, denn vieles wird gar nicht gefunden. Nun soll Bing (ehemals war der Projektname „Kumo“) an den Start gehen. Am 3.Juni soll freigeschaltet werden, in der deutschen Version erst mal abgespeckt. Zur Zeit ist nur ein Werbevideo unter http://bing.com zu sehen. Ähnlich wie Wolframalpha will Bing mehr Antworten geben, eine „Antwortmaschine“ möchte Bing sein, keine Suchmaschine.

Das Video legt nahe, dass Bing versucht, Ergebnisse zu strukturieren und nicht nur eine Liste von Treffern anzuzeigen. Wer in Live zur Zeit ein einfaches Suchwort wie „Gütersloh“ eingibt, erhält eine Liste mit möglichst relevanten Treffern, aber eben nur eine Liste, wobei die Domain guetersloh.de immer wieder vorkommt, nämlich ergänzt mit Third Level Domains, also eben auch so: haushalt.guetersloh.de, webcam.guetersloh.de, stadtplanung.guetersloh.de…
Das will Bing anders machen und Ergebnisse zu einem Suchwort nach Themen sortiert darstellen.

Wenn das Werbevideo tatsächlich das widerspiegelt, was Bing leistet, dann ist Bing offensichtlich zugeschnitten auf den Internetuser, der ein Restaurant in New York sucht, seine Urlaubsplanung machen möchte und Hotels und Airlines vergleicht oder eine neue digitale Kamera kaufen will. Vielleicht für User gut, die einfache und einzelne Suchworte eingeben.

Hotels und Restaurants zu finden, Kameramodell zu vergleichen, das alles funktioniert ja heute schon ganz gut, vielleicht ist die Vergleichdarstellung dann etwas komfortabler, aber eine Suchmaschine soll zum Beispiel eben auch einen XP-Treiber für einen SIS Mirage 3 Grafikchip finden können wie er in Packard Bell Noitebooks verbaut ist, wobei auf der Herstellerseite nur ein Vista-Treiber angeboten wird. Hier zeigt sich meiner Meinung nach, was eine Suchemaschine kann. Und für sowas gibt es zur Zeit wohl nichts besseres als Google, leider.

Revolution am Suchmaschinenmarkt mit Wolfram Alpha?

Leider gehöre ich nicht zu denen, die die neue Suchmaschine wolframalpha.com vorab testen können, aber ich finde es gut und richtig, eine Alternative zu Google zu bekommen, von Yahoo oder MS Livesearch mal abgesehen. Im Mai 09 soll der Zugang ja offen sein, steht auf der Webseite. Ich hoffe, diesem Projekt ist mehr Glück beschieden als der Wikisearch.
Nachtrag: Inzwischen ist Wolframalpha ja live. Man merkt sehr deutlich, dass der Vater von Wolframalpha eben Mathematiker ist. Schön, wenn man mal die eine oder andere Maßzahl oder Währung in andere Einheiten umrechnen muss.
Wolframalpha ist nicht ideal bei Schlagwortsuchen, wenn man ausführliche Texte und weiterführfende Erklärungen erwartet. Dafür – und das kann vorteilhaft sein – kann man mit Vergleichen, grafischen Darstellungen und knappen Erklärungen rechnen. Beispiel: „democracy“ – hier liefert Wolframlpha die Definitionen des Begriffs in der Philosophie, der politischen Theorie und der Theorie politischer Systeme. Ich bekomme eine Liste verwandter Wörter, die Wortdichte in der gesprochenen und geschriebenen Sprache und Ausspracheregeln. Bei der Eingabe von „A/H5N1“ versucht Wolframalpha darin eine mathematische Formel zu sehen während Google mit der Grippe richtig liegt.
Sehr oft erhalte ich „WolframAlpha isn’t sure what to do with your input“, auch wenn ich beispielsweise „influenza A/H5N1“ tippe.
Wolframalpha will Antworten geben, nicht Treffer im Internet suchen. Die Eingabe „radius earth“ liefert sfort eine Antwort, liefert Vergleiche mit anderen Planetenradien. Google verweist auf eine Wikipediaseite. Der Ansatz von Wolframalpha funktioniert mit numerischen, vergleichbaren Daten sehr gut, weniger bis gar nicht bei theoretischen Begriffen wie „psychology“. Hier hilft diese Suchmaschine nicht weiter. Überhaupt bezeichnet sich Wolframalpha auch nicht als Suchmaschine, sondern als computational knowledge engine. Wolframalpha versucht zu berechnen, zu vergleichen.