In letzter Zeit kommen superviele Leute zum Schplock, nachdem sie Chomsky Mainz gesucht haben – fasziniert habe ich festgestellt, dass das Schplock bei Googlesuchen danach zur Zeit an erster Stelle steht.
Das liegt nun aber, vermute ich, weniger an der großen Berühmtheit des Schplocks, als an meinem kreativen Titel: Chomsky in Mainz.
Wenn man sowas – im Gegensatz zu mir – absichtlich macht, wird es SEO genannt, Search Engine Optimization. Das bedeutet, dass eine Internetseite für Suchmaschinen optimiert wird, indem man ihr alle relevanten Informationen schnell und unverschnörkelt liefert.
So eine Suchmaschine sucht nämlich nach den beiden Wörtern in möglichst enger Verbindung – je näher sie beieinander stehen, desto wahrscheinlicher ist es, dass sie auch wirklich etwas miteinander zu tun haben. Da spielt natürlich noch viel mehr rein, Überschriften sind wichtiger als Text etc. – wahrscheinlich kennen die meisten von Euch sich da besser aus als ich. Kürzlich habe ich hier was ganz Interessantes dazu gelesen, wie Zeitungen mit SEO umgehen, ich glaube ich hatte den Link vom BILDBlog, finde ihn da aber nicht mehr.
Die nächsten Treffer nach dem Schplock bei der Chomsky-Suche haben dann auch einen größeren Abstand zwischen den beiden Suchwörtern:
- Noam Chomsky kommt nach Mainz
- Vortragsankündigung: Noam Chomsky ist am 24. März in Mainz! (und im Text: … einen Vortrag an der Universität in Mainz. Noam Chomsky ist zu Gast …)
- Special Lecture im Rahmen der “Johannes Gutenberg-Stiftungsprofessur” mit NOAM CHOMSKY (hier kommt Mainz auch im Text nicht vor, aber es ist eine Seite der Uni Mainz)
- Hochkarätiger Sprachwissenschaftler Noam Chomsky zu Gast an der Johannes Gutenberg-Universität Mainz
An sechster und siebter Stelle gibt es zwei Treffer, die nur ein Wort Abstand haben, einmal ein PDF und einmal ein YouTube-Video – vielleicht spielt da die Art der Quelle mit rein?
Auch der Erfolg des Schplock-Beitrags Von Pentekoste zu Pfingsten: Die 2. Lautverschiebung schlägt zu beruht wahrscheinlich auf seiner hohen Position bei Google – allerdings nur, wenn man Zweite Lautverschiebung sucht (4. Treffer), nicht bei 2. Lautverschiebung (19. Treffer) oder hochdeutsche Lautverschiebung (90. Treffer, das Synonym hätte ich besser mal untergebracht 😉 ).
Finden kann jeder. Der Erfolg einer Suchmaschine hängt vom Ranking ab, also davon, ob die für den Benutzer wichtigen Seiten oben einsortiert werden. Am besten ganz oben. Am Anfang war PageRank die Grundlage von Google: Seiten, auf die viele andere Seiten verlinken, werden nach oben sortiert. Mittlerweile dürfte die Strategie um einiges komplexer und feingranularer geworden sein. Genaueres weiß man nicht. Wie eine Suchmaschine wirklich die Treffer sortiert, das ist ein gut gehütetes Betriebsgeheimnis.
So ganz generell gibt es aber Dinge, die eine Page recht zuverlässig nach oben befördern. Zum Beispiel: Die Suchbegriffe sind im Titel der Seite (oben im Fenstertitel des Browsers), die Suchbegriffe sind Teil der URL oder sogar der Domain.
Zusätzlich kann man noch vermuten, dass das altebewährte TF-IDF mit reinspielt. Das ist ein Verfahren, das Dokumente hoch bewertet (und oben einsortiert), in denen die gesuchten Begriffe möglichst exklusiv vorkommen.
Und natürlich, wie hier schon beobachtet, versuchen einige Suchmaschinen, zuerst die Suchabfrage als möglichst zusammenhängenden Schnipsel zu finden.