Mehr zu Netzkultur in oe1.ORF.at
Was ist Relevanz?
Relevanz, so Saracevic, müsse nicht erklärt werden. Sie ist intuitiv, primitiv, und wird oft mit "Sie wissen schon" abgetan.
Die Menschen verstehen und verstanden Relevanz genauso wie das Konzept Zeit, Raum, Kultur und Gemeingut. Niemand muss den Usern von Suchmaschinen erklären, was Relevanz ist. Selbst wenn sie sich abmühen etwas Sinnvolles zu finden, haben die Menschen davon eine genaue Vorstellung. (Saracevic, Nature and Manifestation of Relevance, 2007).
Ganz anders in der Information Retrieval Forschung. Dort kennt man bereits über 160 unterschiedliche Definitionen des Begriffs "Relevanz". Auf einer Konferenz über Information Retrieval und Datamining, wie zum Beispiel der WSDM 2009, die letzte Woche in Barcelona stattgefunden hat, gilt als kleinster gemeinsamer Nenner ein Dokument dann als relevant, wenn es einen thematischen Zusammenhang mit der Suchanfrage des Users aufweist.
Aber es geht bei der Bewertung von Relevanz, so Susan Dumais von Microsoft Research auch darum, "ob der User selbst das Gefühl hat, das Ergebnis sei für sein Anliegen relevant." In diesem Fall kommen weitere Relevanzkriterien hinzu, die den Eindruck verstärken können, dass die gelieferten Dokumente dem Inhalt ihrer Suchanfrage entsprechen. Die Details sind hier wichtig, meint Dumais: "Sind Sie mit dem Thema vertraut? War ihre Fragestellung eindeutig oder nicht? Schließlich kann ich unter ein und demselben Wort was anderes verstehen als Sie."
Um die vielen Nuancen von Relevanz zu treffen, vertraut man zum Beispiel auf Page Rank Algorithmen, mit denen berücksichtigen werden kann, wie oft eine Webseite verlinkt wurde. Je öfter dies der Fall ist, umso mehr steigt ihr Wert oder ihre Relevanz, und umso höher wird sie von Suchmaschinen gereiht.
Page Rank war auch das Erfolgsrezept von Google Ende der 1990er Jahren. Heute weiß man zumindest, dass die Suchalgorithmen von Google mindestens sieben Mal grundsätzlich überarbeitet wurden. Neben der Verlinkung wird auch das Klickverhalten von Usern gerne als Relevanzkriterium gehandelt. Nicht nur von den Anhängern von Webstatistiken, sondern auch von Wissenschaftlern, die sich mit der Informationssuche beschäftigen. Schließlich setzt ein User damit eine aktive Handlung.
Ein Klick löst sicherlich ein Signal aus, aber, so Susan Dumais, es kommt mit sehr viel Rauschen daher. Zwar sei es wahrscheinlich, dass ein User eher auf ein Suchergebnis klickt, dass ihm relevant erscheint, aber das ist noch lange nicht das Ende der Geschichte. "Ein Klick kann von vielen Dingen beeinflusst werden: Die Relevanz ist da nur ein Punkt. Ein anderer ist die Qualität des Textausschnitts, der mit dem Link mitgeliefert wird. Weiters kann es sein, dass ein Suchergebnis zwar perfekt auf Ihre Anfrage passt, aber Sie dies nicht erkennen, weil er nicht mit dem richtigen Unicode geliefert wird. Wenn etwas in einer Sprache geschrieben ist die Sie nicht verstehen, dann haben Sie wenig Chancen den Wert des Dokuments zu erkennen."
Unicode sorgt dafür, dass im Browser weit mehr als nur englische und lateinische Schriftzeichen dargestellt werden können. Die Unzufriedenheit mit einem Klick hat aber nicht nur etwas mit mangelnder Sprachkenntnis zu tun. Und nicht immer sind Spammer oder die Werbung dafür verantwortlich, dass sich hinter einem Link nur Schrott befindet.
Manchmal ist es auch die Bequemlichkeit des Users, die das Resultat beeinflusst. User haben es sich zur Gewohnheit gemacht, sich mit den ersten zehn Resultaten einer Suchabfrage zufrieden zu geben. Es ist daher wenig verwunderlich, dass User mit 45 Prozent des Ergebnisses ihre Klicks alles andere als zufrieden sind, wie Susan Dumais von Microsoft Research herausfand.
Matrix, Sonntag, 22. Februar 2009, 22:30 Uhr
Links
Tefko Saracevic - Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science.
Susan Dumais
WSDM 2009
Computerspiele, die Geschichten schreiben
Lauter Streit um leise Töne
Finger statt Maus und Tastatur
Netzpolitik
Die Zukunft des Fernsehens
DIY
Interface-Design einmal anders
Die neue Erfindung des Buches
Plattform ELGA
Wenn der Schreibtisch Open Source wird
Vom Hörensagen
Datentransport
Webisode
Books and Gadget
Wenn das Internet im Archiv landet
Zwischen Gratiskultur und Paid Content
Laufsteg im Netz
Interaktivität
Flexibler Arbeitsplatz
Lifelogging
Civilmedia 09
Virtuelle Friedhöfe
Computerpionier Alan Kay
Paraflows 09
Die andere Geschichtsstunde
Open Spectrum Alliance
Kleidsame Technik
Zocken bis zum Abwinken
Die Plug-and-Play-Publizisten
Das Tor zur Information
Zu viel Post
Maulkorb im Netz
Der Geist in der Konsole
Roboter am Ball
Das kollaborative Internet
Zahlen fürs Saugen
Independent Games boomen
4chan
Coded Cultures
Alles neu?
ÖH-Wahl 2009
Hilfe per Mausklick
Europa-Net?
Kiva.org
Online-Rollenspieler werden erwachsen
re:publica'09
Die Erkundung der Online-Gesellschaft
Information Sharing
Hello World!
Das Web und die Wirtschaftskrise
The most social software
Suchen im Netz
Green IT
Visual Computing
Community Funded Reporting: Spot.us
Open Source für den Fernseher
Enter the matrix ...