oe1.ORF.atORF.at
oe1.ORF.at
Webradio Podcast
Highlights
Seit es das World Wide Web gibt wird es mit Informationen gefüttert und werden Informationen dort gesucht.

Mehr zu Netzkultur in oe1.ORF.at
Suchen im Netz
Was ist Relevanz?
Seit mehr als 50 Jahren gibt es Computer. Das Internet wie wir es kennen ist 28 Jahre alt und das World Wide Web wird seit rund 15 Jahren im großen Stil mit Informationen gefüttert. Die Frage was relevant und was irrelevant ist, stellt man sich im Forschungsbereich Information Retrieval seit 1951, schreibt der aus Kroatien stammende Informationswissenschafter Tefko Saracevic, der heute in New Jersey an der "Rutgers University" "Information and Library Studies" unterrichtet. Im Vergleich dazu ist die Frage nach der Relevanz alt. Die, so Saracevic in seinem Aufsatz "Nature and Manifestation of Relevance", stellen sich die Menschen seitdem sie angefangen haben miteinander zu kommunizieren.

Relevanz, so Saracevic, müsse nicht erklärt werden. Sie ist intuitiv, primitiv, und wird oft mit "Sie wissen schon" abgetan.

Die Menschen verstehen und verstanden Relevanz genauso wie das Konzept Zeit, Raum, Kultur und Gemeingut. Niemand muss den Usern von Suchmaschinen erklären, was Relevanz ist. Selbst wenn sie sich abmühen etwas Sinnvolles zu finden, haben die Menschen davon eine genaue Vorstellung. (Saracevic, Nature and Manifestation of Relevance, 2007).
Die Bewertung von Relevanz
Ganz anders in der Information Retrieval Forschung. Dort kennt man bereits über 160 unterschiedliche Definitionen des Begriffs "Relevanz". Auf einer Konferenz über Information Retrieval und Datamining, wie zum Beispiel der WSDM 2009, die letzte Woche in Barcelona stattgefunden hat, gilt als kleinster gemeinsamer Nenner ein Dokument dann als relevant, wenn es einen thematischen Zusammenhang mit der Suchanfrage des Users aufweist.

Aber es geht bei der Bewertung von Relevanz, so Susan Dumais von Microsoft Research auch darum, "ob der User selbst das Gefühl hat, das Ergebnis sei für sein Anliegen relevant." In diesem Fall kommen weitere Relevanzkriterien hinzu, die den Eindruck verstärken können, dass die gelieferten Dokumente dem Inhalt ihrer Suchanfrage entsprechen. Die Details sind hier wichtig, meint Dumais: "Sind Sie mit dem Thema vertraut? War ihre Fragestellung eindeutig oder nicht? Schließlich kann ich unter ein und demselben Wort was anderes verstehen als Sie."
Relevanzkriterien
Um die vielen Nuancen von Relevanz zu treffen, vertraut man zum Beispiel auf Page Rank Algorithmen, mit denen berücksichtigen werden kann, wie oft eine Webseite verlinkt wurde. Je öfter dies der Fall ist, umso mehr steigt ihr Wert oder ihre Relevanz, und umso höher wird sie von Suchmaschinen gereiht.

Page Rank war auch das Erfolgsrezept von Google Ende der 1990er Jahren. Heute weiß man zumindest, dass die Suchalgorithmen von Google mindestens sieben Mal grundsätzlich überarbeitet wurden. Neben der Verlinkung wird auch das Klickverhalten von Usern gerne als Relevanzkriterium gehandelt. Nicht nur von den Anhängern von Webstatistiken, sondern auch von Wissenschaftlern, die sich mit der Informationssuche beschäftigen. Schließlich setzt ein User damit eine aktive Handlung.
Ein Klick allein sagt wenig aus
Ein Klick löst sicherlich ein Signal aus, aber, so Susan Dumais, es kommt mit sehr viel Rauschen daher. Zwar sei es wahrscheinlich, dass ein User eher auf ein Suchergebnis klickt, dass ihm relevant erscheint, aber das ist noch lange nicht das Ende der Geschichte. "Ein Klick kann von vielen Dingen beeinflusst werden: Die Relevanz ist da nur ein Punkt. Ein anderer ist die Qualität des Textausschnitts, der mit dem Link mitgeliefert wird. Weiters kann es sein, dass ein Suchergebnis zwar perfekt auf Ihre Anfrage passt, aber Sie dies nicht erkennen, weil er nicht mit dem richtigen Unicode geliefert wird. Wenn etwas in einer Sprache geschrieben ist die Sie nicht verstehen, dann haben Sie wenig Chancen den Wert des Dokuments zu erkennen."
45 Prozent der User sind mit Suchergebnissen unzufrieden
Unicode sorgt dafür, dass im Browser weit mehr als nur englische und lateinische Schriftzeichen dargestellt werden können. Die Unzufriedenheit mit einem Klick hat aber nicht nur etwas mit mangelnder Sprachkenntnis zu tun. Und nicht immer sind Spammer oder die Werbung dafür verantwortlich, dass sich hinter einem Link nur Schrott befindet.

Manchmal ist es auch die Bequemlichkeit des Users, die das Resultat beeinflusst. User haben es sich zur Gewohnheit gemacht, sich mit den ersten zehn Resultaten einer Suchabfrage zufrieden zu geben. Es ist daher wenig verwunderlich, dass User mit 45 Prozent des Ergebnisses ihre Klicks alles andere als zufrieden sind, wie Susan Dumais von Microsoft Research herausfand.
Text: Mariann Unterluggauer
Hör-Tipp
Matrix, Sonntag, 22. Februar 2009, 22:30 Uhr

Links
Tefko Saracevic - Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science.
Susan Dumais
WSDM 2009
Um Ihre Meinung abgeben zu können, müssen Sie sich einloggen. Log-in
Die ORF.at-Foren sind jedermann zugängliche, offene und demokratische Diskursplattformen. Bitte bleiben Sie sachlich und bemühen Sie sich um eine faire und freundliche Diskussions-Atmosphäre. Die Redaktion übernimmt keinerlei Verantwortung für den Inhalt der Beiträge, behält sich aber das Recht vor, krass unsachliche, rechtswidrige oder moralisch bedenkliche Beiträge zu löschen.