Ritchie Pettauer über semantische Technologien
Besser selbst gemacht, als verordnet
Vielerorts wird dieser Tage das "Semantic Web" als Zukunft des Internet angepriesen. Computer und Programme sollen dadurch fähig werden, Webseiten zu lesen und zu verstehen, um zum Beispiel doppeldeutige Daten eindeutig zuordnen zu können.
8. April 2017, 21:58
Betrachtet man das semantische Datenmodell genauer, so wird schnell klar, dass zwischen Web 2.0 und der "semantischen" Vision von Tim Berners-Lee nicht nur Welten liegen, sondern dass hier zwei grundsätzlich recht unterschiedliche Paradigmen aufeinander treffen.
Die Problematik, die Berners-Lee, Netz-Vordenker und Direktor des W3C Konsortiums, mit seinem semantischen Modell zu lösen versucht, klingt zunächst relativ trivial: Webseiten sollen maschinenlesbar werden. Das schaffen Bots, wie sie von Suchmaschinen eingesetzt werden, doch schon lange, lautet der erste Einwand. In der Tat allerdings kann von "lesbar" im landläufigen Sinn keine Rede sein. Mittels statistischer Verfahren werden zwar Worthäufigkeiten und -nachbarschaften ermittelt, jegliche Sinnzusammenhänge bleiben den nicht-menschlichen Seitenbesuchern allerdings völlig verschlossen.
Denn um, abstrakt formuliert, aus einer Gruppe von Wörter sinnvolle Zusammenhänge entnehmen zu können, muss a priori bekannt sein, in welchen Beziehungen die bezeichneten Konzepte zueinander stehen. Diese so genannten "Ontologien" strukturieren semantische Relationen, indem sie zum Beispiel Gruppen- und Untergruppenzugehörigkeiten definieren: eine Frau etwa ist stets ein Unterelement der Gruppe Mensch, eine Studentin wiederum Unterelement beider vorher genannter Gruppen - nicht jede Frau allerdings gehört der Gruppe Studentin an. Durch ausgefeilte, klar definierte Relationssysteme kommen Algorithmen somit jenen Inhalten, die man als "Sinngehalt" eines Textes bezeichnen könnte, ein ganzes Stück näher.
Die beschriebenen Gruppenrelationen reichen allerdings längst nicht aus: transaktionale Parameter erweitern den Beziehungsfundus und machen jene Medien, die schon längst als Computerdateien und ASCII-Codes auf Festplatten liegen, wesentlich besser "verständlich".
Resultieren könnten daraus wesentlich effektivere Suchmöglichkeiten sowie bislang ungekannte automatische Recherche- und Aggregationsfähigkeiten. Obgleich seit Jahren diverse Beschreibungsstandards existieren, konnten sich semantische Modelle in der Praxis bislang nicht breitenwirksam durchsetzen: was sich in der Theorie machbar anhört, artet dank der Komplexität von Welt und Sprache schnell in Sisyphusarbeit aus. Selbst die Erfassung einer abgeschlossenen "Domäne" wie "Arbeitswelt" stößt auf zahlreiche Probleme, ganz zu schweigen von der Dynamik und Veränderbarkeit der gesamten Sprache.
Spannenderweise führen in jenem Konglomerat aus Techniken und Use-Cases, das uns gemeinhin als Web 2.0 bekannt ist, exakt die gegenteiligen Strategien zu wesentlich mehr praktischem Erfolg: anstatt zuerst eine vollständige Ontologie zu erstellen, taggen (=beschlagworten) die Benutzer von Social Media Services wie Youtube erst einmal fröhlich drauf los.
Aus der schieren Zahl der Anwender kristallisieren sich relevante Kategorien heraus: allen Ungenauigkeiten und Missverständnissen wie etwa verschiedenen Schreibweisen zum Trotz, haben sich solche kollektiven Beschlagwortungssysteme als eine der "Killerapplikationen" des neuen Netzes erwiesen. Zwar sind die so entstehenden Tag-Wolken meilenweit von vollständigen Ontologien entfernt, dennoch konstatieren mittlerweile viele Informationstheoretiker, dass der "Bottom-Up"- bzw. "Graswurzelansatz", eben jene gern zitierte "Weisheit der Vielen", das alte Problem der "passenden Bezeichnung" sehr pragmatisch löst.
Das Mitmach-Web rückt gleichsam den menschlichen User in den Vordergrund, während die normative Starrheit klassischer Ontologien eine Anpassung des Benutzers an den Algorithmus fordert und erfordert - auf breiter Basis werden semantische Technologien erst dann eine Rolle spielen können, wenn sie ebenso intuitiv und mit so wenig Lernaufwand funktionieren wie die beliebten Services des Internets zweiter Generation.
Ritchie Pettauer ist selbstständiger Medienberater und Autor in Wien.
Link
Tim Berners-Lee