Donnerstag, April 12, 2007

Semantic Web 1.1

Im folgenden werde ich eine kleine Zusammenfassung über das Semantische Web machen. Ich denke, dass eigentlich sehr viel Potential darin steckt, dass es jedoch im Moment einfach noch sehr in den Kinderschuhen steckt und sich lediglich die Akademiker daran freuen.

Es wird wohl einfach noch ein paar Tools brauchen, welche das Semantic web auch für den normalen User schmackhaft macht.

Im Rahmen einer Arbeit an der Uni habe ich mich ein wenig damit befasst und musste dazu ein kleines Papier schreiben, was doch einen guten Überblick über das Thema abgibt.

Am Besten einfach das RSS Feed abonnieren, damit die neuen Teil automatisch "reinflattern".


1. Motivation für das semantische Web

1.1 Ausgangslage

Das world wide web (www) wie es heute besteht, basiert auf einer unstrukturierten Sammlung von Daten, welche hauptsächlich von Menschen konsumiert werden. Sogar maschinell erstellte Inhalte aus Datenbanken werde meist ohne die klaren Strukturen der Datenbank präsentiert.

Das klassische Szenario für den Einsatz des www ist das stichwortbasierte Suche in Suchmaschinen wie Google, Yahoo oder MSN nach entsprechenden Inhalten. Es ist offensichtlich, dass dieser Prozess nicht sehr gut durch Software unterstützt wird und birgt einige ernsthafte Probleme:

  • Hohe Trefferquote, schlechte Präzision. Selbst wenn die wichtigen Seiten in den Resultaten erscheinen, so sind kaum nutzbar, da gleichzeitig tausende von anderen wenig relevanten Seiten erscheinen.

  • Wenige oder gar keine Treffer.

  • Resultate sind sehr vokabularabhängig. Bei der erstmaligen Suche ergeben die gewählten Keywords oft nicht die gewünschten Resultate, da die gesuchte Seite andere Wörteer benutzt.

  • Als Resultat kommt eine einzele Webseite. Oftmals kommt es jedoch vor, dass die Informationen über mehrere Seiten verteilt sind. Diese müssen dann durch erneute Suchanfragen gefunden werden.

Ein kleines Beispiel soll die heutige Problematik mit keyword basierten Suchmaschinen illustrieren:

„I am a professor of computer science.“
„I am a professor of computer science, well you may think. Well, ...“

Es ist offensichtlich, dass es sich hier um zwei komplett verschiedene Aussagen handelt, obwohl sie sich sehr ähneln.

Aufgrund dieser Problematik wird die Informationsbeschaffung im World Wide Web oftmals zu einer langwierigen und dadurch auch teuren Suche.

Vorwärts