Inhalt unklar – Filiale geschlossen

Was bedeutet hier eigentlich „semantisch“? (1)

Was es im Allgemeinen bedeutet, lernen wir im Deutschunterricht. Was es für einen Anwender bedeutet, der im Info-Dschungel festsitzt und genervt von endlosen Ergebnislisten nur unbrauchbares findet, kann man sofort verstehen, wenn man die verfügbaren Suchtechniken vergleicht.

Bei der Suche im Internet kennt jeder den Umgang mit Schlüsselwörtern (Keywords). Dabei wird ein Text in eine Liste von Wörtern aufgeteilt, ohne deren Bedeutung zu berücksichtigen. Häufig erscheinende Elemente – wie Artikel oder Präpositionen – werden „weggeräumt“. Der auf diese Weise behandelte Text ist letztlich nichts anderes, als eine Liste von Zeichenreihen, die gegebenenfalls einige Male erscheinen.

Im Grunde ist es doch genau so, als würden wir einen Text in einer Sprache lesen, die wir nicht verstehen. Wie wäre es etwa mit dem folgenden Beispiel auf Finnisch:

Metrokäteinen & kuljettaa 499 miljoonaa, investoi euroon, kertomusvuosi – ne ovat 279 miljoonaa euroa enemmän kuin edellisvuotena. Maailmanlaajuinen myyntilinja avasi 38 uutta paikkaa, siitä, 3:een, Saksassa. Laajenemisen painotus oli kasvualueilla Itä-Eurooppa ja Aasia/Afrikka 18 ja/tai 16 uudella paikalla. Kiinassa itsepalvelu tukkukauppias kuitenkin laajensi olemassa olevaa paikkaverkkoa 6:een mennessä, ja Venäjällä, 5 uudella markkinalla.

Wenn wir der Sprache nicht mächtig sind, können wir die Bedeutung der Wörter – der Zeichenreihen – nicht verstehen. Gleichwohl begreifen wir, dass kertomusvuosi , enemmän , edellisvuotena und myyntilinja Wörter sind, die sicher eine Bedeutung haben und dass es sinnvoll ist, sie in unseren Index aufzunehmen: unseren Suchwort-, Schlüsselwort- oder Keyword-Index nämlich.

Das bedeutet dann allerdings, dass das betreffende Suchsystem ausschließlich in der Lage wäre, diejenigen Dokumente zu finden, die Wörter enthalten, wie sie zuvor vom Anwender auch exakt so geschrieben wurden. Eine Formulierung also: „…letztes Jahr hat das Unternehmen drei Niederlassungen in Deutschland aufgegeben und fünf in China eröffnet …“ würde uns entgehen, wenn wir eine allgemein übliche, natürliche Sucheingabe verwenden: „Filiale geschlossen“. Ergo, kenne ich den Suchbegriff nicht, finde ich das Dokument nicht.

Ebenso kann man sagen, traditionelle Keyword-Technologie findet Wörter (Sequenzen), versteht aber nicht den tatsächlichen Inhalt von Dokumenten.

Der Satz …
Eine neue erweiterte Suchfunktion namens Utopia versetzt Nutzer in Lage, auf Informationen im Internet auf völlig neue Weise zuzugreifen, indem sie ihnen höchst zuverlässige Suchergebnisse durch jede erdenkliche Suchtechnologie zur Verfügung stellt.“

und der Satz …
Eine namens Utopia zuverlässige Suchergebnisse versetzt Lage in Nutzer, auf im Internet Suchfunktion auf völlig neue Verfügung erweiterte Weise zuzugreifen, indem ihnen höchst neue Suchtechnologie durch jede erdenkliche Informationen zur sie stellt.“

sind gleich!

Notwendig ist in Zukunft eine Technologie, die mehr kann. Eine, die die Inhalte von Dokumenten analysiert und die Bedeutung eines Textes, den semantischen Gehalt, versteht und den Informationsdschungel durchforsten kann.

Soetwas gibt es nicht? Wir werden sehen 🙂

Bis dahin: „Happy research!“

MJA


Advertisements