Rhein-Zeitung.de: Google-Suche soll mehr direkte Antworten liefern

Logo der Rhein-Zeitung OnlineNew York (dpa) – Google will bei seiner Suchmaschine künftig stärker direkte Antworten auf die Fragen seiner Anwender und Fakten liefern. Der Internetkonzern arbeite zur Zeit an einem massiven Umbau seiner Suchfunktionalitäten, berichteten das «Wall Street Journal». Mit einer neuen Suchformel solle die semantische Suche eingeführt werden. Damit könnten die Anwender Fragen nach Personen, Orten und Dingen stellen, deren Sinn dann von der Suchmaschine erkannt wird… Weiter lesen

Semantische Technologien und die Handhabung komplexer Inhalte

Was bedeutet hier eigentlich „semantisch“? (3)

Eine semantische Analyse schließt grammatische, logische, morphologische Analysen ein sowie die Identifikation von Begriffskonzeptionen. Mit anderen Worten, es werden die verschiedenen Bedeutungen der Begriffe richtig identifiziert.

Was heißt das? Zum Beispiel im Falle von Homonymen*: Wenn etwa bei einer Suche das Wort „Elf“  („der Elf“ für Märchengestalt, „die Elf“ für Fußballmannschaft oder „elf“ die Zahl) verwendet wird oder das Wort „Reif“ (als Ring,  Eiskristalle und reif, das Adjektiv in der Bedeutung „voll entwickelt“). Da ist ein Wort dreimal mit unterschiedlichen Eigenschaften (Artikel, Wortart) aber in der (fast) gleichen schreibweise – wenn man mal von der Kleinschreibung des Adjektivs absieht. Wenn ich etwa Polo suche, und ich meine den Sport, dann möchte ich nicht von Angaben über Autos, Polohemden oder Marc O´ überschüttet werden, oder? Wie ist das bei Ihnen? Zu ähnlichen Verzerrungen kommt es, wenn ich Heteronyme suche, also Wörter, die gleich geschrieben, aber anders ausgesprochen werden und auch eine andere Bedeutung haben. Zum Beispiel modern (neuzeitlich) oder modern (verfaulen). Semantics können diese Begriffe korrekt identifizieren.

Bei Wörtern, zu denen es viele Synonyme gibt, ist es auch ganz nett. Beispiel: Orange – Apfelsine; Streichholz – Zündholz. Unterschiedliche Wörter mit der gleichen Bedeutung – wenn ich danach suche, müssen mir auch alle Wörter einfallen, um die gewünschten Ergebnisse vollständig zu erhalten. Und immer so weiter. Hyperonyme, also Oberbegriffe etwa: Hund – Basset Hound, Beagle, Bearded Collie, Schäferhund; oder Auto – Limousine, Coupé, Cabrio, SUV. Semantische Technologien identifizieren, dass es um Hunde geht, wenn das Thema „Bearded Collie“ diskutiert wird oder um Autos, wenn „das Verdeck zu einem Cabrio“ gehört. Solche linguistischen Begriffskonzepte werden berücksichtigt. Tatsächlich können so Texte in ähnlicher Weise analysiert werden, wie es der Mensch beim Lesen tut.

Unter diesen Voraussetzungen gelangt man von dem was als Knowledge Management bezeichnet wird in den Bereich von Semantic Intelligence. Semantische Technologien ermöglichen die Handhabung großer Datenmengen und komplexer Inhalte und überbrücken so die klassische „Suche“ mit all ihren Einschränkungen direkt hin zum „Finden, Organisieren, Auswählen, Korrelieren/ Zuordnen“. Ganz ähnlich wie Business Intelligence in der Welt strukturierter Daten ist Semantic Intelligence der geeignete Ansatz, vor allem wenn es um das Erschließen unstrukturierter Daten/ Informationen geht.

MJA

*Zu den linguistischen Begriffen lassen sich bei Wikipedia (Kategorie:Semantik) hinreichend gute Beschreibungen und neben den hier aufgeführten noch viele andere Beispiele finden.

Topaktueller Zugriff zum Informationschaos

Das Internet ermöglicht den ungehinderten topaktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt es Stakeholdern ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Leider finden wir den Großteil dieser Informationen in eher unstrukturiertem Zustand vor, d.h. wir finden das, was wir finden wollen oder müssen eher nicht. Oder nur mit großem Rechercheaufwand. Auf Websites, in Blogs, Tweets, bei Facebook etc. wachsen sekündlich enorme Informationsfluten heran, die es Recherchierenden schwer machen, an die für sie relevanten Inhalte zu gelangen.

Topaktueller Zugriff zum Informationschaos also – beinahe wertlos, wenn man es nicht vernünftig handhaben kann. Massenhaften Zugang zu Dokumenten zu haben, ohne deren Bedeutung bewerten zu können, das ist fast, als hätte man keinen Zugriff. Es ist schon lange nicht mehr möglich, einfach so manuell auf das vorhandene Wissen zuzugreifen. Es reicht schlicht die Zeit nicht, alles zu lesen, zu analysieren, zusammenzufassen, zu vergleichen, also zu verarbeiten und zur rechten Zeit bereitzustellen, mit Kollegen zu diskutieren.

Wenn wir die bekannten Suchtechniken (Suchmaschine des Vertrauens) verwenden, treten, abhängig davon, wie gut ich meine Suchanfrage formuliere, doch grundsätzlich zwei Ergebnisse auf: Weiterhin Informationsüberflutung, das Suchsystem gibt zu viele Antworten, sodass es immer noch nicht möglich ist, diese vernünftig zu ordnen und zu sichten. Der Zeitaufwand ist noch immer zu groß, um diese Aufgabe angemessen zu bewältigen.

Abgesehen davon, werden Kriterien für das Ranking innerhalb der Ergebnislisten vom Suchmaschinenbetreiber festgelegt (nicht von ihnen) und vom Websitebetreiber möglichst gut erfüllt (SEO). Dabei wissen Recherchierende doch gelegentlich selbst, was für sie relevant ist, oder nicht?

Das zweite denkbare Ergebnis ist: der Informationsfluss trocknet aus. Es gibt keine oder zu wenige Ergebnisse. D.h. es ist nichts zu sichten da bzw. die Fähigkeit des Systems, besser zu selektieren, und die erreichte Auswahltiefe sind zu gering.

Mit anderen Worten: Um die Fluten zu bewältigen und professionelle Arbeit sicherzustellen, muss ein anderes Content Management her. So zerrinnen einem doch zu leicht die relevanten Inhalte zwischen Tastatur und Timetable. Ich meine, um das Chaos zu bewältigen stehen grundsätzlich drei technologische Ansätze zur Verfügung: Keyword Technologien (s. o.), Shallow Linguistics und Semantic Intelligence. Und ich hoffe, dass ich im nächsten Blogbeitrag dazu etwas zusammentragen kann.

Happy research!

MJA