Unternehmen stellen sich dem Datenchaos

Datenchaos, klingt das zu negativ? Im Grunde ist hier eine Daten- oder Informationsmenge, eine Dokumenten-Menge gemeint, die mit den bisherigen Recherche-Möglichkeiten und Managementprozessen nicht zufriedenstellend bewältigt werden kann. Aus Sicht von Unternehmen1  und Anwendern sind Informationsfluten Erfolgshindernis und Quelle für Ineffizienz – die Suche nach der Nadel im Heuhaufen.

Aus unserer Sicht sind sie eher Herausforderung – eine Schatzinsel mit einem Dschungel aus Informationen oder ein im offenen Meer gesunkenes Schiff. Es gibt keine Schatzkarte, jedoch gibt es semantische Technologien, mit deren Hilfe wir das Terrain (Datenquelle, WWW) durchpflügen können (etwa mit Crawler-Techniken) den Schatz identifizieren (automatische linguistische Analyse) und ihn heben (durch automatische Kategorisierung nach IPTC-Standard zum Beispiel).

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum
Daten sind an unterschiedlichen Orten vorhanden, jedoch ohne einfache Zugriffsmöglichkeit. Anwender haben unterschiedliche Kanäle zum interagieren, benötigen aber schnellere und bessere Antworten/ Ergebnisse. Akteure kommunizieren über eigene Kanäle,um im Sinne eigener Interessen zu Beeinflussen.

In Unternehmen liegen strategische Daten vor allem in nicht-strukturierter Form vor, wie etwa Nachrichten, Artikel, Web-Seiten (Wettbewerber-Websites) und spezifische Dokumente (Patente, interne Memos) und Vieles mehr. Mit „nicht-strukturiert“ ist dabei auch gemeint, dass diese Texte vielfach nicht in Datenbanken organisiert aufgefunden werden können.

Wie soll man also der heranrauschenden Datenfluten Herr werden? Problematisch ist schließlich, dass herkömmliche Systeme und Work-Flows (wie keyword-basierte Suchmaschinen und andere Instrumente zum Abruf von Information) zur Verarbeitung nicht-strukturierter Informationen nicht den Inhalt, das heißt die Bedeutungen von Aussagen in einem Text, berücksichtigen. Sie erweisen sich daher in der Regel als ineffizient für die Analyse großer Textmengen, weil sie nicht im Stande sind zu verstehen, was in einem Dokument diskutiert wird und sind damit nicht in der Lage relevante von irrelevanten Daten zu unterscheiden.

Semantische Technologien fokussieren die Bedeutungen von Begriffen und besitzen die Fähigkeit, sich auf den Inhalt (Themen, Konzepte, nennenswerte Informationseinheiten wie Namen, Orte, inhaltliche Schwerpunkte) zu konzentrieren, unabhängig davon, wie dieser zum Ausdruck gebracht wird. Daher gewährleisten diese Technologien Such-, Rechercheprozessen2  und ebenso Forschungsprozessen3 eine höhere Effektivität und Effizienz.

MJA

1 Aktuell entwickeln sich besonders in folgenden Branchen Anwendungsbereiche für semantische Technologien: Anti-Counterfeiting, Life Science, Pharma, Nachrichtenagentur, Tageszeitung, Verlag, Internetportal, Anzeigen, Werbung, Automotive, Telekommunikation, Mobile, Energy, Finance.
2 facettierte Suchanwendungen und SAO-Zusammenhang (SAO = subject-action/verb-  object relation
3 zum Beispiel Marketing-und Wettbewerbsforschung

Advertisements

Shallow linguistics zu seicht

Was bedeutet hier eigentlich „semantisch“? (2)

Wenn die in einem Text enthaltenen Wörter erkannt werden, werden sie automatisch mit ihren jeweiligen Lemmata verknüpft. Dieses bedeutet, dass in einer Suche nach dem Wort „verkaufen“ alle Dokumente abgerufen werden können, die das Wort und diverse weitere Formen wie „verkauft“, „Verkauf“, „verkaufte“ enthalten.

Shallow Linguistics leisten schon ein wenig mehr als eine einfache Keyword-Recherche. Jedoch versteht das System nicht die Beziehung zwischen Satzelementen und nicht ihre Bedeutung.

Der Text …
Der Dax fiel zunächst auf 5.560 Punkte, stieg dann bis 5.700 Punkte, bevor es wieder nach unten ging.
… und der Text …
Der Dax stieg zunächst auf 5.560 Punkte, fiel dann bis 5.700 Punkte, bevor es wieder nach unten ging.
… sind gleich.

Radicati Group, ITU, in Rita Joseph, Deep Semantic vs. Keyword and Shallow Linguistic:  A New Approach for Supporting Exploitation, www.expertsystem.net
Source: Radicati Group, ITU, in Rita Joseph, Deep Semantic vs. Keyword and Shallow Linguistic: A New Approach for Supporting Exploitation, http://www.expertsystem.net

Das ist zu wenig, um effektiv mit eben solchen Informationsfluten fertig zu werden, wie wir sie schon erleben und schon gar nicht mit dem was wir erwarten dürfen.

Moderne Medienunternehmen, Verlage und Nachrichtenagenturen benötigen Systeme, die fähig sind, eine effiziente Verarbeitung von Dokumenten in enormer Quantität etwa an täglichen Nachrichten und Inhalten zeitgerecht und in einheitlicher, exakter Form zu gewährleisten.

MJA