Intelligenz oder Intelligence – Unterstützung für kluge Köpfe

Um qualifizierte Fachkräfte zu gewinnen, führt die Bundesregierung die Blue Card ein. Ja, das ist dann ein Gesetz… Aber ob nun pink, green, blue, yellow, wer auf die Wirkung von gesetzlichen Fördermaßnahmen wartet vergisst, dass er auch selbst handeln kann. So gibt es einige betriebliche Funktionsbereiche, in denen die technischen Möglichkeiten der Unterstützung von Knowledge-Workern – also Fachkräften mit ganz speziellem Know-How – bei Weitem nicht ausgeschöpft werden. Fachleute zu deren Aufgaben es gehört, Daten zu Informationen oder Informationen zu Wissen zu aggregieren, können in erheblichem Maße von den besonderen Fähigkeiten semantischer Technologien profitieren. Auch das Entstehen neuer Berufssparten wie die des Datenjournalisten, der aus Daten Stories aggregiert, ist ein Kennzeichen dafür, dass hier die Dinge in Bewegung kommen.

Große Teile des Wissens, das unserer täglichen Arbeit zugrunde liegen sollte oder kann, liegt unstrukturiert und in Textform vor. Intellectual Capital (Know-how, Patente, Marken, Rechte, Projekte) und Web-Ressourcen sind die tatsächlichen Dreh- und Angelpunkte unserer Aktivitäten: Und jeden Tag werden wir von E-Mails begraben, von Dokumenten, Web-Site-Seiten, Artikeln, Recherchen, Berichten … eine ungeheure Menge an Text, die potentiell wichtige Informationen enthält.

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum.

Statt ein Quell für Wachstum und Entwicklung zu sein, bleiben Informationen aber oft allseits beklagte Datenflut und werden als solche zu einem Hindernis, das es bei der Entwicklung von Strategien, bei der Durchführung von Analysen, beim Controlling – oder Projektmanagement und Vielem mehr – zu durchwaten gilt. Informations-Chaos ist wertlos, wenn Daten und Informationen nicht organisiert, kategorisiert, geleitet, gelenkt, geführt – um nicht zu sagen gemanaged (Aua!) – werden. Zugang zu Dokumenten zu haben ohne Kenntnis ihres Inhalts ist, als hätte man keinen Zugang zu diesem Material.

Es ist längst nicht mehr möglich, Wissen zu verwalten, auf das wir lediglich manuell zugreifen können. Diese zeitlichen Ressourcen hat niemand. Es ist schlicht zu viel, was da zu sichten, zu lesen, zu analysieren, zusammenzufassen, zu vergleichen ist. So ist es eine gigantische Herausforderung, rechtzeitig zu finden, was wir suchen, und das Gefundene weiter zu verarbeiten, diese Ergebnisse mit weiteren relevanten Inhalten zu verbinden und schließlich im Unternehmen noch anderen Kollegen und Mitarbeitern zur Verfügung zu stellen.

Im Knowledge-Management, kommen wir ohne Technologie nicht aus. Es gilt zu entscheiden, welche Technologie zu wählen ist. Grundsätzlich gibt es drei Arten von Technologien, um unstrukturierte Informationen zu verwalten:
Keyword basierte mit der Möglichkeit, statistische Elemente hinzufügen, Shallow linguistics, Deep Linguistic oder Semantic, das heißt, ein Technologieansatz, der auf dem „Verstehen“ der Inhalte basiert. Semantic Intelligece erlaubt es heute, diese grossen „Friedhöfe“ unstrukturierter Daten automatisch zu lesen, zu strukturieren, zu verstehen und effizient zugänglich und nutzbar zu machen. Das Internet etwa ermöglicht den ungehinderten top aktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt den Beteiligten ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Das gilt für Konsumenten, Kunden, Wettbewerber, Behörden, Anwälte, Fachverbände, NGOs, Communities, etc. Semantic Web Technologien machen eine effiziente, kostengünstige Integration dieser sehr unterschiedlich strukturierten Datenbanken und unstrukturierten Datenbestände möglich.

Hierzu finden sich schon einige Posts in diesem Blog – in der Category Was bedeutet hier eigentlich „semantisch“?

Unternehmen stellen sich dem Datenchaos

Datenchaos, klingt das zu negativ? Im Grunde ist hier eine Daten- oder Informationsmenge, eine Dokumenten-Menge gemeint, die mit den bisherigen Recherche-Möglichkeiten und Managementprozessen nicht zufriedenstellend bewältigt werden kann. Aus Sicht von Unternehmen1  und Anwendern sind Informationsfluten Erfolgshindernis und Quelle für Ineffizienz – die Suche nach der Nadel im Heuhaufen.

Aus unserer Sicht sind sie eher Herausforderung – eine Schatzinsel mit einem Dschungel aus Informationen oder ein im offenen Meer gesunkenes Schiff. Es gibt keine Schatzkarte, jedoch gibt es semantische Technologien, mit deren Hilfe wir das Terrain (Datenquelle, WWW) durchpflügen können (etwa mit Crawler-Techniken) den Schatz identifizieren (automatische linguistische Analyse) und ihn heben (durch automatische Kategorisierung nach IPTC-Standard zum Beispiel).

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum
Daten sind an unterschiedlichen Orten vorhanden, jedoch ohne einfache Zugriffsmöglichkeit. Anwender haben unterschiedliche Kanäle zum interagieren, benötigen aber schnellere und bessere Antworten/ Ergebnisse. Akteure kommunizieren über eigene Kanäle,um im Sinne eigener Interessen zu Beeinflussen.

In Unternehmen liegen strategische Daten vor allem in nicht-strukturierter Form vor, wie etwa Nachrichten, Artikel, Web-Seiten (Wettbewerber-Websites) und spezifische Dokumente (Patente, interne Memos) und Vieles mehr. Mit „nicht-strukturiert“ ist dabei auch gemeint, dass diese Texte vielfach nicht in Datenbanken organisiert aufgefunden werden können.

Wie soll man also der heranrauschenden Datenfluten Herr werden? Problematisch ist schließlich, dass herkömmliche Systeme und Work-Flows (wie keyword-basierte Suchmaschinen und andere Instrumente zum Abruf von Information) zur Verarbeitung nicht-strukturierter Informationen nicht den Inhalt, das heißt die Bedeutungen von Aussagen in einem Text, berücksichtigen. Sie erweisen sich daher in der Regel als ineffizient für die Analyse großer Textmengen, weil sie nicht im Stande sind zu verstehen, was in einem Dokument diskutiert wird und sind damit nicht in der Lage relevante von irrelevanten Daten zu unterscheiden.

Semantische Technologien fokussieren die Bedeutungen von Begriffen und besitzen die Fähigkeit, sich auf den Inhalt (Themen, Konzepte, nennenswerte Informationseinheiten wie Namen, Orte, inhaltliche Schwerpunkte) zu konzentrieren, unabhängig davon, wie dieser zum Ausdruck gebracht wird. Daher gewährleisten diese Technologien Such-, Rechercheprozessen2  und ebenso Forschungsprozessen3 eine höhere Effektivität und Effizienz.

MJA

1 Aktuell entwickeln sich besonders in folgenden Branchen Anwendungsbereiche für semantische Technologien: Anti-Counterfeiting, Life Science, Pharma, Nachrichtenagentur, Tageszeitung, Verlag, Internetportal, Anzeigen, Werbung, Automotive, Telekommunikation, Mobile, Energy, Finance.
2 facettierte Suchanwendungen und SAO-Zusammenhang (SAO = subject-action/verb-  object relation
3 zum Beispiel Marketing-und Wettbewerbsforschung

Topaktueller Zugriff zum Informationschaos

Das Internet ermöglicht den ungehinderten topaktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt es Stakeholdern ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Leider finden wir den Großteil dieser Informationen in eher unstrukturiertem Zustand vor, d.h. wir finden das, was wir finden wollen oder müssen eher nicht. Oder nur mit großem Rechercheaufwand. Auf Websites, in Blogs, Tweets, bei Facebook etc. wachsen sekündlich enorme Informationsfluten heran, die es Recherchierenden schwer machen, an die für sie relevanten Inhalte zu gelangen.

Topaktueller Zugriff zum Informationschaos also – beinahe wertlos, wenn man es nicht vernünftig handhaben kann. Massenhaften Zugang zu Dokumenten zu haben, ohne deren Bedeutung bewerten zu können, das ist fast, als hätte man keinen Zugriff. Es ist schon lange nicht mehr möglich, einfach so manuell auf das vorhandene Wissen zuzugreifen. Es reicht schlicht die Zeit nicht, alles zu lesen, zu analysieren, zusammenzufassen, zu vergleichen, also zu verarbeiten und zur rechten Zeit bereitzustellen, mit Kollegen zu diskutieren.

Wenn wir die bekannten Suchtechniken (Suchmaschine des Vertrauens) verwenden, treten, abhängig davon, wie gut ich meine Suchanfrage formuliere, doch grundsätzlich zwei Ergebnisse auf: Weiterhin Informationsüberflutung, das Suchsystem gibt zu viele Antworten, sodass es immer noch nicht möglich ist, diese vernünftig zu ordnen und zu sichten. Der Zeitaufwand ist noch immer zu groß, um diese Aufgabe angemessen zu bewältigen.

Abgesehen davon, werden Kriterien für das Ranking innerhalb der Ergebnislisten vom Suchmaschinenbetreiber festgelegt (nicht von ihnen) und vom Websitebetreiber möglichst gut erfüllt (SEO). Dabei wissen Recherchierende doch gelegentlich selbst, was für sie relevant ist, oder nicht?

Das zweite denkbare Ergebnis ist: der Informationsfluss trocknet aus. Es gibt keine oder zu wenige Ergebnisse. D.h. es ist nichts zu sichten da bzw. die Fähigkeit des Systems, besser zu selektieren, und die erreichte Auswahltiefe sind zu gering.

Mit anderen Worten: Um die Fluten zu bewältigen und professionelle Arbeit sicherzustellen, muss ein anderes Content Management her. So zerrinnen einem doch zu leicht die relevanten Inhalte zwischen Tastatur und Timetable. Ich meine, um das Chaos zu bewältigen stehen grundsätzlich drei technologische Ansätze zur Verfügung: Keyword Technologien (s. o.), Shallow Linguistics und Semantic Intelligence. Und ich hoffe, dass ich im nächsten Blogbeitrag dazu etwas zusammentragen kann.

Happy research!

MJA