Intelligenz oder Intelligence – Unterstützung für kluge Köpfe

Um qualifizierte Fachkräfte zu gewinnen, führt die Bundesregierung die Blue Card ein. Ja, das ist dann ein Gesetz… Aber ob nun pink, green, blue, yellow, wer auf die Wirkung von gesetzlichen Fördermaßnahmen wartet vergisst, dass er auch selbst handeln kann. So gibt es einige betriebliche Funktionsbereiche, in denen die technischen Möglichkeiten der Unterstützung von Knowledge-Workern – also Fachkräften mit ganz speziellem Know-How – bei Weitem nicht ausgeschöpft werden. Fachleute zu deren Aufgaben es gehört, Daten zu Informationen oder Informationen zu Wissen zu aggregieren, können in erheblichem Maße von den besonderen Fähigkeiten semantischer Technologien profitieren. Auch das Entstehen neuer Berufssparten wie die des Datenjournalisten, der aus Daten Stories aggregiert, ist ein Kennzeichen dafür, dass hier die Dinge in Bewegung kommen.

Große Teile des Wissens, das unserer täglichen Arbeit zugrunde liegen sollte oder kann, liegt unstrukturiert und in Textform vor. Intellectual Capital (Know-how, Patente, Marken, Rechte, Projekte) und Web-Ressourcen sind die tatsächlichen Dreh- und Angelpunkte unserer Aktivitäten: Und jeden Tag werden wir von E-Mails begraben, von Dokumenten, Web-Site-Seiten, Artikeln, Recherchen, Berichten … eine ungeheure Menge an Text, die potentiell wichtige Informationen enthält.

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum.

Statt ein Quell für Wachstum und Entwicklung zu sein, bleiben Informationen aber oft allseits beklagte Datenflut und werden als solche zu einem Hindernis, das es bei der Entwicklung von Strategien, bei der Durchführung von Analysen, beim Controlling – oder Projektmanagement und Vielem mehr – zu durchwaten gilt. Informations-Chaos ist wertlos, wenn Daten und Informationen nicht organisiert, kategorisiert, geleitet, gelenkt, geführt – um nicht zu sagen gemanaged (Aua!) – werden. Zugang zu Dokumenten zu haben ohne Kenntnis ihres Inhalts ist, als hätte man keinen Zugang zu diesem Material.

Es ist längst nicht mehr möglich, Wissen zu verwalten, auf das wir lediglich manuell zugreifen können. Diese zeitlichen Ressourcen hat niemand. Es ist schlicht zu viel, was da zu sichten, zu lesen, zu analysieren, zusammenzufassen, zu vergleichen ist. So ist es eine gigantische Herausforderung, rechtzeitig zu finden, was wir suchen, und das Gefundene weiter zu verarbeiten, diese Ergebnisse mit weiteren relevanten Inhalten zu verbinden und schließlich im Unternehmen noch anderen Kollegen und Mitarbeitern zur Verfügung zu stellen.

Im Knowledge-Management, kommen wir ohne Technologie nicht aus. Es gilt zu entscheiden, welche Technologie zu wählen ist. Grundsätzlich gibt es drei Arten von Technologien, um unstrukturierte Informationen zu verwalten:
Keyword basierte mit der Möglichkeit, statistische Elemente hinzufügen, Shallow linguistics, Deep Linguistic oder Semantic, das heißt, ein Technologieansatz, der auf dem „Verstehen“ der Inhalte basiert. Semantic Intelligece erlaubt es heute, diese grossen „Friedhöfe“ unstrukturierter Daten automatisch zu lesen, zu strukturieren, zu verstehen und effizient zugänglich und nutzbar zu machen. Das Internet etwa ermöglicht den ungehinderten top aktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt den Beteiligten ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Das gilt für Konsumenten, Kunden, Wettbewerber, Behörden, Anwälte, Fachverbände, NGOs, Communities, etc. Semantic Web Technologien machen eine effiziente, kostengünstige Integration dieser sehr unterschiedlich strukturierten Datenbanken und unstrukturierten Datenbestände möglich.

Hierzu finden sich schon einige Posts in diesem Blog – in der Category Was bedeutet hier eigentlich „semantisch“?

Neue Technologien für schnelle Info-Dschungel-Scouts

Die Einflußfaktoren der redaktionellen und journalistischen Arbeit sind in Bewegung. Wenn ich es richtig beobachte, ist es – natürlich neben einer stets veränderlichen allgemeinen Nachrichtenlage – vor allem die wachsende Informationsmenge (im Internet in der Regel allzeit zugreifbar), aus der die relevante Information extrahiert und, unter den jeweils herschenden ökonomischen Rahmenbedingungen, zu einer qualitätvollen Publikation verarbeitet werden soll.

Informationsmenge - ökonomischer Rahmen - journalistische Qualität

Schnelligkeit und noch mehr Genauigkeit sind für Wolfgang Büchner, Chefredakteur der Nachrichtenagentur dpa, wichtige Kompetenzen im digitalen Zeitalter: Denn längst sei das Netz zu einem Dschungel aus Informationen geworden. Deshalb spielten Orientierung und Auswahl eine herausragende Rolle. Je dichter der Informationsdschungel werde, desto wichtiger der Scout der durch diesen Dschungel führt und dem Kunden einer Nachrichtenagentur (Verlage, Medienunternehmen) hilft die relevanten Informationen zu identifizieren. (Interview mit Wolfgang Büchner, Deutschlandfunk, Debattenportal „diskurs.dradio.de)

Wolfgang Büchner @Diskurs from kooperative-berlin“ on Vimeo

Die ersten Verlage und Nachrichtenagenturen haben daher begonnen, Kategorisierung und Extraktion von Inhalten mit Hilfe semantischer Technologien zu automatisieren, dadurch redaktionelle Prozesse effizienter zu gestalten und  Workflow-Clients Informationen in einheitlicher Form bereitzustellen, was zu einer Senkung der Kosten für bisher manuelle Kategorisierung und Beschleunigung der redaktionellen Prozesse führt. In vielen Betrieben sollen Einsatz- und Bearbeitungszeiten verringert werden und Kategorisierungen darüber hinaus an internationale Standards angepasst werden.

Um die Effizienz der Zusammenstellung und Kategorisierung von Inhalten zu erhöhen, empfiehlt es sich, mit Hilfe semantischer Technologien einen Prozess zu implementieren, der beginnend mit der Analyse und dem „Verstehen“ von Wörtern, Begriffen und Sätzen in einer nächsten Stufe Themen identifiziert, die in einem Text besprochen werden. Abschließend weist er mit großer Präzision jedem Beitrag eine oder mehrere Kategorien zu, indem er die einschlägigsten von 1.200 Kategorien des internationalen IPTC-Standards auswählt ( IPTC = International Press Telecommunications Council, Weltverband von Nachrichtenagenturen und Zeitungen für die technische Normierung des Nachrichtenaustausches). Diese Schritte stellen sicher, dass Inhalte dann so organisiert sind, dass sie für weitere Recherchen und Bearbeitungen leicht abgerufen werden können.

MJA

Unternehmen stellen sich dem Datenchaos

Datenchaos, klingt das zu negativ? Im Grunde ist hier eine Daten- oder Informationsmenge, eine Dokumenten-Menge gemeint, die mit den bisherigen Recherche-Möglichkeiten und Managementprozessen nicht zufriedenstellend bewältigt werden kann. Aus Sicht von Unternehmen1  und Anwendern sind Informationsfluten Erfolgshindernis und Quelle für Ineffizienz – die Suche nach der Nadel im Heuhaufen.

Aus unserer Sicht sind sie eher Herausforderung – eine Schatzinsel mit einem Dschungel aus Informationen oder ein im offenen Meer gesunkenes Schiff. Es gibt keine Schatzkarte, jedoch gibt es semantische Technologien, mit deren Hilfe wir das Terrain (Datenquelle, WWW) durchpflügen können (etwa mit Crawler-Techniken) den Schatz identifizieren (automatische linguistische Analyse) und ihn heben (durch automatische Kategorisierung nach IPTC-Standard zum Beispiel).

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum
Daten sind an unterschiedlichen Orten vorhanden, jedoch ohne einfache Zugriffsmöglichkeit. Anwender haben unterschiedliche Kanäle zum interagieren, benötigen aber schnellere und bessere Antworten/ Ergebnisse. Akteure kommunizieren über eigene Kanäle,um im Sinne eigener Interessen zu Beeinflussen.

In Unternehmen liegen strategische Daten vor allem in nicht-strukturierter Form vor, wie etwa Nachrichten, Artikel, Web-Seiten (Wettbewerber-Websites) und spezifische Dokumente (Patente, interne Memos) und Vieles mehr. Mit „nicht-strukturiert“ ist dabei auch gemeint, dass diese Texte vielfach nicht in Datenbanken organisiert aufgefunden werden können.

Wie soll man also der heranrauschenden Datenfluten Herr werden? Problematisch ist schließlich, dass herkömmliche Systeme und Work-Flows (wie keyword-basierte Suchmaschinen und andere Instrumente zum Abruf von Information) zur Verarbeitung nicht-strukturierter Informationen nicht den Inhalt, das heißt die Bedeutungen von Aussagen in einem Text, berücksichtigen. Sie erweisen sich daher in der Regel als ineffizient für die Analyse großer Textmengen, weil sie nicht im Stande sind zu verstehen, was in einem Dokument diskutiert wird und sind damit nicht in der Lage relevante von irrelevanten Daten zu unterscheiden.

Semantische Technologien fokussieren die Bedeutungen von Begriffen und besitzen die Fähigkeit, sich auf den Inhalt (Themen, Konzepte, nennenswerte Informationseinheiten wie Namen, Orte, inhaltliche Schwerpunkte) zu konzentrieren, unabhängig davon, wie dieser zum Ausdruck gebracht wird. Daher gewährleisten diese Technologien Such-, Rechercheprozessen2  und ebenso Forschungsprozessen3 eine höhere Effektivität und Effizienz.

MJA

1 Aktuell entwickeln sich besonders in folgenden Branchen Anwendungsbereiche für semantische Technologien: Anti-Counterfeiting, Life Science, Pharma, Nachrichtenagentur, Tageszeitung, Verlag, Internetportal, Anzeigen, Werbung, Automotive, Telekommunikation, Mobile, Energy, Finance.
2 facettierte Suchanwendungen und SAO-Zusammenhang (SAO = subject-action/verb-  object relation
3 zum Beispiel Marketing-und Wettbewerbsforschung