Intelligenz oder Intelligence – Unterstützung für kluge Köpfe

Um qualifizierte Fachkräfte zu gewinnen, führt die Bundesregierung die Blue Card ein. Ja, das ist dann ein Gesetz… Aber ob nun pink, green, blue, yellow, wer auf die Wirkung von gesetzlichen Fördermaßnahmen wartet vergisst, dass er auch selbst handeln kann. So gibt es einige betriebliche Funktionsbereiche, in denen die technischen Möglichkeiten der Unterstützung von Knowledge-Workern – also Fachkräften mit ganz speziellem Know-How – bei Weitem nicht ausgeschöpft werden. Fachleute zu deren Aufgaben es gehört, Daten zu Informationen oder Informationen zu Wissen zu aggregieren, können in erheblichem Maße von den besonderen Fähigkeiten semantischer Technologien profitieren. Auch das Entstehen neuer Berufssparten wie die des Datenjournalisten, der aus Daten Stories aggregiert, ist ein Kennzeichen dafür, dass hier die Dinge in Bewegung kommen.

Große Teile des Wissens, das unserer täglichen Arbeit zugrunde liegen sollte oder kann, liegt unstrukturiert und in Textform vor. Intellectual Capital (Know-how, Patente, Marken, Rechte, Projekte) und Web-Ressourcen sind die tatsächlichen Dreh- und Angelpunkte unserer Aktivitäten: Und jeden Tag werden wir von E-Mails begraben, von Dokumenten, Web-Site-Seiten, Artikeln, Recherchen, Berichten … eine ungeheure Menge an Text, die potentiell wichtige Informationen enthält.

Knowledge-Worker unter Druck: Effizientes Arbeiten wird ohne effizientes Knowledge-Management zum Alptraum.

Statt ein Quell für Wachstum und Entwicklung zu sein, bleiben Informationen aber oft allseits beklagte Datenflut und werden als solche zu einem Hindernis, das es bei der Entwicklung von Strategien, bei der Durchführung von Analysen, beim Controlling – oder Projektmanagement und Vielem mehr – zu durchwaten gilt. Informations-Chaos ist wertlos, wenn Daten und Informationen nicht organisiert, kategorisiert, geleitet, gelenkt, geführt – um nicht zu sagen gemanaged (Aua!) – werden. Zugang zu Dokumenten zu haben ohne Kenntnis ihres Inhalts ist, als hätte man keinen Zugang zu diesem Material.

Es ist längst nicht mehr möglich, Wissen zu verwalten, auf das wir lediglich manuell zugreifen können. Diese zeitlichen Ressourcen hat niemand. Es ist schlicht zu viel, was da zu sichten, zu lesen, zu analysieren, zusammenzufassen, zu vergleichen ist. So ist es eine gigantische Herausforderung, rechtzeitig zu finden, was wir suchen, und das Gefundene weiter zu verarbeiten, diese Ergebnisse mit weiteren relevanten Inhalten zu verbinden und schließlich im Unternehmen noch anderen Kollegen und Mitarbeitern zur Verfügung zu stellen.

Im Knowledge-Management, kommen wir ohne Technologie nicht aus. Es gilt zu entscheiden, welche Technologie zu wählen ist. Grundsätzlich gibt es drei Arten von Technologien, um unstrukturierte Informationen zu verwalten:
Keyword basierte mit der Möglichkeit, statistische Elemente hinzufügen, Shallow linguistics, Deep Linguistic oder Semantic, das heißt, ein Technologieansatz, der auf dem „Verstehen“ der Inhalte basiert. Semantic Intelligece erlaubt es heute, diese grossen „Friedhöfe“ unstrukturierter Daten automatisch zu lesen, zu strukturieren, zu verstehen und effizient zugänglich und nutzbar zu machen. Das Internet etwa ermöglicht den ungehinderten top aktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt den Beteiligten ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Das gilt für Konsumenten, Kunden, Wettbewerber, Behörden, Anwälte, Fachverbände, NGOs, Communities, etc. Semantic Web Technologien machen eine effiziente, kostengünstige Integration dieser sehr unterschiedlich strukturierten Datenbanken und unstrukturierten Datenbestände möglich.

Hierzu finden sich schon einige Posts in diesem Blog – in der Category Was bedeutet hier eigentlich „semantisch“?

Advertisements

Semantische Technologien und die Handhabung komplexer Inhalte

Was bedeutet hier eigentlich „semantisch“? (3)

Eine semantische Analyse schließt grammatische, logische, morphologische Analysen ein sowie die Identifikation von Begriffskonzeptionen. Mit anderen Worten, es werden die verschiedenen Bedeutungen der Begriffe richtig identifiziert.

Was heißt das? Zum Beispiel im Falle von Homonymen*: Wenn etwa bei einer Suche das Wort „Elf“  („der Elf“ für Märchengestalt, „die Elf“ für Fußballmannschaft oder „elf“ die Zahl) verwendet wird oder das Wort „Reif“ (als Ring,  Eiskristalle und reif, das Adjektiv in der Bedeutung „voll entwickelt“). Da ist ein Wort dreimal mit unterschiedlichen Eigenschaften (Artikel, Wortart) aber in der (fast) gleichen schreibweise – wenn man mal von der Kleinschreibung des Adjektivs absieht. Wenn ich etwa Polo suche, und ich meine den Sport, dann möchte ich nicht von Angaben über Autos, Polohemden oder Marc O´ überschüttet werden, oder? Wie ist das bei Ihnen? Zu ähnlichen Verzerrungen kommt es, wenn ich Heteronyme suche, also Wörter, die gleich geschrieben, aber anders ausgesprochen werden und auch eine andere Bedeutung haben. Zum Beispiel modern (neuzeitlich) oder modern (verfaulen). Semantics können diese Begriffe korrekt identifizieren.

Bei Wörtern, zu denen es viele Synonyme gibt, ist es auch ganz nett. Beispiel: Orange – Apfelsine; Streichholz – Zündholz. Unterschiedliche Wörter mit der gleichen Bedeutung – wenn ich danach suche, müssen mir auch alle Wörter einfallen, um die gewünschten Ergebnisse vollständig zu erhalten. Und immer so weiter. Hyperonyme, also Oberbegriffe etwa: Hund – Basset Hound, Beagle, Bearded Collie, Schäferhund; oder Auto – Limousine, Coupé, Cabrio, SUV. Semantische Technologien identifizieren, dass es um Hunde geht, wenn das Thema „Bearded Collie“ diskutiert wird oder um Autos, wenn „das Verdeck zu einem Cabrio“ gehört. Solche linguistischen Begriffskonzepte werden berücksichtigt. Tatsächlich können so Texte in ähnlicher Weise analysiert werden, wie es der Mensch beim Lesen tut.

Unter diesen Voraussetzungen gelangt man von dem was als Knowledge Management bezeichnet wird in den Bereich von Semantic Intelligence. Semantische Technologien ermöglichen die Handhabung großer Datenmengen und komplexer Inhalte und überbrücken so die klassische „Suche“ mit all ihren Einschränkungen direkt hin zum „Finden, Organisieren, Auswählen, Korrelieren/ Zuordnen“. Ganz ähnlich wie Business Intelligence in der Welt strukturierter Daten ist Semantic Intelligence der geeignete Ansatz, vor allem wenn es um das Erschließen unstrukturierter Daten/ Informationen geht.

MJA

*Zu den linguistischen Begriffen lassen sich bei Wikipedia (Kategorie:Semantik) hinreichend gute Beschreibungen und neben den hier aufgeführten noch viele andere Beispiele finden.

Topaktueller Zugriff zum Informationschaos

Das Internet ermöglicht den ungehinderten topaktuellen Zugang zu praktisch allen Datenbanken der Welt und erlaubt es Stakeholdern ihre Daten, Fakten, Meinungen und Absichten allen Interessierten frei und sofort zugänglich zu machen. Leider finden wir den Großteil dieser Informationen in eher unstrukturiertem Zustand vor, d.h. wir finden das, was wir finden wollen oder müssen eher nicht. Oder nur mit großem Rechercheaufwand. Auf Websites, in Blogs, Tweets, bei Facebook etc. wachsen sekündlich enorme Informationsfluten heran, die es Recherchierenden schwer machen, an die für sie relevanten Inhalte zu gelangen.

Topaktueller Zugriff zum Informationschaos also – beinahe wertlos, wenn man es nicht vernünftig handhaben kann. Massenhaften Zugang zu Dokumenten zu haben, ohne deren Bedeutung bewerten zu können, das ist fast, als hätte man keinen Zugriff. Es ist schon lange nicht mehr möglich, einfach so manuell auf das vorhandene Wissen zuzugreifen. Es reicht schlicht die Zeit nicht, alles zu lesen, zu analysieren, zusammenzufassen, zu vergleichen, also zu verarbeiten und zur rechten Zeit bereitzustellen, mit Kollegen zu diskutieren.

Wenn wir die bekannten Suchtechniken (Suchmaschine des Vertrauens) verwenden, treten, abhängig davon, wie gut ich meine Suchanfrage formuliere, doch grundsätzlich zwei Ergebnisse auf: Weiterhin Informationsüberflutung, das Suchsystem gibt zu viele Antworten, sodass es immer noch nicht möglich ist, diese vernünftig zu ordnen und zu sichten. Der Zeitaufwand ist noch immer zu groß, um diese Aufgabe angemessen zu bewältigen.

Abgesehen davon, werden Kriterien für das Ranking innerhalb der Ergebnislisten vom Suchmaschinenbetreiber festgelegt (nicht von ihnen) und vom Websitebetreiber möglichst gut erfüllt (SEO). Dabei wissen Recherchierende doch gelegentlich selbst, was für sie relevant ist, oder nicht?

Das zweite denkbare Ergebnis ist: der Informationsfluss trocknet aus. Es gibt keine oder zu wenige Ergebnisse. D.h. es ist nichts zu sichten da bzw. die Fähigkeit des Systems, besser zu selektieren, und die erreichte Auswahltiefe sind zu gering.

Mit anderen Worten: Um die Fluten zu bewältigen und professionelle Arbeit sicherzustellen, muss ein anderes Content Management her. So zerrinnen einem doch zu leicht die relevanten Inhalte zwischen Tastatur und Timetable. Ich meine, um das Chaos zu bewältigen stehen grundsätzlich drei technologische Ansätze zur Verfügung: Keyword Technologien (s. o.), Shallow Linguistics und Semantic Intelligence. Und ich hoffe, dass ich im nächsten Blogbeitrag dazu etwas zusammentragen kann.

Happy research!

MJA