Neue Technologien für schnelle Info-Dschungel-Scouts

Die Einflußfaktoren der redaktionellen und journalistischen Arbeit sind in Bewegung. Wenn ich es richtig beobachte, ist es – natürlich neben einer stets veränderlichen allgemeinen Nachrichtenlage – vor allem die wachsende Informationsmenge (im Internet in der Regel allzeit zugreifbar), aus der die relevante Information extrahiert und, unter den jeweils herschenden ökonomischen Rahmenbedingungen, zu einer qualitätvollen Publikation verarbeitet werden soll.

Informationsmenge - ökonomischer Rahmen - journalistische Qualität

Schnelligkeit und noch mehr Genauigkeit sind für Wolfgang Büchner, Chefredakteur der Nachrichtenagentur dpa, wichtige Kompetenzen im digitalen Zeitalter: Denn längst sei das Netz zu einem Dschungel aus Informationen geworden. Deshalb spielten Orientierung und Auswahl eine herausragende Rolle. Je dichter der Informationsdschungel werde, desto wichtiger der Scout der durch diesen Dschungel führt und dem Kunden einer Nachrichtenagentur (Verlage, Medienunternehmen) hilft die relevanten Informationen zu identifizieren. (Interview mit Wolfgang Büchner, Deutschlandfunk, Debattenportal „diskurs.dradio.de)

Wolfgang Büchner @Diskurs from kooperative-berlin“ on Vimeo

Die ersten Verlage und Nachrichtenagenturen haben daher begonnen, Kategorisierung und Extraktion von Inhalten mit Hilfe semantischer Technologien zu automatisieren, dadurch redaktionelle Prozesse effizienter zu gestalten und  Workflow-Clients Informationen in einheitlicher Form bereitzustellen, was zu einer Senkung der Kosten für bisher manuelle Kategorisierung und Beschleunigung der redaktionellen Prozesse führt. In vielen Betrieben sollen Einsatz- und Bearbeitungszeiten verringert werden und Kategorisierungen darüber hinaus an internationale Standards angepasst werden.

Um die Effizienz der Zusammenstellung und Kategorisierung von Inhalten zu erhöhen, empfiehlt es sich, mit Hilfe semantischer Technologien einen Prozess zu implementieren, der beginnend mit der Analyse und dem „Verstehen“ von Wörtern, Begriffen und Sätzen in einer nächsten Stufe Themen identifiziert, die in einem Text besprochen werden. Abschließend weist er mit großer Präzision jedem Beitrag eine oder mehrere Kategorien zu, indem er die einschlägigsten von 1.200 Kategorien des internationalen IPTC-Standards auswählt ( IPTC = International Press Telecommunications Council, Weltverband von Nachrichtenagenturen und Zeitungen für die technische Normierung des Nachrichtenaustausches). Diese Schritte stellen sicher, dass Inhalte dann so organisiert sind, dass sie für weitere Recherchen und Bearbeitungen leicht abgerufen werden können.

MJA

Advertisements

Shallow linguistics zu seicht

Was bedeutet hier eigentlich „semantisch“? (2)

Wenn die in einem Text enthaltenen Wörter erkannt werden, werden sie automatisch mit ihren jeweiligen Lemmata verknüpft. Dieses bedeutet, dass in einer Suche nach dem Wort „verkaufen“ alle Dokumente abgerufen werden können, die das Wort und diverse weitere Formen wie „verkauft“, „Verkauf“, „verkaufte“ enthalten.

Shallow Linguistics leisten schon ein wenig mehr als eine einfache Keyword-Recherche. Jedoch versteht das System nicht die Beziehung zwischen Satzelementen und nicht ihre Bedeutung.

Der Text …
Der Dax fiel zunächst auf 5.560 Punkte, stieg dann bis 5.700 Punkte, bevor es wieder nach unten ging.
… und der Text …
Der Dax stieg zunächst auf 5.560 Punkte, fiel dann bis 5.700 Punkte, bevor es wieder nach unten ging.
… sind gleich.

Radicati Group, ITU, in Rita Joseph, Deep Semantic vs. Keyword and Shallow Linguistic:  A New Approach for Supporting Exploitation, www.expertsystem.net
Source: Radicati Group, ITU, in Rita Joseph, Deep Semantic vs. Keyword and Shallow Linguistic: A New Approach for Supporting Exploitation, http://www.expertsystem.net

Das ist zu wenig, um effektiv mit eben solchen Informationsfluten fertig zu werden, wie wir sie schon erleben und schon gar nicht mit dem was wir erwarten dürfen.

Moderne Medienunternehmen, Verlage und Nachrichtenagenturen benötigen Systeme, die fähig sind, eine effiziente Verarbeitung von Dokumenten in enormer Quantität etwa an täglichen Nachrichten und Inhalten zeitgerecht und in einheitlicher, exakter Form zu gewährleisten.

MJA