Semantic Publishing: Semantic Technology for online, broadcast and print media

Renowned jounalist and activist in matters of semantic publishing Jem Rayfield giving a talk on videolectures.net describing the Financial Times use of Semantic Technology to power its online and print product portfolio.

JemRayfield

Semantic Technology for online, broadcast and print media

Anti-Counterfeiting wird erfolgreich dank Semantischer Intelligenz und Systematik.

Produktimitationen sind nichts neues, aber das Internet eröffnet Fälschern und ihren Helfershelfern völlig neue und hocheffiziente Verteilkanäle. Hochwertige semantische Technologien erlauben es jedoch, die illegalen e-Shops weitgehend automatisiert zu entdecken, die Verantwortlichen, deren Netzwerke und Hintermänner zu identifizieren und die für eine erfolgreiche juristische Verfolgung notwendigen Informationen zu beschaffen um die illegalen Vertriebskanäle zu schließen. BlueOcean hat in den letzten zehn Jahren die notwendigen semantischen Web-Technologien mit entwickelt und eingesetzt, um den Anti-Counterfeiting-Prozess abbilden und unterstützen zu können. Dazu gehören unter anderem folgende Module:

Crawler- und Spider Technologien zur Identifizierung und Überwachung von relevanten Quellen, auch in Foren,  Blogs, Social-Networks und Communities und anderen Teilen des Long-Tail (Deep Web). Monitoring, Analyse und Identifikation des Inhalts der ermittelten Quellen mittels semantischer Intelligenz und  spezifischen Ontologien. Entity-Extraction und Identifikation von Personenprofilen sowie Personen- und Firmennetzwerken aus dem Internet und professionelle Datenbanken Auf diese Weise können plötzlich 100.000de von e-Shops täglich im Hinblick auf den Verkauf einer großen Zahl von (illegalen) Produkten systematisch und weitgehend automatisiert überwacht und deren verantwortlichen Personen/Firmen umfassend analysiert werden. Mehr lesen! cfiebig

Semantische Technologien und die Handhabung komplexer Inhalte

Was bedeutet hier eigentlich „semantisch“? (3)

Eine semantische Analyse schließt grammatische, logische, morphologische Analysen ein sowie die Identifikation von Begriffskonzeptionen. Mit anderen Worten, es werden die verschiedenen Bedeutungen der Begriffe richtig identifiziert.

Was heißt das? Zum Beispiel im Falle von Homonymen*: Wenn etwa bei einer Suche das Wort „Elf“  („der Elf“ für Märchengestalt, „die Elf“ für Fußballmannschaft oder „elf“ die Zahl) verwendet wird oder das Wort „Reif“ (als Ring,  Eiskristalle und reif, das Adjektiv in der Bedeutung „voll entwickelt“). Da ist ein Wort dreimal mit unterschiedlichen Eigenschaften (Artikel, Wortart) aber in der (fast) gleichen schreibweise – wenn man mal von der Kleinschreibung des Adjektivs absieht. Wenn ich etwa Polo suche, und ich meine den Sport, dann möchte ich nicht von Angaben über Autos, Polohemden oder Marc O´ überschüttet werden, oder? Wie ist das bei Ihnen? Zu ähnlichen Verzerrungen kommt es, wenn ich Heteronyme suche, also Wörter, die gleich geschrieben, aber anders ausgesprochen werden und auch eine andere Bedeutung haben. Zum Beispiel modern (neuzeitlich) oder modern (verfaulen). Semantics können diese Begriffe korrekt identifizieren.

Bei Wörtern, zu denen es viele Synonyme gibt, ist es auch ganz nett. Beispiel: Orange – Apfelsine; Streichholz – Zündholz. Unterschiedliche Wörter mit der gleichen Bedeutung – wenn ich danach suche, müssen mir auch alle Wörter einfallen, um die gewünschten Ergebnisse vollständig zu erhalten. Und immer so weiter. Hyperonyme, also Oberbegriffe etwa: Hund – Basset Hound, Beagle, Bearded Collie, Schäferhund; oder Auto – Limousine, Coupé, Cabrio, SUV. Semantische Technologien identifizieren, dass es um Hunde geht, wenn das Thema „Bearded Collie“ diskutiert wird oder um Autos, wenn „das Verdeck zu einem Cabrio“ gehört. Solche linguistischen Begriffskonzepte werden berücksichtigt. Tatsächlich können so Texte in ähnlicher Weise analysiert werden, wie es der Mensch beim Lesen tut.

Unter diesen Voraussetzungen gelangt man von dem was als Knowledge Management bezeichnet wird in den Bereich von Semantic Intelligence. Semantische Technologien ermöglichen die Handhabung großer Datenmengen und komplexer Inhalte und überbrücken so die klassische „Suche“ mit all ihren Einschränkungen direkt hin zum „Finden, Organisieren, Auswählen, Korrelieren/ Zuordnen“. Ganz ähnlich wie Business Intelligence in der Welt strukturierter Daten ist Semantic Intelligence der geeignete Ansatz, vor allem wenn es um das Erschließen unstrukturierter Daten/ Informationen geht.

MJA

*Zu den linguistischen Begriffen lassen sich bei Wikipedia (Kategorie:Semantik) hinreichend gute Beschreibungen und neben den hier aufgeführten noch viele andere Beispiele finden.