Symbiose zwischen Medien und Maschinen
Big Data lassen sich nicht mit herkömmlichen Datenbanken und Management-Tools verarbeiten. Aber mit KI – künstlicher Intelligenz – wird es machbar – so die Sicht von Yvonne Thomas, Produkt Managerin bei Arvato Systems. Sie erläutert anhand einiger Beispiele ganz konkret, was KI leisten kann.
Lebenslanges Lernen – selbst für den Computer
In der Medienbranche fallen riesige Datenmengen an. Allerdings sind weder Redakteure noch Media Manager noch in der Lage, diese Datenflut manuell vernünftig auszuwerten und zu nutzen. . Künstliche Intelligenz (KI) kann helfen und ist in der Lage, gigantische Mengen an Datensätzen anzureichern, zu taggen und Muster und Zusammenhänge zu erkennen. Im Medienumfeld spricht man von Analytics gepaart mit Machine Learning. Der Clou dabei: Mit Hilfe maschineller Lernverfahren verbessert ein System sein eigenes Leistungsvermögen, die Ergebnisse werden immer treffsicherer.
Ein Beispiel für KI im TV-Bereich
Es war wohl das mediale Großereignis im Mai 2018: die Hochzeit im britischen Königshaus. Die Berichterstattung fand gleichzeitig auf diversen TV- und Hörfunk-Kanälen und im Internet statt. Viele Fans waren neugierig, welche Promis mit von der Partie waren. Die Reporter konnten natürlich auf die offiziellen Verlautbarungen aus dem Palast zurückgreifen. Ob dieser aber über jeden Star und jeden Promi Infos lieferte? Unwahrscheinlich.
Hier kann KI unterstützen, wenn das Bildmaterial von einer Software für Gesichtserkennung analysiert wird. VIPs, die im Bild gut sichtbar auftauchten und deren Konterfeis der Maschine bekannt sind, lassen sich auf diese Weise identifizieren. Mehr noch: Die Maschine nimmt auch die neuen Bilder in ihr »Gedächtnis« auf – und kann den jeweiligen Promi zukünftig noch besser und schneller erkennen.
Die Metadaten nutzerfreundlich visualisieren
Die Analyse ergibt allerdings nur unstrukturierte Metadaten. Als Beispiel: Man lässt Video-Dateien nach einem bestimmten Objekt, etwa nach einem Logo, durchsuchen. Die Maschine findet nun heraus, in welchen Sequenzen dieses Logo jeweils zu sehen ist, und stellt die Metadaten als Liste mit den entsprechenden Timecodes zur Verfügung. Für den Nutzer sind diese Daten zunächst nur schwer zu durchdringen.
Darum kommt nun ein Media-Asset-Management-System (MAM-System) ins Spiel, das die Daten automatisiert via Connector, einer definierten REST-Schnittstelle, übernimmt. Das MAM-System stellt die Daten in einer Form dar, die der Nutzer schnell und einfach erfassen kann. Für das oben genannte Beispiel etwa werden die Daten zur Logoerkennung auf einer Timeline des Videos dargestellt. Auch alle anderen dazugehörigen Daten werden direkt am Asset in strukturierter Form angezeigt. Beispielsweise werden mehrere KI-generierte Shotlisten am selben Asset sichtbar.
Unterscheidung auf einen Blick
Mancher Nutzer möchte sich eventuell noch einmal rückversichern, indem er die Angaben im System manuell hinsichtlich ihrer Richtigkeit gegenprüft, gegebenenfalls anpasst und das System dadurch wiederum schult. Da ist ein transparentes MAM-System von Vorteil. Das VPMS von Arvato Systems etwa stellt anschaulich dar, welche Daten KI-generiert sind und welche händisch eingegeben wurden.
Maschinelle Lernverfahren
Die maschinellen Lernverfahren lassen sich in Supervised Learning, Un-supervised Learning und Reinforcement Learning unterteilen.
Beim Supervised Learning nutzt die Maschine ihre Fähigkeit, Eigenschaften wiederzuerkennen und so eine Klassifizierung von Daten vorzunehmen. Es wird mit Beispieldaten ein Modell aufgebaut. Die Maschine lernt, dass verschiedene typische Eigenschaften der Daten ihre Zugehörigkeit zu einer bestimmten Gruppe definieren. Kommen nun neue Datensätze ins System, erkennt der Rechner deren Eigenschaften und ordnet die Daten den Gruppen zu. In der Praxis lassen sich so beispielweise Texte automatisch klassifizieren. Die Maschine erkennt bestimmte Buzzwörter oder Wortgruppen und ordnet den Text einem Genre zu. Besonders interessant wird es, wenn sich die Maschine dabei nicht auf ein Textformat beschränkt, sondern sowohl Dokumente als auch Ton- und Videoaufnahmen analysieren und somit clustern kann
Beim Un-supervised Learning hingegen soll KI die noch unbekannten Zusammenhänge zwischen den Daten aufdecken, sich wiederholende Muster finden und selbst eine Struktur für die Daten – sogenannte Cluster – anlegen. Dabei werden sich sehr wahrscheinlich die Anzahl und die Art der Cluster ändern, wenn neue Daten einfließen. Typische Anwendungsfälle für Un-supervised Learning im Bereich der Medien sind die Spracherkennung und die Speech-to-Text-Transkription. Auch hier ein mögliches Szenario aus der Praxis: Als erstes muss die Maschine selber verstehen, um welche Sprache es sich handelt. Das wird sie umso leichter bewerkstelligen, je besser und umfangreicher das Testmaterial ist, mit dem sie zuvor gefüttert wurde. Hat sie etwa erkannt, dass man im vorliegenden Video Französisch spricht, kommt die eigentliche Schwierigkeit: In Paris klingt Französisch etwas anders als in der Provence, der Dialekte klingen unterschiedlich. Mit Hilfe geeigneter Algorithmen lernt die Maschine aber, die unterschiedlichen Aussprachen demselben geschriebenen Wort zuzuordnen.
Beim Reinforcement Learning geht es um einen hochkomplexen Prozess, mit dem die Künstliche Intelligenz in einer bestimmten Umgebung definierte Aktionen durchführen soll, sobald ein genau festgelegter Zustand eintritt. Die Umgebung reagiert auf diese Aktion mit einer positiven Bewertung – einer »Belohnung« – oder beurteilt die Aktion negativ. KI merkt sich die Bewertung und weiß, sobald der gleiche Zustand wieder eintritt, welche Handlung die richtige ist. Ein Beispiel aus der Praxis: Für den 24-Stunden-7-Tage-Betrieb der Onlinemedien muss sichergestellt sein, dass die Technik reibungslos funktioniert. Serverausfälle, unakzeptable Tonqualitäten oder Sicherheitspannen kann sich die Branche nicht leisten. KI kann hier sicherstellen, dass das Equipment jederzeit funktionsfähig ist, indem sie die Ausfallwahrscheinlichkeit der Komponenten berechnet und rechtzeitig gegensteuert, bevor der Notfall eintritt.
Faktor Mensch
Personen, die in der heutigen Medienwelt arbeiten, sind oft von Natur aus offen für Neues. Aber es gibt auch Vorbehalte gegenüber neuen Technologien. Daher sind, damit die Zielgruppe mit dem Media-Asset-Management-System auch warm wird und es tatsächlich nutzt, bei der Einführung eines KI-Tools einige Spielregeln zu beachten.
In der Regel müssen Arbeitsabläufe, eventuell auch die Organisationsstruktur eines Medienunternehmens, angepasst werden. Das System hat sich natürlich auch in die vorhandene IT-Landschaft einzufügen. Schnittstellen müssen den reibungslosen Austausch zwischen dem MAM-System und den diversen Datenquellen sichern.
KI und Cloud
Es ist empfehlenswert, KI von vornherein mit einer Cloudlösung zu koppeln. Die intelligente Analyse von Big Data erfolgt so in der Cloud und beeinträchtigt trotz der gewaltigen Rechenprozesse die hausinternen IT-Systeme selbst bei Belastungsspitzen nicht. Wer sich mit Informationsverarbeitung via Cloud beschäftigt, muss jedoch zwingend geeignete Schutzmaßnahmen für Cyber- und Datensicherheit ergreifen. Auch am Thema Fake News kommt man kaum vorbei: Schließlich lassen sich auch mit KI Falschmeldungen erzeugen und relativ leicht verbreiten. KI ist aber prinzipiell auch in der Lage, Fake News zu erkennen und gegenzuhalten.
Viele Spielwiesen für KI vorhanden
Künstliche Intelligenz kommt bereits jetzt im beträchtlichen Maße bei der Gesichtserkennung, der Sprachanalyse und der Fotoklassifizierung zum Einsatz. Weitere typische Anwendungsfälle in der Medienwelt sind zum Beispiel die Szenenanalyse, Audio Track Extraction sowie intelligente Rohschnitte. Dabei ist immer zu beachten: Je besser die künftigen Anwendungsfälle definiert sind, desto zielgerichteter kann die Maschine geschult werden. Und je praxisrelevanter das Lernen ist, umso bessere Ergebnisse wird die intelligente Maschine erbringen können. Auch sollte man sich bei der Entscheidung, KI im Produktionsbetrieb einzusetzen, mit Themen der Datensicherheit und der DSGVO beschäftigen.
Schon heute beweist KI ihren Nutzen. In Zukunft dürfte sie unverzichtbar sein. Skeptiker sollten sich daher unbedingt mit der Thematik beschäftigen und vielleicht einfach mal Analytics Services in kleineren Projekten ausprobieren. Die Zeit ist reif, um beim Thema KI einzusteigen.
Die Autorin Yvonne Thomas ist seit 2015 Product Manager bei Arvato Systems und dort unter anderem für das journalistische Frontend »VPMS MediaPortal« verantwortlich. Zuvor arbeitete sie rund fünf Jahre im Technology & Innovation Department der European Broadcasting Union in Genf und betreute mehrere Projekte im Bereich Future Television Systems. Seit Januar 2018 ist sie ehrenamtlich als SMPTE Education Director tätig und engagiert sich für die Wissensverbreitung von Technologiethemen.