Künstliche Intelligenz – wieso?
Artifical Intelligence, Machine Learning und Deep Learning – wie hängt das alles zusammen? Und vor allem: Was bringt es in der Broadcast-Branche? Jens Gnad hat sich darüber Gedanken gemacht.
Wird künstliche Intelligenz tatsächlich alles verändern, oder ist das einfach nur eine weitere Technologie, die aktuell in aller Munde ist, aber in Bälde wieder von der Bildfläche verschwinden wird? Dieser Beitrag von Jens Gnad, Logic Media, soll ein paar Aspekte dieser Frage beleuchten.
Generell werden die Begriffe künstliche Intelligenz (Artifical Intelligence), Maschinenlernen (Machine Learning) und Deep Learning im allgemeinen technischen Sprachgebrauch oft missverständlich verwendet.
Das oben stehende Bild verdeutlicht, wie die drei Begriffe zusammenhängen. Künstliche Intelligenz ist der Überbegriff aller computerbasierender Intelligenz, welche die Fähigkeiten eines menschlichen Verstandes imitieren oder im Extremfall gar ersetzen könnte. Dass dies ein weites und diskussionswürdiges Feld ist, versteht sich von selbst.
Alles, was eine Teilaufgabe dessen ist, was von Menschenhand programmiert wurde und diesen Regeln folgt, nennt man grob Maschinenlernen oder eben Machine Learning. Machine Learning funktioniert sehr gut, kommt aber an seine Belastungsgrenzen, wenn die Daten, die es zur Verbesserung benötigt, zu umfangreich werden.
Im Jahr 2020 erwarten Schätzungen eine Datenansammlung von 44 Zetabyte auf diesem Planeten. Je mehr Daten beim Machine Learning vorliegen, desto besser die Ergebnisse, jedoch steigt zeitgleich auch die Dauer, die eine Berechnung benötigt, da alle Daten »ge-parsed« werden müssen.
Hier bringt Deep Learning Abhilfe, da es sich nicht an von Menschenhand vorgegeben Formen und Formeln orientiert, sondern sich selbst stetig weiter trainiert und anhand von vorhandenen Daten weiterentwickelt. Klingt wieder nach einem Zukunftszenarium und wird auch zurecht kontrovers diskutiert.
In der Praxis interessiert hingegen eher, wie und an welchen Stellen AI schon eine Rolle spielt und wo die Technologie Wachstumspotenzial hat. Das kann recht einfach und schnell beantwortet werden – nahezu überall. Nur wissen die meisten Abteilungen untereinander davon gar nichts oder man kann sich nicht vorstellen, dass man diese Technik auch in seinem Umfeld anwenden kann.
Aber was kann man genau mit KI im Broadcast anstellen?
Es sollen neun unterschiedliche Anwendungsfälle sehr kurz und knapp erläutert werden, so dass der Leser bewerten kann, ob dieses Thema interessant sein könnte.
Monetarisierung des Archivs
Die aktuell einfachst zu erklärende Anwendung, die auch jeder nachvollziehen kann, ist die »Monetarisierung des Archivs«. Durch die Nutzung von künstlicher Intelligenz kann Material verschlagwortet werden mit nahezu unendlichen Metadaten, die solch eine granulare Suche zulassen, dass jeder noch so kleine Videoschnipsel gefunden und wiederverwertet oder verkauft werden kann. Eine Suche nach Personen in Kombination mit anderen Bildinhalten und ausgewähltem gesprochenen Wort kann die Dauer solch einer Suche durch den Archivar oder Redakteur drastisch verringern oder gar Material liefern, über dessen Existenz keiner mehr wusste.
Transkripte von Material
Mittlerweile existieren viele gute Engines, die in der Lage sind, diverse Sprachen eines Videos in ein Transkript zu wandeln. Diese Transkripte können natürlich wieder in dem in Punkt 1 erwähnten Kontext sinnvoll eingesetzt werden.
Multilingualität vergrößert Reichweite
Durch künstliche Intelligenz kann das zuvor erstellte Transkript in guter Qualität in andere Sprachen übersetzt werden, sodass lokales Material unmittelbar in Ländern mit anderen Sprachen zugänglich gemacht werden kann – über passende Untertitel.
Empfehlungen
Die Auswertungen von Sehgewohnheiten registrierter Zuschauer können genutzt werden, um daraus neue Empfehlungen zu generieren. Aus dem Online-Shopping kennt man das schon längst, und auch für TV- und OnDemand-Zuschauer bietet das einen großen Mehrwert (»Zuschauer, die A gesehen haben, interessieren sich auch für B«). Künstliche Intelligenz kann durch die Bildanalyse zudem bereits vor der Veröffentlichung eines neuen Clips bewerten, ob dieses Material ins jeweilige Zuschauer-Schema passt.
Kostenfreies vs. bezahltes Material
Was schauen oder lesen die Besucher der Mediatheken am meisten und was kommt weniger gut an? Dank künstlicher Intelligenz kann der Betreiber einer Mediathek auswerten, wie hoch die Wahrscheinlichkeit ist, dass ein Clip interessant für das Gros seiner Zuschauer oder Leser ist. Mehr noch, auf dieser Basis ist es auch einfacher zu entscheiden, welche Artikel nur kostenpflichtig angeboten werden sollen.
Automatische Sendestraßen
Es gibt Lösungen, die auf Basis von YouTube-Material (o. ä.) eine komplette Sendestraße unter Zuhilfenahme von künstlicher Intelligenz realisieren. Hierzu werden vom Anwender die zu berücksichtigenden Kanäle auf den sozialen Netzwerken bestimmt und vom System geparsed. Anhand von Klickzahlen, Kommentaren, Bildinhalten etc. wertet die KI die passenden Clips aus und setzt eine Playlist auf.
Stimmungsbezogene Trailer
Künstliche Intelligenz ist mittlerweile so weit fortgeschritten, dass sie selbstständig Videotrailer anhand von Vorgaben wie traurig, lustig, düster, fröhlich etc. erstellen kann. Der Videoschnitt funktioniert bereits sehr gut, beim Audiopart gibt es noch Steigerungsmöglichkeiten. Wer jedoch sieht, mit welcher Geschwindigkeit hieran entwickelt wird, der weiß, dass es wohl nur ein, zwei Jahre dauern dürfte, bis es auch hier tragfähige Lösungen gibt.
Sportauswertungen
Auch vor einem der größten Umsatzgeneratoren im Live-Fernsehen, dem Sport, macht künstliche Intelligenz keinen Halt. Hier wertet KI das Bildmaterial aus und findet Tore, Körbe, Verwarnungen, Auswechslungen, Pausen und vieles mehr. Das Erstellen von Highlights wird so unfassbar beschleunigt und letztlich auch für nahezu jegliche Sportart und Liga möglich. Zukünftige Zusammenfassungen eines Kreisligaspiels, das zu einer KI gestreamt wird, können so Realität werden.
Roboter-Journalismus
Während alle acht Themengebiete zuvor auf die Technik abzielen, tummelt sich Roboter-Jounalismus im Kreativbereich. Dass von KI geschriebene Wettervorhersagen oder Fußballspielberichte niedriger Klassen bereits heute möglich sind, weiß man. Dass dies nur der Anfang ist, auch. Durch das Natural Language Processing und immer bessere Grafiksysteme steht der Einsatz computerbasierter Moderatoren auch in Europa bevor.
Jedoch gilt auch hier, wie bei nahezu allen journalistischen Anwendungen künstlicher Intelligenz, dass sie primär fürs Produzieren von zusätzlichem Material eingesetzt wird – und nicht für den Ersatz von Personal.
An dieser Stelle sei noch ein sehr eindrucksvolles Beispiel für KI erwähnt: Künstliche Intelligenz kann bereits heute realistisch wirkende Personen aus unfassbar vielen Bildern aus dem Internet rendern. Auf dieser Website kann man einen Einblick bekommen, wie eine KI aus Internetbildern teilweise täuschend echt künstliche Personen erzeugen kann.
Wie kann man KI umsetzen?
Viele Fragen sich, ob sie eine eigene Künstliche Intelligenz aufsetzen sollen oder die eines öffentlichen Anbieters nutzen sollten. Die Antwort ist nicht einfach zu geben, da viele Aspekte eine Rolle spielen. Wer jedoch selbst KI entwickelt, benötigt deutlich mehr Zeit als jemand, der einen verfügbaren KI-Engine nutzt. Allerdings muss man sich auch die Frage stellen, ob der öffentliche KI-Engine überhaupt über die Metadaten verfügt, die jeweils relevant sind.
Fazit
Künstlicher Intelligenz kann man sich nicht verschließen. Will man in Bezug auf Schnelligkeit konkurrenzfähig bleiben, muss man sich definitiv mit dem Thema auseinanderzusetzen.
Generell gilt, dass KI die Möglichkeit bietet, mehr von dem zu realisieren, was wir heute nur begrenzt schaffen können. Mehr Material mit der gleichen Personenstärke in besserer Qualität zu produzieren wird dank KI möglich, denn wenn KI die »minderwichtigen« Materialen produziert, haben die Mitarbeiter mehr Zeit für qualitativ anspruchsvolles Material.
Was jedoch nicht außer Acht gelassen werden soll, ist, dass die KI einen Menschen braucht, der sie überwacht. Denn man möchte und sollte ein wichtiges Thema wie Meinungsbildung, z.B. durch Materialempfehlungen oder eben den Qualitätsjournalismus nicht dauerhaft einem Computer überlassen.