Die KI von Facebook kann Meme analysieren, aber kann sie sie auch verstehen? Die Rosetta-Technologie von Facebook analysiert Milliarden von Bildern, die Text enthalten, aber Memes sind zu Komplex für die Künstliche Intelligenz. Jeden Tag werden Milliarden von Texten, Fotos und Videos in den soziale Medien hochgeladen. Dies ist eine Fülle von Informationen, die menschliche Moderatoren und deren Faktenchecker nicht umfassend sichten, kontrollieren und steuern können. Unternehmen wie Facebook und YouTube verlassen sich seit langem auf künstliche Intelligenz, um Spam, Gewalt, kritische Inhalte und Pornografie von ihren Plattformen fern zu halten!

Information Warfare - Informationskriegsführung

So etwas wie eine systemkritische Meme ohne Text kann für ihre Superrechner und deren Algorithmen schwierig analysiert und verarbeitet werden, da für diese Aufgabe mehrere verschiedene visuelle Elemente gleichzeitig berechnet werden müssen. Automatisierte Systeme, sogenannte Botsysteme, müssen die über dem Foto liegenden Wörter erkennen und «lesen» sowie das Bild selbst analysieren und zuordnen. Memes kann man auch als komplizierte kulturelle Artefakte bezeichnen, die ausserhalb des Kontexts schwer zu verstehen sind. Trotz der Herausforderungen, die sie mit sich bringen, verwenden alle grossen soziale Plattformen bereits KI’s um Memes zu kontrollieren, einschliesslich Facebook, das ein Tool namens Rosetta verwendet, um Fotos und Videos zu analysieren, die Texte und Schriftzüge enthalten.

Laut Facebook wird Rosetta bereits verwendet, um Inhalte automatisch zu erkennen, die gegen Hate-Spech Richtlinien verstossen. Mit Hilfe von Rosetta, ist Facebook bemüht Inhalte von Nutzern auch von Fotos und Videos zu kontrollieren und nicht nur auf textbasierte Beiträge. Rosetta unterstützt den Prozess, in dem automatisch überprüft wird, ob Bilder und Videos, die Text enthalten, zuvor schon als «kritisch» markiert wurden. Rosetta kombiniert die OCR-Technologie (optische Zeichenerkennung) mit anderen Techniken des maschinellen Lernens, um Text in und auf Fotos und Videos zu sichten, verarbeiten, ein- und zuzuordnen und dann abspeichert. Zunächst wird mithilfe von OCR ermittelt, wo sich der Text in einer Meme oder in einem Video befindet. Auf diese Weise können sie Daten schnell umwandeln und anhand ihrer «Selektoren» den Inhalt bewerten.

Information Warfare - Informationskriegsführung

Sobald Rosetta weiss, wo sich die Wörter befinden, verwendet Facebook ein neuronales Netzwerk, das den Text, deren Transkription und seine Bedeutung verstehen kann. Dieser Text kann dann durch andere Systeme geleitet werden, z.B. durch ein System, das prüft, ob es sich bei dem Meme um einen bereits nach ihren Richtlinien entlarvten virale Botschaft handelt. Die Entwickler und Forscher von Rosetta behaupten, dass das Tool jetzt Text aus jedem Bild, das öffentlich auf Facebook hochgeladen wurde, in Echtzeit extrahiert und die Texte erkennen, sowie auch deren Sprachidentifzierung «lesen», darunter Englisch, Spanisch, Deutsch und Arabisch.

Rosetta kann auch Bilder analysieren, in den Texte in vielen verschiedenen Formen enthalten sind, z.B. Fotos von Protestschildern, Restaurantmenüs, Schaufenstern und mehr. Viswanath Sivakumar, Software-Ingenieur bei Facebook, der an Rosetta arbeitet, sagte in einer E-Mail, dass das Tool sowohl zur Identifizierung von Text in einer Landschaft wie auf einem Strassenschild als auch für Memes gut funktioniert – letzteres ist jedoch eine grössere Herausforderung ist. «Im Zusammenhang mit der proaktiven Erkennung von Hassreden und anderen Inhalten, die gegen Richtlinien verstossen, sind Bilder im Meme-Stil die komplexere KI-Herausforderung», schrieb er.

Im Gegensatz zu Menschen muss eine KI normalerweise auch Zehntausende von Beispielen sehen, bevor sie lernen kann, eine komplizierte Aufgabe zu erledigen, sagt Sivakumar. Aber Memes sind selbst für Facebook nicht endlos kontrollierbar und es kann sich auch als schwierig erweisen, genügend Beispiele in verschiedenen Sprachen und Emotionen zu sammeln und speichern. Das Finden hochwertigen Botschaft ist eine ständige Herausforderung für die Forschung im Bereich der künstlichen Intelligenz im weiteren Sinne. Daten müssen häufig sorgfältig manuel beschriftet und archiviert werden. Viele Datenbanken sind ausserdem urheberrechtlich geschützt.

Information Warfare - Informationskriegsführung

Um Rosetta mit den nötigen Daten zu speisen und deren Nutzen zu trainieren, werden Text, zusammen mit ihren Bildunterschriften und deren Orte, von dem aus sie veröffentlicht wurden in ein Rechenverfahren verbunden. In klaren Worten haben Sie ein Programm erstellt, um genau solche Beispiele zu erstellen, deren Inhalte fragwürdig erscheinen. Das bedeutet, dass der gesamte Prozess bis zu einem gewissen Grad automatisiert ist: Ein Programm spuckt die Meme automatisch aus und ein anderes versucht zu analysieren. Die KI wird vor sehr grossen Herausforderungen stehen. Zum Beispiel, wird Rosetta mit Sprachen wie Arabisch konfrontiert, die von rechts nach links gelesen wird, im Gegensatz zu anderen Sprachen wie Englisch oder Deutsch. Rosetta «liest» Arabisch rückwärts, dann kehrt Facebook nach der Verarbeitung die Zeichen um. Dieser Trick funktioniert überraschend gut und ermöglicht ein einheitliches Modell, das sowohl für Sprachen von links nach rechts als auch von rechts nach links funktioniert.

Automatisierte Systeme können für die Moderation und deren Faktenprüfer von Inhalten äusserst nützlich sein, sind jedoch nicht immer kinderleicht. Zum Beispiel verwendet WeChat zwei verschiedene Algorithmen, um Bilder zu filtern. Das erste, ein OCR-basiertes Programm, filtert Fotos, die Text zu verbotenen Themen enthalten, während die anderen Bilder zensieren, die denen auf einer schwarzen Liste ähneln, die wahrscheinlich von der chinesischen Regierung erstellt wurde. Durch die Filter von WeChat kann man leicht die Eigenschaften eines Bildes sowie die Farbgebung oder die geänderte Ausrichtung entziehen. Das Rossetta von Facebook ist zwar komplex, aber wahrscheinlich auch nicht perfekt. Das System kann durch schwer lesbaren Texte oder verzerrte Schriftarten umgangen werden. Alle Bilderkennungsalgorithmen sind auch immer noch potenziell anfällig für widersprüchliche Beispiele, leicht veränderte Bilder, die für Menschen gleich aussehen, aber dazu führen, dass eine KI durcheinander gerät.

Information Warfare - Informationskriegsführung

Facebook und andere Plattformen wie Twitter, YouTube und Reddit stehen in mehreren Ländern unter enormem Druck, bestimmte Arten von Inhalten zu überwachen. 2018 schlug die Europäische Union neue Gesetze vor, nach denen Social-Media-Unternehmen Terroristenposten innerhalb einer Stunde nach Benachrichtigung entfernen, oder mit Geldstrafen rechnen müssen. Rosetta und andere ähnlich automatisierte Tools helfen Facebook und anderen Plattformen bereits dabei, ähnliche Gesetze in Ländern wie Deutschland einzuhalten. Und sie werden bei ihrer Arbeit besser: Vor zwei Jahren sagte CEO Mark Zuckerberg, dass die KI-Systeme von Facebook nur proaktiv etwa die Hälfte der Inhalte abfangen, die das Unternehmen entfernt hat. Die Leute müssen zuerst den Rest markieren. Laut Facebook erkennen die KI-Tools fast 100 Prozent des von ihnen verurteiltem Spam sowie 99,5 Prozent des terroristischen Inhalts und 86 Prozent der grafischen Gewalt. Andere Plattformen wie YouTube haben ähnliche Erfolge mit automatisierten Inhaltserkennungssystemen erzielt.

Dies bedeutet jedoch nicht, dass KI-Systeme wie Rosetta eine perfekte Lösung sind, insbesondere wenn es um differenziertere Ausdrucksformen geht. Im Gegensatz zu einem Restaurantmenü kann es schwierig sein, die Bedeutung einer Meme zu analysieren, ohne den Kontext zu kennen, in dem es veröffentlicht wurde. Deshalb gibt es ganze Websites, auf denen sie erklärt werden. Memes zeigen oft Insider-Witze oder sind sehr spezifisch für eine bestimmte Online-Subkultur sowie deren moralischer und ethischer Hintergrund. Und eine künstliche Intelligenz ist immer noch nicht in der Lage, ein Meme oder ein Video so zu verstehen, wie es eine Person dies so tun würde. Vorerst muss sich Facebook noch auf menschliche Moderatoren und deren Faktenprüfer verlassen, um Entscheidungen darüber zu treffen, ob ein Meme entfernt werden soll.

Übersetzung Artikel vom Wired Magazin 14.09.2018

Information Warfare - Informationskriegsführung
(via Vale Rion)


Da ich immer wieder gefragt werde, was die einfachste Möglichkeit ist, in Bitcoin zu investieren: Mit der App Relai geht es in wenigen Schritten und ohne komplizierte Anmeldung. Niemand hat Zugriff auf Deine Bitcoin, ausser Du selbst. Mit dem Referral-Code REL105548 werden deine Gebühren um 0,5% reduziert.

Psst, folge uns unauffällig!

Mehr für dich:

Unterstütze uns!

 
«Dravens Tales from the Crypt» bezaubert seit über 15 Jahren mit einer geschmacklosen Mischung aus Humor, seriösem Journalismus – aus aktuellem Anlass und unausgewogener Berichterstattung der Presse Politik – und Zombies, garniert mit jeder Menge Kunst, Entertainment und Punkrock. Draven hat aus seinem Hobby eine beliebte Marke gemacht, welche sich nicht einordnen lässt.

Mein Blog war niemals darauf ausgelegt Nachrichten zu verbreiten, geschweige denn politisch zu werden, doch mit dem aktuellen Zeitgeschehen kann ich einfach nicht anders, als Informationen, welche sonst auf allen anderen Kanälen zensiert werden, hier festzuhalten. Mir ist dabei bewusst, dass die Seite mit dem Design auf viele diesbezüglich nicht «seriös» wirkt, ich werde dies aber nicht ändern, um den «Mainstream» zu gefallen. Wer offen ist, für nicht staatskonforme Informationen, sieht den Inhalt und nicht die Verpackung. Ich habe die letzten 2 Jahre genügend versucht, Menschen mit Informationen zu versorgen, dabei jedoch schnell bemerkt, dass es niemals darauf ankommt, wie diese «verpackt» sind, sondern was das Gegenüber für eine Einstellung dazu pflegt. Ich will niemandem Honig ums Maul schmieren, um auf irgendwelche Weise Erwartungen zu erfüllen, daher werde ich dieses Design beibehalten, denn irgendwann werde ich diese politischen Statements hoffentlich auch wieder sein lassen können, denn es ist nicht mein Ziel, ewig so weiterzumachen ;) Ich überlasse es jedem selbst, wie er damit umgeht. Gerne dürfen die Inhalte aber auch einfach kopiert und weiterverbreitet werden, mein Blog stand schon immer unter der WTFPL-Lizenz.

Es fällt mir schwer zu beschreiben, was ich hier eigentlich tue, DravensTales wurde im Laufe der Jahre Kulturblog, Musikblog, Schockblog, Techblog, Horrorblog, Funblog, ein Blog über Netzfundstücke, über Internet-Skurrilitäten, Trashblog, Kunstblog, Durchlauferhitzer, Zeitgeist-Blog, Schrottblog und Wundertütenblog genannt. Was alles etwas stimmt… – und doch nicht. Der Schwerpunkt des Blogs ist zeitgenössische Kunst, im weitesten Sinne des Wortes.

Um den Betrieb der Seite zu gewährleisten könnt ihr gerne eine Spende per Kreditkarte, Paypal, Google Pay, Apple Pay oder Lastschriftverfahren/Bankkonto zukommen lassen. Vielen Dank an alle Leser und Unterstützer dieses Blogs!
 


Wir werden zensiert!

Unsere Inhalte werden inzwischen vollumfänglich zensiert. Die grössten Suchmaschinen wurden aufgefordert, unsere Artikel aus den Ergebnissen zu löschen. Bleib mit uns über Telegram in Verbindung oder abonniere unseren Newsletter.


Nein danke!