AI lärde sig att känna igen hatpropaganda för att bekämpa Twitter-troll

Tangentbord-bashing troll är normen i Twitterverse och det sociala nätverket har inte gjort ett fantastiskt jobb med att kontrollera det. Så mycket att en tredjepersons kreativa byrå ringde Möjlig, har tyckt att det var nödvändigt att gå in och förvandla hatretorik till något bra och lanserade en kampanj som heter Vi motverkar hat.

AI lärde sig att känna igen hatpropaganda för att bekämpa Twitter-troll

Samarbetar med Snabbt, Possible har kunnat träna en AI att känna igen hatiska tweets. När AI:n upptäcker det hatiska meddelandet kommer en mänsklig moderator att skicka en mottweet till trollet och varna dem om att deras tweet har motverkats av karmisk godhet. För varje retweet We Counter Hate får kommer Possible, med donationer från allmänheten, att ge ett bidrag på $1 till den ideella organisationen, Livet efter hat.

Pratar med VentureBeat, Possible förklarade hur teamet tränade sin bot att känna igen hatpropaganda av anpassade Gregory Stantons Tio stadier av folkmord, kondenserar sitt dokument ner till de bitar som bara är relevanta för Twitter – från tweets som är avsedda att avhumanisera till tweets som är avsedda att polarisera samhällen.

Genom att arbeta med Spredfirst för att hjälpa moderera inkommande meddelanden, kategoriserar AI dessa tweets i olika strömmar av hatretorik. Possible matar sedan detta genom sitt system så att det kan lära sig talets språkliga nyanser. När den väl har tränats flaggar den meddelanden för mänskliga moderatorer för att ingripa och identifiera vad som verkligen är hatretorik och vad som bara kan ha förvirrats av systemet.

twitter_troll

(Ovan: Ett exempel på @we_counter_hate i aktion)

Bekämpa troll på deras favoritplattform? Det är en trevlig idé. Förutom … det finns några stora brister.

Problemen med att använda bots för att bekämpa troll

Troll älskar att förstöra i sig goda ändamål. Jag kan inte låta bli att påminnas om en smärtsam serie händelser som involverar skådespelaren Shia LaBeouf. I en onlinekonstföreställning som heter Han kommer inte att dela oss, LaBeouf försökte lansera en 24-timmars stream för att protestera mot Donald Trumps invigning. Det var meningen att den skulle visas under hela Trumps mandatperiod, men dess hem på Museum of the Moving Image varade knappt tre veckor efter ett storskaligt trollangrepp.

We Counter Hate verkar vara utmärkt att replikera Labeoufs recept på misslyckande. Det är inte svårt att föreställa sig scenarier där troll hela tiden hittar sätt att bryta boten.

För det andra, verkar det inte som om kampanjen, på ett perverst sätt, nästan uppmuntrar till hatretorik? Om du vill se mer av de motverkande tweets, måste hatfyllda tweets läggas ut på det sociala nätverket i första hand. Folk kanske bara lägger upp hatretorik för att utlösa boten.

Även om sådana här kampanjer i teorin är bra, så är det mesta av min skepsis som säger att det här kommer att sluta i tårar för användarna. Saken är den att det inte finns någon entydig lösning för att ta itu med onlinetroll. Problemen härrör utan tvekan från själva systemen för sociala nätverk; något som Twitter och Facebook ofta binder sig i knutar när de försöker ta bort dem. Det finns ingen enskild skottsäker lösning, och en bot som i slutändan arbetar för att marknadsföra en kreativ byrå kommer sannolikt inte att lösa problemet på egen hand.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *