Nyní Bots pochopí i Sarcasma

Vědci z Massachusetts Institute of Technology (MIT), USA, vyvinuli algoritmus, který dokáže detekovat sarkasmus v tweety, očividně lepší než většina lidí.




Zdroj

Vědci se zpočátku snažili vyvinout algoritmus, který dokáže detekovat rasistický a urážlivý obsah, ale v průběhu procesu tento algoritmus vyvinul nejprve, protože cítili, že je důležité, aby stroj pochopil sarkasmus.

Vědci se domnívají, že pochopení sarkasmu je prvním krokem algoritmu k lepšímu pochopení emocionálního podtextu věty.

'Protože nemůžeme použít intonaci v našem hlasu nebo řeči těla k kontextualizaci toho, co říkáme, emoji jsou způsob, jakým to děláme online,' říká Iyad Rahwan, docent, laboratoř MIT Media, který vyvinul algoritmus s jedním z jeho studenti, Bjarke Felbo, řekl Recenze MIT.

Více ve zprávách: Microsoft pracuje na zařízení Windows 10: Might Support AR and VR Tech

'Neuronová síť se naučila spojení mezi určitým druhem jazyka a emodži,' dodal Rahwan.

Twitter je již centrem trollů a společnost se snaží zvyšovat svou hrozbu.

Mezi inzerenty bylo převládajícím měřením postojů a chování lidí vůči příspěvkům na sociálních médiích.

Když je tento algoritmus plně vyvinut, může prokázat, že je elementární v tom, že pomáhá rozhazovat násilné / rasistické / obtěžující tweety a také uživatelům.

Algoritmus používá techniku ​​hlubokého učení, která trénuje simulovanou neuronovou síť k identifikaci a porozumění vzorců pomocí velkého množství dat.

Vědci používali velmi běžný způsob, jak projevovat emoce na internetu - emojis - jako systém označování a jeden ze způsobů, jak trénovat svůj algoritmus k identifikaci emocí v tweety.

Aby vyzkoušeli roboty v reálném světě proti lidem, vědci najali dobrovolníky prostřednictvím webu crowdsourcing Mechanical Turks. Algoritmus identifikoval sarkastické podtóny v tweety s přesností 82 procent ve srovnání s lidskými dobrovolníky, kteří identifikovali sarkasmus s přesností 76 procent.

'Je možné, že se učí všechny různé slangy,' říká Felbo. 'Lidé mají velmi zajímavé použití jazyka [na Twitteru] - to je řečeno.'

Vědci shromáždili více než 55 miliard tweety celkem, z nichž 1,2 miliardy obsahovalo emodži. Pomocí těchto emodži vložených tweety vědci pomohli algoritmu učit se a identifikovat to, které emodži se používají s jakým druhem textu - šťastný, smutný, vtipný atd.

Více ve zprávách: 10 klíčových věcí, které byste měli vědět o Rs 49,999 Worth Asus Zenfone AR

Počítače se každým dnem zlepšují ve strojovém učení a získávají lepší představu o tom, jak lidé mluví a jak se chovají prostřednictvím získávání dat ze sociálních médií.

Tento algoritmus lze použít k potlačení urážlivého, rasistického a teroristického obsahu nejen z Twitteru, ale i od jiných organizací, jako je Facebook, YouTube, Snap a další, kteří se snaží, aby jejich platformy i internet byly lepším místem.