Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> počítač >> počítačová bezpečnost >>

Jak by mohl algoritmus místě trollové na internetu?

isqus pro dané lokality Breitbart.com, CNN.com a IGN.com, klenout se nad 18 měsíců od března 2012 do srpna 2013. Údaje se skládala z asi 1.750.000 uživatelů (téměř 49.000 z nich zakázala), 1.26 milionů nitě a 39 milionů pracovních míst (téměř 838.000 z nich se zrušuje a 1350000 z nich hlášeny). Oni zúžil zakázané uživatelská data dolů na zhruba 12.000 uživatelů, kteří po březnu 2012 se připojil k stránek, měl přinejmenším pět míst a byly zakázány trvale na něco jiného, ​​než spam identifikátorů URL [Zdroj: Cheng].

Vědci pořízených dat včetně poštovního obsahu, aktivit uživatelů, reakce Společenství a moderátor akce. Oni porovnání zpráv uživatelů, kteří byli nikdy zakázaných na zprávy uživatelů, kteří byli trvale zakázány, a podíval se na změny v chování zakázaných uživatelů nad jejich čas. Tým zjistil, že pracovní místa budoucích zakázaných trollů tendenci mít následující vlastnosti:

  • chudý pravopisu a gramatiky
  • Další vulgární výrazy
  • více negativních slov
  • méně smířlivý nebo předběžný jazyk
  • nižší Pochopitelnost četby na základě několika čitelnosti testů (včetně automatizované čitelnosti Index), který zhoršil k době zákazu
  • použití různých žargonu a funkci slova od členů non-zakázány komunity
  • více odklonu od tématu
  • mnohem větší počet pracovních míst než připomínkového průměrného uživatele
  • tendence koncentrovat své odpovědi v jednotlivých nití
  • tendence provokovat další odpovědi od ostatních
  • horší chování v průběhu času končit na svém pracovním místě ve stále větší míře odstraněny před zákazem

    Na CNN.com, průměrný uživatel inklinoval Pro přidání asi 22 pracovních míst během 18 měsíců, zatímco budoucí zakázáno Uživatelé zaslali kolem 264 časů předtím, než byly zakázány [zdroje: Cheng, Collins]. Obec byla také méně pravděpodobné, že tolerovat troll v průběhu času.

    Pomocí měřitelné výsledky, vědci byli schopni vyvinout algoritmus (soubor kroků, používané k vyřešení problému, nebo provést úlohu), který používá jako pouhými pěti komentáře určit, kdo by byl zakázán v budoucnosti s přesností 80 procent. S 10 míst, výsledky byly 82 procent přesné, ale výkon kulminoval kolem 10 míst. Dřívější uživatel posty byly lepší pro předpovídání, zda by si zakázány později. Tým dosáhl podobnou úroveň přesnosti během všech tří on-line komunit. Vypouští Příspěvek se místo moderátorů se ukázalo, že je nejvíce informační činnost studoval, ale všechna

    Page [1] [2] [3]