Študenti vyvinuli softvér na odhaľovanie nevhodných komentárov
Internet je jedna veľká džungľa. Obzvlášť pre sociálne siete platí, že sa na nich ľudia uzatvárajú do skupín vlastných prívržencov, medzi ktorými šíria jeden hejt, hoax či konšpiračný blud za druhým. Posadení pohodlne za obrazovkou sa tešíme z utrpenia druhých ľudí, prajeme im smrť, nadávame im nespisovnými výrazmi, a pritom si neuvedomujeme, že by im naše slová mohli ublížiť. Aj v diskusiách pod článkami sa to hemží agresivitou a vulgárnosťou. Ak webový portál nechce byť nástenkou na šírenie urážok, musí sa s príspevkami diskutérov nejako vyrovnať. Otvoriť diskusiu v našich podmienkach pod článkom o potratoch, migrácii alebo slovenskom vojnovom štáte znamená, že po chvíli sa komentáre zvrtnú neželaným smerom k osočovaniu a urážkam. Nie je v silách moderátora sledovať stovky príspevkov denne. Z pragmatických dôvodov je jednoduchšie, ak noviny diskusiu pod článkom vypnú, aby sa vyhli nepríjemnostiam.
Študenti z Fakulty informatiky a informačných technológií Slovenskej technickej univerzity vyvinuli softvér moderatelT, ktorý by moderovanie diskusií pod článkami mohol výrazne uľahčiť.
Nevhodné príspevky
„Náš softvér dokáže moderátorovi ponúknuť tie príspevky, ktoré sú najhoršie, a mal by sa nimi zaoberať, lebo do diskusie nepatria. Môže ísť napríklad o osobné útoky, urážky alebo reklamu," povedal pre Denník N Filip Vozár, člen tímu. „Naším cieľom je zúžiť množinu príspevkov, na ktorú sa moderátori majú zamerať. Vďaka tomu nemusia tráviť čas nad príspevkami, ktoré sú dobré. Rovno prejdú k tým, ktoré sú zlé, a tie môžu zmazať alebo skryť podľa internej politiky portálu," dodal študent.
Vulgárne slová
Softvér poskytuje používateľovi niekoľko údajov, podľa ktorých sa môže rozhodnúť, ako s príspevkom naloží. Ide napríklad o výskyt vulgárnych slov, tematickú podobnosť s článkom a predchádzajúcim komentárom. „Spolu je tam okolo 20 parametrov. Poskytujeme dáta aj o tom, či príspevok obsahoval odkazy na iné stránky alebo koľko v ňom bolo slov napísaných veľkými písmenami. Sledujeme aj gramatiku - to je dôležitý údaj o autorovi príspevku," vysvetlil Jakub Adam, člen tímu. V súčasnosti dokáže softvér zaradiť správne 65 percent príspevkov podľa toho, či sú dobré alebo nevhodné. Z diskusného príspevku vyťahuje čísla, ktoré ho určitým spôsobom opisujú. „Čísla, ktoré z textov dostávame, sa týkajú počtu nadávok, formátovania alebo nálady príspevku, či je pozitívna alebo negatívna. Využívame pri tom slovník, ktorý obsahuje citovo zafarbené slová," vysvetlil Andrej Švec, člen tímu. Jadrom softvéru je strojové učenie. Počítačovému systému umožňuje učiť sa, ktoré príspevky sú zlé a ktoré dobré. „Je to založené na tom, že algoritmus sa na základe vybraných čŕt sám naučí určovať, či je príspevok vhodný alebo nie. Naučí sa to na základe toho, že mu poskytneme dostatočné množstvo príkladov, čo znamená dobrý a zlý príspevok," dodal Švec. Študenti chcú softvér ďalej vylepšovať a zvýšiť jeho úspešnosť v označovaní dobrých a zlých príspevkov. Chcú, aby počítač bral do úvahy aj pozíciu slov vzhľadom na seba. „Ak by človek použil v komentári slovo blbec, ale pred ním by boli slová, ty si má to väčšiu váhu ako v iných prípadoch. Lebo je rozdiel medzi vetami: ,Som blbec, mýlil som sa, prepáč, a Ty si blbec"' vraví Švec. Študent si myslí, že počet ľudí, ktorí sa uchyľujú k nevhodným komentárom klesá, ak musia svoju totožnosť potvrdiť prepojením s účtom na Facebooku. Podľa Moniky Filipčíkovej z tímu moderatelT nemá stále viac ľudí problém vystupovať pod vlastnou identitou a písať agresívne či vulgárne veci.
OTAKAR HORÁK reportér
„Naším cieľom je zúžiť množinu príspevkov, na ktorú sa moderátori majú zamerať. Vďaka tomu nemusia tráviť čas nad príspevkami, ktoré sú dobré. Rovno prejdú k tým, ktoré sú zlé, a tie môžu zmazať alebo skryť podľa internej politiky portálu.“
Filip Vozár, moderatelT
PUBLIKOVANÉ 20. apríl 2016