Slovenskí študenti z Fakulty informatiky a informačných technológií STU začali minulú jeseň pracovať na vývoji softvéru, ktorý vyhľadáva urážlivé komentáre v diskusiách pod článkami v médiách a na sociálnych sieťach. Minulý týždeň sa vďaka vynálezu dostali do semifinále prestížnej celosvetovej súťaže Imagine Cup, ktorú organizuje spoločnosť Microsoft.
Do semifinále súťaže postúpili v online hodnotení iba dva tímy z 200 prihlásených krajín a regiónov z celého sveta. Okrem druhého tímu z Kanady budú ich konkurenciou v semifinále víťazi národných kôl Imagine Cup z približne päťdesiatich krajín, kde ich organizujú lokálne pobočky Microsoftu.
Slovenský tím s názvom TrollBusters tvorí štvorica študentov FIIT STU – Monika Filipčíková, Jakub Adam, Andrej Švec a Filip Vozár – ktorých vedie pedagóg Jakub Šimko. Či sa im podarí prebojovať až do finále v americkom Seattli sa študenti dozvedia najneskôr v júni.
V súťaži si však pripísali už jedno čiastkové víťazstvo, keď vyhrali súťaž Big Idea Plan, ktorá hodnotila nápad a inovačný potenciál študentského projektu.
Krotitelia trollov
Softvér moderateIT vymysleli študenti priamo za účelom zúčastniť sa súťaže, ale zároveň je aj súčasťou ich bakalárskej práce. „Na účasť v kategórii Inovácie bolo potrebné vymyslieť tému, ktorá zaujímavým spôsobom rieši reálny problém a má prínos pre spoločnosť,“ hovorí Filip Vozár. Zároveň sa podľa neho kladie dôraz aj na obchodnú stránku projektu a musí byť udržateľný z dlhodobého hľadiska.
Pri hľadaní témy narazili študenti na články, ktoré opisovali, že spravodajské portály majú problém s kvalitou diskusií, pretože sa často zvrhnú do hádky plnej osobných urážok. „Všimli sme si, že tento problém riešia portály na celom svete, preto sme oslovili aj niektoré slovenské denníky. Potvrdili nám, že je to reálny problém a uvítali by nástroj, ktorý by im zjednodušil moderovanie diskusií," hovorí Filip Vozár. Médiá totiž často museli pristúpiť k radikálnym riešeniam – zastaviť diskusiu, alebo ju niekedy radšej ani neotvoriť.
Softvér pracujúci v slovenčine a angličtine ponúkajú ako službu, ktorá dokáže vyhodnotiť kvalitu komentárov. Keď ju totiž moderátori poznajú, môžu ako prvé skontrolovať tie s nízkou úrovňou a nemusia nevhodné komentáre hľadať medzi stovkami ostatných príspevkov. Takáto pomoc výrazne skráti čas, ktorý
strávia spravovaním diskusií.
Dostávajú body
Kvalitu komentárov vývojári vyhodnocujú pomocou strojového učenia. Strojové učenie je podoblasť umelej inteligencie, zaoberajúcej sa algoritmami a technikami, ktoré umožňujú počítačovému systému „učiť sa.“ Pri analýze komentárov pridelia určitým heslám číselnú hodnotu – napríklad použitie nadávok, podobnosť s témou diskusie, ladenie príspevku, gramatická správnosť. Pozerajú sa tiež na črty komentára, ktoré súvisia s jeho autorom – ako mu boli v minulosti mazané príspevky, aká je jeho priemerná kvalita príspevkov, a podobne.
Takýmto spôsobom z komentáru vyčlenia viac ako 20 obodovaných znakov, ktoré potom skombinujú pomocou strojového učenia. Výsledkom je číslo označujúce kvalitu komentáru. Podstatou strojového učenia pritom je, že sa stroj sám naučí na základe predchádzajúcich prípadov predpovedať kvalitu komentáru.
ModerateIT dnes dokáže správne zaradiť asi 65 percent komentárov, a podľa študentov bude úspešnosť zaraďovania vďaka stále sa rozširujúcej databáze narastať.
Ak softvéru predložíte veľké množstvo komentárov, ktoré už v minulosti moderátori ohodnotili ako dobré alebo zlé, algoritmus sa pozrie na ich príznaky a naučí sa, ktoré kombinácie znamenajú akú kvalitu. „Keď mu potom predložíme neznámy komentár, ten, ktorý chceme analyzovať, tak môže zistiť, že v minulosti mal komentár s podobnými príznakmi nízku kvalitu a vyhodnotí, že je daný komentár na 90 percent nevhodný,” vysvetľuje Filip Vozár.
Do semifinále v online hodnotení postúpili okrem Slovákov ešte Kanaďania, ktorých projekt sa zameriava na efektívnosť spotreby pohonných hmôt.
V minulosti Microsoft organizoval národnú súťaž aj na Slovensku. Pravidelnými víťazmi boli študenti z FIIT STU, pričom pred rokom vyhrali národné kolo s projektom SpineHero, ktorý sa zameriaval na kontrolu správneho držania tela pri sedení za počítačom. V minulosti v národnom kole uspel napríklad aj tím Speekle s logopedickými hrami pre deti, ktoré sa učia správne vyslovovať hlásky.
PUBLIKOVANÉ 16. máj 2016