Klasifikácia falošných správ pomocou TfIdf a dependenčnej gramatiky

Kitti Nagyová

Abstrakt


Falošné správy sú komplexným problémom, ktorý vedie k skúmaniu rôznych prístupov na ich identifikáciu. Článok je zameraný na identifikáciu falošných správ na základe ich obsahu. Použité datasety obsahujúce pravdivé a falošné správy boli analyzované pomocou syntaktickej analýzy. Pre jednotlivé vety dátového súboru boli použité metódy dependenčnej gramatiky, na základe ktorej bola stanovená dôležitosť každého slova vo vete. Informácia o dôležitosti slov bola použitá na vytvorenie vstupných vektorov pre klasifikačné metódy. Cieľom článku je zistiť, či je možné pomocou dependenčnej gramatiky zvýšiť presnosť klasifikácie falošných správ. Navrhnuté techniky sme porovnali s bežnou TfIdf metódou. Výsledky ukazujú, že je možné zvýšiť presnosť klasifikácie falošných správ pomocou dependenčnej gramatiky ak sa kombinuje s TfIdf technikou.Back to list of accepted papers