Vplyv odhadu podielu navigačných stránok na kvantitu extrahovaných vzorov správania sa používateľov webu

Ľubomír Benko

Abstrakt


Fáza predspracovania dát zohráva dôležitú úlohu pri vyhodnocovaní údajov z logovacích súborov webových portálov. Tento článok porovnáva aplikáciu štandardných data mining-ových techník na dva rôzne webové portály/systémy. Rozdiel je v spôsobe autentifikácie používateľov, kde virtuálne vzdelávacie prostredie vyžaduje prihlásenie na prezeranie obsahu a univerzitný portál umožňuje anonymné prezeranie obsahu. V článku sa skúma vplyv identifikácie sedení pomocou metódy Reference Length, vypočítanej z mapy webu a subjektívneho odhadu, na kvantitu extrahovaných sekvenčných pravidiel. Výsledky ukázali, že identifikácia sedení  metódou Reference Length, počítanej na základe odhadu z mapy webu, má vplyv na počet získaných užitočných pravidiel. Metóda dopĺňania ciest má významný dosah len na nárast triviálnych a nevysvetliteľných pravidiel.



Back to list of accepted papers