優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利
優(yōu)惠活動 - 12周年慶本月新客福利

行業(yè)動態(tài)基于網(wǎng)頁結(jié)構(gòu)與語言特征的垃圾網(wǎng)頁鏈接檢測方法

        基于網(wǎng)頁結(jié)構(gòu)與語言特征的垃圾網(wǎng)頁鏈接檢測方法。檢測spam網(wǎng)頁仍是一個具有挑戰(zhàn)性的研究領(lǐng)域。經(jīng)過實驗與對比,算法已經(jīng)可以基本解決spam檢測的問題,準確率較高,又不會出現(xiàn)過高的誤報率和漏報率。同時,如果用戶對誤報率和漏報率有所要求時,也可以通過修正優(yōu)勢率的閾值來實現(xiàn)。

        但是,算法仍有一些需要深入研究的問題。后續(xù)工作需要更進一步擴大并完善初始數(shù)據(jù),從而優(yōu)化對優(yōu)勢率字典的構(gòu)建。同時,希望更進一步地研究優(yōu)勢率閾值的選取,從而更準確地對網(wǎng)頁進行檢測。

        最后,網(wǎng)頁中,塊與塊之間是有聯(lián)系的,而本算法簡化了這一部分,把塊當作獨立的個體進行處理。所以,在后續(xù)研究中,可以將塊與塊之間的相似度,如結(jié)構(gòu)相似度、文本內(nèi)容相似度等加入特征的選取和計算、

本文地址:http://m.hbbqcd.cn//article/21304.html
相關(guān)文章:
最新文章: