老师的大兔子好软水好多的网站|井田制的特点|亚洲精品无码专区在线在线播放|古典文学下载|少女配狗1-12集全集在线观看|99久久点在线精品|av人人揉揉资源站免费

思億歐觀點

抵制搜索引擎優化作弊

發布時間:2009-07-28

有一些作弊技術還是很難被發現,抵制網絡作弊是一個不斷研究,不斷進行的過程,一旦搜索引擎能夠探測到一些作弊手段,研究搜索引擎的人就會發明更多的作弊技術。

有一些作弊技術很容易被發現,例如使用刷新元標記的自動改變加載頁面技術。但是使用腳本的自動改變加載頁面非常難被發現,因為搜索引擎爬蟲不會執行腳本。對于掩飾技術,網絡爬蟲會把自己偽裝成普通瀏覽器來防止。

使用指向頁面的錨文本的詞索引頁面能夠在一定程度上避免內容作弊,因為在其他頁面上的錨文本更加可信。這技術本身是為了索引那些不被網絡爬蟲發現的頁面而提出的,現在是搜索引擎中的常用技術,例如:搜索引擎給錨文本中的詞更高的權值。實際上,在錨文本周圍的詞同樣提供了對于目標頁面的編輯上的判斷。

而對于內容作弊,頁面描述算法同樣有抵制的作用,因為算法本身是基于指向目標頁面的鏈接的,同時指向目標頁面的頁面需要具有一定知名度或者有一個高排名分數。但是,卻沒有辦法處理前面討論的鏈接作弊技術。

相比分別抵制不同類型的作弊,有一種稱為信任排名(TrustRank)的技術被提出,能夠同時防止所有的作弊技術。這種技術利用知名度網頁和非垃圾網頁聚集的特點,例如:在網絡上,有一定知名度的網頁通常很少指向垃圾網頁,但垃圾網頁通常指向很多有知名度的網頁(試圖增加自己的中心程度分數)。鏈接分析方法被用作區分知名度網頁和任何形式的垃圾網頁,而不是處理單個的作弊技術。

抵制作弊也被認為是一個分類技術,例如:預測一個網頁是否是垃圾網頁。可以使用指導性的學習算法訓練一個垃圾分類器,主要問題在于涉及學習的特點。

1.頁面中單詞的數目:一個垃圾頁面傾向比非垃圾頁面包含更多的單詞,從而希望能夠包含多數流行詞。

2.平均單詞長度:在英語中平均單詞的長度是5個字母,人造內容的平均單詞長度通常不同。

3.頁面標題中的單詞數目:由于搜索引擎通常給頁面標題中的單詞更多的權值,所以作弊器通常在頁面標題中添加更多的關鍵詞。

4.可見內容部分:垃圾頁面通常使垃圾項對用戶不可見。

但是,有一些作弊技術還是很難被發現,抵制網絡作弊是一個不斷研究,不斷進行的過程,一旦搜索引擎能夠探測到一些作弊手段,研究搜索引擎的人就會發明更多的作弊技術。

分享至share
  • pin
  • weibo
  • wechat
email

上一篇:什么是Web數據挖掘

下一篇:分類目錄

tel 24小時免費服務咨詢熱線:400-080-3010

立即咨詢立即咨詢 聯系我們聯系我們