Bing 提出 URL 關鍵字堆砌過濾機制

Bing在本週宣布了在數個月前推出的一個獨特的作弊過濾機制,針對一種常見的作弊技術知識,那就是URL關鍵字推砌。
帶有關鍵字的URL被設計用來操縱搜索引擎給與頁面一個高於本身價值排名的黑帽技巧。
帶有關鍵字的URL對排名演算依賴於兩個假設:
1.關鍵字一致的被使用
2.關鍵字對於URL是特別有價值的
雖然這是有些簡單化考量採用幾千信號的搜索引擎來確定頁面排名,不過這些信號確實有著一定的作用
作弊者確定了這些察覺到的“漏洞”後,他們試圖抓住這樣的優勢藉由通過創建關鍵字域名名稱。而因為他們的目標為最大化的影響,則他們傾向於高價值/頻率/貨幣的關鍵字(如viagra, loan, payday, outlet, free等…)
這些都是構成整體的網址關鍵字概念的基本概念。作弊者嘗試各種方法來實現這種技術,產生了許多獨特的結果。這些都是一些比較常見的方法(注:下面提到的部分網址都是虛構的,用於示意)
多個 hosts,以及豐富關鍵字的 hostnames 名稱:
http://account.free.online.savings.samedaypaydayloansusa.com
Host / domain names 有重複的關鍵字:
http://loan.payday.paydayloanspaydayloansusa.com
URL群跨越相同的 domain ,但不同的 hostnames 組成的關鍵字排列
http://contososhoeswomen.shoesonsale.com/
http://bestwomensrunningsneakers.shoesonsale.com/
http://discountrunningapparelforwomen.shoesonsale.com/
被非法利用的URL: 這一項有點不同於以上,因為作弊者模仿人們拼錯的關鍵字,如
http://nytime.com(拼錯的 http://nytimes.com)
http://ebey.com (拼錯的 http://ebay.com)

Bing如何檢測帶有關鍵字的網址?

Bing 沒有提出檢測演算法的具體細節,因為作弊者可能會利用這些知識成為他們的優勢。什麼是 Bing 所發現的事呢?他們觀察了一些可能使用關鍵字URL堆砌的信號,如:
1.網站大小
2.hosts 數量
3.多少的字數在主機、域名及路徑
4.主機/域名/路徑的關鍵字共同出現(包括單字母及雙字母)
5.高頻率的由主機/域名關鍵字組成的網站集群
6.含有某些詞彙/型態組合的主機/域名
( 如[“年”,“事件|商品名稱”],http://www.turbotaxonline2014.com )
7.網站/網頁內容的質量和知名度信號
Bing也說明了作弊過濾機制對一般用戶和搜索引擎優化者有了什麼樣的影響。
使用者感到不安的地方是,這個更新已經影響了3% Bing 的查詢(每個受影響的搜尋查詢將會1/10的URL會被濾掉。)
SEO界感到憂心的是,這些網站來自Bing,約有500萬左右,包括超過130M的網址,受到影響,流量減少了75%。