2009年11月27日星期五

Google 該不該為搜尋結果道歉?



最近Google牽扯上了種族歧視的問題, 因為在Google透過搜尋美國總統第一夫人, 結果出現了Michelle Obama變成了Ape(猩猩)的照片, 引起美國輿論嘩然, 認為Google挑起種族歧視 ...

這張不當的照片就不貼上了, 相關報導出現在許多媒體上, 也許你可以找到 ...

CNN:
"Google apologizes for results of 'Michelle Obama' image search"

ABC:
"Google Explains Offensive Michelle Obama Image in Search Results"

Search Engine Roundtable:
"First Google Image Result for Michelle Obama Pure Racist"

CBS:
"Google: Michelle Obama Pic Not Our Fault"

中時:
"歐巴馬夫人變猴臉 Google道歉卻不刪"

原本Google知道搜尋結果有不當畫面時有刪除圖片, 但是後來又恢復圖片(似乎只是不在第一頁?), 但是Google在搜尋結果上有內容連結到說明, 處理方式是對於搜尋結果道歉, 但是解釋Google並無法對於搜尋結果負責

其實Google根本無需做出任何道歉, 但是因為「種族歧視」實在是太大的一頂帽子, 而且又跟美國第一夫人有關, 因此不得不做出回應

如果Google需要對於搜尋結果不當而道歉的話, 那大概搜尋引擎需要天天道歉了...

另外值得探討的問題是: 為什麼這張照片會出現在第一頁? Google演算法出問題了嗎? 顯然是利用SEO技術讓這張不雅照片與「Michelle Obama」變成關聯, 這是Google Bomb的又一個代表作

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月25日星期三

搜尋引擎優化案例研究: 什麼是有效的SEO Strategy?



在前文"由 Alexa 統計數據觀察假流量與假搜尋"提到一些觀察現象, 本文來談談這些SEO策略的效果 ...

目前許多SEO業者把作業重心放在Link Building與Traffic Generation, 其實並不是很有效率的作法, 我們舉個案例來說明

某個SEO網站的Backlink數目約四萬多個, PageRank為3, 經Alexa統計看到Time on site如上圖, 但是他操作的關鍵字於Google SERP排行約為第300多名, 經websitegrader評分為60分以下, 經WayBackMachine查詢並沒有歷史資料

經過分析, 這個網站的作法是:

(1)透過購買連結來增加backlinks
(2)透過Keyword Stuffing與Link Stuffing在許多免費部落格的「內文」塞入關鍵字與連結
(3)透過人為流量產生軟體來作出流量

但是最終結果是排名300多名, 表示這個作法是沒有效果的, 為何會沒有效果?

沒有效果的主因是沒有注意到「相關性 Relevance」、「品質 Quality」、與「網站內容量 Content Amount」

許多人有注意到Matt Cutts的說法: Footer Link 與 Editorial Link 的比重是不同的 (如下影片)



所以很多人除了購買連結之外, 還造出許多部落格內容來夾雜人為的連結, 但是由於這些內容不會有人看, 也不會有自然流量, 因此內文中塞入再多的假連結, 其效果是很低的

況且近來的技術已經可以快速的找出文章的「相關性 Relevance」, 因此不相關內容的link當然「品質 Quality」就無法提升, 如果連往的網站內容量太少, 與link數目不成比例, 更是容易被搜尋引擎判斷為無效連結, 或者網站有大量的backlink, 但是與其自然流量不成比例, 也很容易被排除在優秀的SERP之外

因此沒有基本的網站信賴度, 只是一味的製造假連結與假流量, 其實是白費空夫, 還是從最基本的內容經營開始, 才是比較好的作法

不只Google如此, Bing的文章"link building for smart webmasters"也說:
The webmasters who create end user value within their websites, based on the needs of people, are the ones who will see their page rank improve. So where does that value come from? Content. Good, original, text-based content.
如果想要操作Paid Link或其他人為的作法, 應該好好閱讀"Link Building & Determining Link Quality" ...

也就是說並非哪些作法一定沒有效果, 但是必須把重點放在正常的經營網站, 如果沒有真正優秀的內容, 所有產生的backlink與Traffic都很容易變成無效或低品質的 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月20日星期五

由 Alexa 統計數據觀察假流量與假搜尋


(圖一)

Alexa的統計資料是許多網路分析的重要參考, 我們在前文"PageRank, BrowseRank, AlexaRank"已經探討過, 因此許多網站莫不希望在Alexa的統計數據漂亮一些而開始動手腳, 但是卻可能是反效果 ...

如上面的Alexa Time on Site (平均停留時間)統計資料, 有沒有看出奇怪之處? 為了避免爭議, 我們拿掉了domain name的資料, 所以並沒有指出是什麼網站的統計數據

正常的統計都是呈現自然的不規則曲線, 但是卻有兩條線有幾乎直線的狀況 ... 為什麼會這樣呢?

要知道原因必須先瞭解Alexa的數據來源, 當使用者的瀏覽軟體安裝Alexa Toolbar後, 就成為Alexa的統計樣本, 你的網路瀏覽數據就進入Alexa的資料中心

因此當然Alexa的統計只算是抽樣, 然後由這些樣本中去推估某個網站的流量數據, 所以如果你把某個網站的Alexa數據單獨來看, 他是不準確的, 但是如果以幾個網站來比較, 相對比較的結果是可以信賴的

也就是說, 你以Alexa的PageViews pers User來看某個網站A, 如果其值是3, 你不能肯定的說網站A平均每位網友瀏覽了3頁, 但是如果另外一個網站B的PageViews pers User是5, 那麼你可以說網站B的平均每位網友瀏覽頁數高於網站A的平均每位網友瀏覽頁數, 當然未必百分之百準確, 但是準確度是目前最有公信力的

雖然也有人質疑Alexa的數據處理不夠精準 (Alexa Toolbar and the Problem of Experiment Design), 但是前面說過, 以單獨資料的失誤來說Alexa不準確, 也不夠科學

我們如果把Alexa的資料與Compete的資料拿來對照, 大概就能夠知道資料的準確度

如下圖二, 我們把ChinaTimes, UDN, TVBS的流量拿來比較


(圖二)

兩個不同資料來源的統計, 都是UDN > ChinaTimes > TVBS, 並且差距比例都類似, 且由於Alexa的資料量比Compete齊全, 所以Alexa的統計在每個時間點都有, 因此曲線的呈現比較有變化

所以基本上, 我們在假設Alexa的統計精準情況下, 來分析假流量與假搜尋

當網站的流量很少時, 人為的數據就很容易影響Alexa的PageViews per User, Bounce rate, Search Percentage的數字呈現

例如狀況A: 某網站的某日有50個自然的Visitors, 平均每個人只有瀏覽1頁, 如果這個網站造假了另外50個Visitors, 並且平均都瀏覽了10頁, 這時原本PageViews per User就從1跳到5.5

狀況B: 如果某網站的某日有5000個自然的Visitors, 平均每個人只有瀏覽1頁, 如果這個網站造假了另外50個Visitors, 並且平均都瀏覽了10頁, 這時PageViews per User還是在1左右

所以同樣做假一樣的量, 狀況A的數據就很容易被改變, 如果每天作假 .... PageViews per User的曲線就可以看出不自然的數據

又因為人為的數據大多透過電腦自動送出資料, 如果沒弄好就會出現如圖一的不自然直線

我們再來看下面的統計圖 (六個月內的統計資料), 同樣也拿掉domain name資料


(圖三)

從上圖的直線區域或近似直線區域, 可以看出疑似作假的假流量與假搜尋

我們再來看下面的統計圖 (一個月內的統計資料), 同樣也拿掉domain name資料


(圖四)

從上面一個月內的資料看, 也可以看出在一個月之內的可疑資料, 有些在六個月內的統計可以看出作假, 有些可以在一個月內的統計資料看出來 ...

因此想要透過人為的方式來製造假流量與假搜尋是吃力不討好的事情, 還是好好經營網站內容才是正道 ... 而且很難保證什麼時候搜尋引擎會開始處理假流量的問題

我們在"SEO關鍵解碼"提到影響搜尋引擎排名的三大原因: 關鍵字相關性, 網站信賴度, 網頁流量

「關鍵字相關性」又可以分成「內容相關」,「外部相關」,「QDF」等因素, 這點相信很多都還是以關鍵字密度與連結Anchor text來操作, 但是都忘記了「品質」的問題, 因此到最後則亂做一通

「網站信賴度」則與PageRank, 收錄量 ... 等因素有關係, 其操作是比較不容易

所以最後最容易操作的就只有「網頁流量」, 許多出現在SERP前面的網站, 根據觀察結果, 有很多是透過製造假流量與假搜尋來完成, 所以很多人才會疑問: 「為什麼這些網頁完全看不出來排到前面的原因」, 有些是真的流量, 但是大半都是假流量

關鍵字相關性, 網站信賴度, 網頁流量這些因素, 透過人為操作確實可以欺騙過搜尋引擎, 但是很難逃過仔細的分析, 雖然獲得了漂亮的SERP, 但是卻損失了信譽 (或者至少應該做的自然一點)

以上只是初略的來研究Alexa的統計資料, 並且假設Alexa的統計數據是精準的, 如果有其他看法來解析造成直線的原因, 歡迎討論交流 ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院