2010年1月20日星期三

搜尋趨勢 : 又來五個專家的預測 (2010 Search Predictions)


這篇"2010 Search Predictions: The Experts Weigh In"又有五個專家的預測, 而且這五個預測更為勁爆, 不談談實在可惜...

1.Google will make a corporate decision to become seen as a software brand rather than as just a search engine. Google將不再只是搜尋引擎, 而會以軟體品牌姿態出現

這點應該不必預測 ... 小狗小貓都知道 ... 連隔壁的瑪麗亞都知道, 而且應該會以更多不同的姿態出現

2.Vertical search will finally take off in 2010: local search enabled by GPS on mobile devices will capture the imagination of consumers during 2010. 垂直搜尋將在2010起飛, 並且GPS加上在地搜尋將擄掠消費者的想像

這點有些類似我們在"網路行銷的最後一哩 : Google Nexus One?"所說的, 這個應該Google與微軟都可能有機會

3.Twitter will launch its own social version of AdWords -- And contrary to what chief operating officer Dick Costolo said earlier this year, we're not sure everyone is going to love it. 推特將推出自己的社交廣告, 但不確定是否能夠獲得喜愛

這個就無從說起了....who knows? 而Twitter似乎在台灣怎麼不如Plurk熱呢? 有機會再來談了

4.Google gets hit with an antitrust suit. Google將會面臨反托辣斯官司(如之前微軟所面臨的一樣)

話說大家已經開始對Google從喜愛, 敬佩 ... 到懼怕了, 似乎只要Google想插手的, 都無法抵擋(當然也許China除外了), Google現在正在走微軟的老路嗎? 還是會維持"No Evil"?

5.Google's search engine will group related results. Google將會群組包裝更多內容, 很可能會把跟搜尋相關的廣告產品群組包裝起來

這點許多專家都認為此舉將使Google帶入更多的機會與利潤

以上幾點, 以「垂直搜尋+在地搜尋+GPS」「相關的廣告產品群組包裝」較值得注意, 因為對於自然搜尋結果與搜尋行銷會直接影響, 如何因應呢? 有空再聊聊了...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月14日星期四

搜尋引擎在中國 : Baidu , Google



搜尋引擎基本上跟語言文字的關係密切, 如果再加上國情、文化、政治...等等因素的影響, 搜尋引擎想進入中國市場, 是一件很大的挑戰, 目前谷歌(Google)就面對了這樣的局面

上圖是2009年iResearch的統計資料, 谷歌Google市佔約為27%, 百度Baidu市佔約為63%

根據"iResearch:09Q2 China Search Engines Market Size Reached 1.72 Billion Yuan"顯示搜尋引擎市場在2009Q2比去年同期成長35.7%到達十億七千兩百萬人民幣的規模

根據"iResearch最新資料", 2009年中國搜索引擎市場規模達六十九億五千萬元人民幣,其中百度和谷歌中國兩家市場份額之和超百分之九十六點三,基本壟斷中國搜索引擎市場。其中百度占據百分之六十三點一的市場營收份額,谷歌中國占百分之三十三點二。

根據"China Search Engine – Behind the Great Wall", 到2008年底止, 中國的搜尋引擎使用人口達兩億五千萬人

再根據"Google Gained Market Share in China in Last Six Months - StatCounter", 顯示到2009年底, 百度Baidu市佔56%, 谷歌Google市佔43%

(註: ComScore資料顯示的是2009/8, 谷歌Google市佔14%, 百度Baidu市佔64%, 由於資料比較舊就不加以參考)

不管是iResearch的數字正確, 還是StatCounter的估計準確, 谷歌Google都佔有約中國1/3的市場, 而且這個市場是一直往上攀升的, 而2009/01的StatCounter資料更顯示Baidu市佔58.67%, Google市佔38.85% ... Yahoo看起來是躺平 (如下圖)



佔有中國這麼大市場的百度Baidu與谷歌Google剛好在前幾天都無獨有偶的發生了幾件大事:

百度首席營運官(COO)葉朋離職
百度被攻擊癱瘓
Google可能停止中國的運作
百度癱瘓擺逾 去年底twitter也遭同集團襲擊

葉朋雖然宣稱是個人因素離職, 但大多被解讀為百度將大幅調整營運策略, 而這個調整當然就是要針對Google而來, 不把Google趕出中國豈能鬆懈? 就在這麼緊張的混戰中 ... Hacker也來湊熱鬧了

我們來談談Baidu與Google先後被黑的過程及Google的心路歷程探討; Baidu被宣稱是「Iranian cyber army」的組織搞了一手移花接木; 而Google則是宣稱被某組織滲入民運人士的Gmail

百度被攻擊癱瘓, 主要是DNS(Domain Name Server)被挾持, 根據中國電子商務研究中心搜索引擎分析師卜梓琴全程跟蹤分析: (來源)
1、2010年1月12日上午約6點起,百度域名DNS伺服器被劫持更換,同時主域名已經被解析到一個荷蘭的IP;
  2、域名被更換後,訪問百度時頁面自動跳轉到一租用雅虎伺服器的空間;該IP的網站實際使用英文yahoo下的租用空間,因此訪問百度旗下網站時,會出現英文yahoo的出錯資訊頁面。
  3、由於頁面請求數量過於龐大導致雅虎伺服器癱瘓或者流量超限,伺服器癱瘓;
  4、伺服器癱瘓後,訪問百度的網民頁面自動跳轉到雅虎的提示頁面;
  5、在超限之前,部分網民伊朗網軍的駭客頁面,攻擊者在百度首頁自稱是Iranian Cyber Army的組織承認篡改了百度主頁,並留下阿拉伯文字;
  6、2010年1月12日上午,國內大部分城市用戶和海外用戶只能通過未被劫持的備用域名www.baidu.com.cn訪問;
  7、2010年1月12日上午近10點,百度相關人士出面表示,故障還在查,目前原因不知,此前均表示不知情或拒接電話;
  8、2010年1月12日上午約11點起,部分地區陸續恢復正常訪問;
  9、下午起,百度正在陸續恢復域名解析,所以也出現了各地逐漸恢復訪問的情況;
  10、根據解析速度,如不出意外,全世界將在48小時內全部恢復訪問。

分析師卜梓琴指出, 這次百度的安全事件顯示出百度並沒有充分的應變機制, 並且衝擊了所有網路的流量, 如騰訊、新浪預計流量將下降大約在5%左右, 而搜狐和網易預計流量將會下降10%左右, 並且網域名稱的安全性將再次被關注(不知Register.com是否會因這個事件而被求償?), 這篇"專家聊百度大面積故障實錄:企業應重視域名資產"則呼籲企業要重視域名資產

Baidu的這個事件應該會讓中國更體認「控制權」的重要性, 就因為Baidu.com不是掌握在自己手裡, 結果被玩出這場戲 ...

而Google的事件則是「控制權」過了頭 ... Google高級副總裁David Drummond在Google官方Blog發表文章表示由去月中旬, 他們偵測到一次來自中國、針對公司基礎架構發起的非常高技術、有針對性的攻擊, 有證據顯示黑客的主要目的, 是進入中國人權活動人士的Gmail帳戶 ... 而Google則很罕見的大喊不爽, 並不排除退出中國市場

這是許多關於Google可能退出市場的報導:

豁出去?!Google.cn搜到六四
雅虎公司聲援谷歌﹐譴責網絡攻擊行為
首家西方企業翻臉——Google向中國說不
谷歌遭遇網絡攻擊後引入新安全措施
谷歌聲明原文
Google’s China Stance: More about Business than Thwarting Evil
A new approach to China

Google會不會退出中國市場? 官方的說明中:
We have decided we are no longer willing to continue censoring our results on Google.cn, and so over the next few weeks we will be discussing with the Chinese government the basis on which we could operate an unfiltered search engine within the law, if at all. We recognize that this may well mean having to shut down Google.cn, and potentially our offices in China.

公司已經決定不願再對Google.cn上的搜索結果進行內容審查﹐因此﹐未來幾週﹐公司和中國政府將討論在什麼樣的基礎上我們能夠在法律框架內運營未經過濾的搜索引擎﹐如果確有這種可能。我們認識到﹐這很可能意味著公司將不得不關閉Google.cn﹐以及我們在中國的辦公室。

由Google在中國的市佔率逐漸起色及中國搜尋市場的成長, Google當然不願意就此放棄, 但是又不願意扮演審查衛兵的角色, 想必是身心煎熬... 但是Google會不會退出中國市場? 其實決定權不在Google, Google其實還是希望可以談, 但如果中國持續封鎖或要求審查Google相關內容, Google根本無法做生意

如果真的最後讓Google退出中國市場, 那麼將沒有任何阻礙Baidu的能量了, 中國的搜尋市場變成一家獨大, 其實對於中國互聯網的發展是很大的傷害, 這個傷害很可能會陸續感染到其他週邊的外國企業, 長期而言中國將是最大的受害者!

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月8日星期五

網路行銷 : Google Near Me Now


(Google的手機搜尋新功能:Near Me Now)

在前面文章"網路行銷的最後一哩 : Google Nexus One?"提到: 除了可以讓上網者更黏住網路之外, 還可以讓不上網的人也因為Nexus One而成為Google的目標; Google在手機推出的Google 「Near Me Now」, 或許可以翻譯成「目前離我最近的標的搜尋」或「最近搜尋」... 只要你使用手機的Google Search, 你就是他的行銷對象了...

這個最近搜尋可以依照類別來找到你要的商店(如下圖)


也可以用關鍵字來搜尋

我們都知道行銷有所謂的「最佳時機」, 也就在最恰當的時間去進行則可以收到最好的效果

而這個Near Me Now可以說是可以在「最佳時機」把行銷的訊息傳遞給消費者; 大家應該都是在需要尋找店家時才會去使用這類Near Me Now的服務

就好像如果你剛好在最餓而且想要去買東西時候, 看到讓人垂涎的食物廣告的話, 那麼這個廣告就可能發生效果; 如果你在沒有預算購買某個3C產品時, 看到讓你心動的3C產品廣告, 等到你真的可以購買時 ... 可能早就忘記那個廣告的內容

但是如何才能在這個Near Me Now出現我的商店訊息呢? 這就是我們之前所說的Local Search(在地搜尋), 在"SEO 關鍵解碼"書中也有說明如何才能在Local Search產生效果

如果Google把Nexus One、Local Search、Google Voice、Google Map ... 都整合在一起的話, 幾乎所有的商業活動都被包起來了, 想要過個沒有Google的日子 ... 可能越來越困難了!


標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月7日星期四

網路行銷的最後一哩 : Google Nexus One?



Google的手機Nexus One終於現身了, 也是Google想擺脫虛擬的一個重要里程, 透過這個Nexus One將可以玩太多策略, 網路行銷將會展現更多不同的面貌, 對於Microsoft、Apple、Yahoo等等而言, 2010將是一個苦戰的一年 ...

Nexus One由HTC擔任硬體設備製造, 並搭載Google Android 2.1 版本上市, 空機價 529 美元(約合新台幣 16,857 元), 即日起在美、英、新、港等四地區先開賣 (詳細規格可參考:Google Nexus one 美英新港首賣)

我們在"電子書與搜尋引擎行銷: eReader and SEM"曾經提過:
這個電子閱讀器就是跨越虛擬與實體分隔其中之一的設備, 當電子閱讀器可以閱讀電子書、當電子閱讀器可以上網、電子閱讀器可以當成導航、電子閱讀器可以用來通訊 ... 當這個設備變成真正的隨身行動設備, 如現在的手機一樣...就是虛擬與實體的分隔會越來越模糊的實現 ... 等到真正實現虛擬與實體無法分離, 行銷的last mile(最後一哩)就在每個人的手上, 要直通這個last mile的工具就是網路行銷, 就是SEM(搜尋引擎行銷)與SEO(搜尋引擎優化)等等這些手法發揮最大功效的時候

Google由Mobile Phone下手, 當然目的就在Social Media、Mobile Search、擴增實境(augmented reality, AR)... 等等, 這些除了可以讓上網者更黏住網路之外, 還可以讓不上網的人也因為Nexus One而成為Google的目標

Microsoft與Apple雖然有手機系統與硬體, 但是都沒能真正連接虛擬跟實體, 這次Google的Nexus One能否打下勝利的一仗呢? 還蠻值得期待的

而台灣行動上網的高收費真的是阻礙Mobile Service發展的一個殺手, 如果台灣各種上網的費率還是其他各國的數倍的話, 說實在很多網路創業家是很難玩出花樣的, 因為就算服務做出來了, 台灣根本沒有市場, 就只能往國外發展 ... 不過這個Nexus One的推出, 應會讓2010年成為Mobile Service更加蓬勃的一年, 也就是說如果你的網路行銷策略還沒想到Mobile這一塊的話, 是時候該思考了, 如果等一切都成熟就來不及了 ...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月31日星期四

Google 無法取得 Groovle 域名




Google提出域名仲裁, 認為Groovle與Google易造成混淆, 但經美國仲裁協會(National Arbitration Forum)裁定認為Google的說法沒有根據, 因此判定Google敗訴 ...

Groovle.com207 Media所有, 用來讓使用者可以在搜尋Google時使用不同的桌面圖案(skin), 並且他使用的是Google的Customer Search來套在他的服務上

這個判決顯然對於大公司是一個警訊, 因為域名爭議已經是就事論事, 不會只以大公司的利益為考量

根據"Groovle Beats Google In Domain Battle With Groovy Defense", Google在七月間才寫了信給Groovle (Groovle.com自2007年已經就運作), 但是Groovle認為該字來自「Groovy」及「Groove」, 跟Google完全無關, 雖然使用Google Search, 但是已經在頁面上盡可能讓使用者不要混淆 ...

判決結果:
Respondent contends that its domain name is sufficiently differentiated from Complainant’s GOOGLE mark. Respondent argues that the disputed domain name is not a misspelling of Complainant’s mark; Respondent asserts that the disputed domain name contains the significant letters “r” and “v” which serve to distinguish the sound, appearance, meaning, and connotation of “groovle” from Complainant’s GOOGLE mark. Furthermore, Respondent contends that its alterations clearly transform the predominant word of the domain name to “groove” or “groovy,” not GOOGLE. Respondent contends that these alterations are sufficient to distinguish its domain name from Complainant’s GOOGLE mark. The Panel agrees and finds that Respondent’s domain name is not confusingly similar to Complainant’s GOOGLE mark under Policy ¶ 4(a)(i). See Google, Inc. v. Wolfe, FA 275419 (Nat. Arb. Forum July 18, 2004) (“The domain name is not confusingly similar to Complainant’s GOOGLE mark. The dissimilar letters in the domain name are sufficiently different to make it distinguishable from Complainant’s mark because the domain name creates an entirely new word and conveys an entirely singular meaning from the mark.”).
也就是「Groovy」及「Groove」這個說詞贏得了這個官司, 並被認為沒有引起混淆之慮

照理說, 如果Google認為Groovle使用他的搜尋會引起混淆, 大可切斷Groovle來使用Google Search, 但是Google並沒有這樣做, 倒不是Google大人大量, 而是如果切斷Groovle的使用, 他們可能會轉向其他的搜尋引擎, 可能反而把流量拱手讓給別人

Groovle這個官司真的耍弄了Google一翻, 並且Google還不能做出任何制裁, 讓Google域名仲裁中少數敗訴的例子又增添了一例...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月16日星期三

FeedBurner 新功能 : Google 也開始提供 RSS 到 Twitter



Google在2009/12/14宣佈在FeedBurner也提供URL Shortener ( goo.gl ), 並且可以將RSS的資料丟到Twitter, Google為什麼要做這種大家已經早就在做的事情呢?

我們知道Bit.ly, Tinyurl, Doiop, ReadThisUrl, Memurl, DwarfURL, Buzzup, TweetBurner, URLshort, Adjix, Cli.gs, URLborg, idek.net, chilp.it, krz.ch, shortna.me, Digg, migre.me, short.ie, kl.am, rly.cc, dot.tk, trim.li, awe.sm ... 這些這麼多的所謂URL Shortener(網址縮短服務)... 簡直如過江之鯽, Google為何也要提供這個服務呢?

當然第一個原因是: Blog到Twitter的通道, 第二個原因是: Twitter內的URL可以被track

當使用FeedBurner把RSS丟到Twitter就出現如下圖的訊息



Google要將RSS丟到Twitter, 當然不可能使用其他人的URL Shortener, 並且他可以瞭解哪些tweet內的URL被點選, 這個跟我們之前"Real Time Search : 什麼是即時搜尋?"提到的:
既然是Real Time, 就無法就內容去一一篩選, 因此重點就放在Authority(權威度), 也就是就網站來說的「網站信賴度」, 也就是權威來源的內容只要含有關鍵字串就會出現在Real Time Search, 並且不會排序, 抓到就丟到搜尋結果
也就是如果Google能夠追蹤被點選的統計, 就可以當成Authority(權威度)的評估數據

所以Google的goo.gl跟「即時搜尋」的佈局是有相關的, 如果goo.gl能夠廣泛被使用, Google在social network與real time search可說又成功的達陣 ...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月11日星期五

Real Time Search : 什麼是即時搜尋?



現在的搜尋業者已經把戰場打到Real Time Search, 到底什麼是即時搜尋呢? 有人說Twitter SearchReal Time Search, 是這樣嗎?

Danny Sullivan的文章"What Is Real Time Search? Definitions & Players", 說:
For me, “real time search” means looking through material that literally is published in real time. In other words, material where there’s practically no delay between composition and publishing. You take a picture and seconds later, it’s posted to the world to see. You think of something, immediately tap it out on Twitter, and your tweet is shared almost as soon as you thought of it....That blog post or web page or news article took time to compose between the original thought and the actual publishing event. It didn’t go out in real time.

他認為Twitter之類訊息的search是real time search, 而Blog之類訊息的search就不是real time search, 因為Blog的內容需要時間去組成.... 筆者看得有點烏七八黑的臉上三條線 :(

Danny Sullivan雖然是UC Irvine畢業的, 但可能不是技術背景出身的吧! 還是他是為了用白話來解釋給普羅大眾瞭解, 才會如此解釋呢? 還是可能筆者沒閱讀清楚而會錯意呢? 還請先進們指正囉!

根據Wikipedia的定義:
A problem created by the rapid pace and huge volume of information created by real-time Web technologies and practices is finding relevant information. One approach, known as real-time search, is the concept of searching for and finding information online as it is produced. Advancements in web search technology coupled with growing use of social media enable online activities to be queried as they occur. A traditional web search crawls and indexes web pages periodically, returning results based on relevance to the search query.

這個定義才算是說出了Real Time Search, 經過搜尋引擎抓取回資料中心、建立索引然後呈現的搜尋就不是Real Time Search

也就是說「沒有抓取/索引」下的搜尋就是Real Time Search

所以不是Twitter Search是Real Time Search, 而是因為大多去Search Twitter都是「沒有抓取/索引」的動作, 不是說所有去搜尋MicroBloggin都一定是Real Time Search

那麼問題來了...「沒有抓取/索引」如何去搜尋呢? 抓到資料的相關性(Relevance)如何呢? Google說他們有一套類似PageRank的演算機制來控制Real Time Search的品質

有無聽出弦外之音呢? 既然是Real Time, 就無法就內容去一一篩選, 因此重點就放在Authority(權威度), 也就是就網站來說的「網站信賴度」, 也就是權威來源的內容只要含有關鍵字串就會出現在Real Time Search, 並且不會排序, 抓到就丟到搜尋結果

Google、Bing跟Yahoo都加入Real Time Search的戰局, Google/Bing透過Twitter的Firehose, 而Yahoo透過Twitter API (目前看到的訊息是如此, 若有變更再另外更新)

到底最後的這場即時搜尋戰爭結果會如何? 就密切觀察了 ...

相關資料
Relevance meets the real-time web
Google launches real-time search
Yahoo joins the real-time search parade

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月8日星期二

「個人化搜尋」與「搜尋引擎優化」: Personalized Search and SEO



我們在"Personal search is coming : 個人化搜尋將全盤改變SEO", 及"Google Personalized Search : 個人化搜尋中文界面問世", 談過很多次了, 搜尋引擎的「個人化搜尋」發展將讓「搜尋引擎優化」的作業必須完全的改變, 否則將無法發揮效果 ...

原本Google的「個人化搜尋」只有在登入Google帳號才會啟用, 但是現在你沒有登入帳號可能也會影響

如上圖, 當你沒有登入Google帳號而進行Google Search時, 你可以點選右上方的「網頁記錄」去看是「啟用」或「停用」個人化搜尋

Google關於這個功能的說明影片如下



現在各種搜尋引擎幾乎都很注意「使用者經驗」, 不管是Google,Yahoo,Bing都提供許多個人化選項, 這個都只是「界面的個人化」, 現在已經是開始「資料的個人化」, 也就是你看到的資料跟我看到的資料可能是不同的

「個人化搜尋」的結果讓傳統SERP的效果已經被稀釋, 因此把焦點放在SERP是沒有意義的

我們在"搜尋行銷與關鍵字 : 由Ask.com的統計談起"說只注意SERP而沒有流量是無意義的, 只注意主關鍵字而忽略長尾關鍵字也是無意義的....所有的重點就是說:

搜尋引擎優化的目的不能只注意SERP而忘記流量及使用者, 只做給搜尋引擎看而忘記使用者, 是捨本逐末的事情

如果大家還在強調哪些關鍵字排在第一頁或第一名, 而無法讓流量真正提升, 以及真正反應到銷售的話, 這種「搜尋引擎優化」或「搜尋引擎行銷」只是在消耗你的預算而已 ...

後記: 2009/12/14

自從各搜尋引擎推出各種「個人化搜尋」的功能之後, 在網路上引起許多人在討論會如何影響SEO

這篇文章Can SEO Exist Beyond Google Personalization?有許多觀點

其中說到"Why Personalization DOES Impact SEO", 共有21點說明「會影響SEO」
• If everyone sees different SERPs based on their searching patterns, how can you measure a consistent ranking? How can you reach an audience if their search queries are already *rigged* to show your competitor's brand?

• On page optimization and link building will no longer have as much influence on your site's rank for competitive search queries.

• Clients who opt-in to personalization and visit their own sites may have a false impression that their sites are ranking well in the SERPs and cease or refuse SEO services.

• Clients who opt-in to personalization and visit their competitor's sites may have a false impression that their sites AREN'T ranking well in the SERPs and blame their SEO.

• Companies / brands with more traffic have a better chance to gain new business because searchers will see more impressions of snippets to their sites. This creates branding opportunities via snippets.

• Webmasters will start optimizing more for other search engines like Bing where they can have more of an impact on organic results.

• It will become even more difficult to rank for generic keywords and search phrases (as larger brands will tend to dominate based on market search share), meaning long tail search queries will become much more important in an SEO campaign.

• Search spam should start to be filtered out as very few people will be revisiting spammy pages. That should eventually push more relevant, naturally optimized pages higher up the SERPs, particularly those in competitive industries.

• Fresh content will give sites an advantage because new pages are more likely to stand out to searchers in personalized SERPs. Same goes for real-time content generated by Twitter, Facebook etc. Static sites are going to fall to oblivion.

• Audience targeting and snippet relevancy will become more important when optimizing web pages.

• PPC ads will have to try harder to compete with increasingly brand-biased SERPs.

• PPC will become more popular as people find organic SEO too complex and abandon it.

• Personalization should help normally lower ranked sites to get to the top a little faster via loyal customers and visitors.

• Titles, META descriptions and text snippet optimization will become SEO priorities.

• Top SERP performers will fall down the ranks if their snippets and offerings are not competitive enough, allowing lower ranked sites to take over.

• Manually checking your site rankings, or those of your clients with personalization switched on will result in skewed, inaccurate SERPs.

• Rank checking tools like WebPosition will no longer be accurate. Clients will stop asking for ranking reports (hooray!).

• Some think that Google could be using personalization to monitor user-driven search in order to tweak the PageRank algorithm based on what users actually search for.

• Brand new sites targeting competitive search queries have very little chance of appearing in SERPs customized by personalization, even with SEO.

• If you don't rank well now for your target search queries, you might slip further and further off the radar as searchers refine their SERPs by clicking on the higher ranked sites.

• If clicking on SERPs begins to impact what users see, hackers may develop malware etc. that automates SERP clicking.

其中說到"Why Personalization DOESN'T Impact SEO", 共有5點說明「不會影響SEO」
• Personalization has been in place for some time already - since 2005 in fact.

• The main Google PageRank algorithm still applies, it's just the delivery of the results that has changed.

• Any SERP emphasis is user-driven rather than algorithm driven and personalization changes only relate to search queries closely aligned to your web history.

• Most non-personalized SERPs are not identical these days anyway. There is evidence of changes even based on the same search query on same PC in the same location a few minutes apart. Different datacenters and Everflux between them mean consistently shifting SERPs.

• SEO isn't just about SERP ranking. Think usability, keyword selection, conversion design, branding, social media, online reputation management etc.

應該很明顯到底「個人化搜尋」會不會影響「搜尋引擎優化」的操作 ...

SEORoundTable的文章"SEOs Freak Out: Google To Personalize All Search Results"更指出:
Most people had no idea how to even log into Google. Now, Google is personalizing results by default and these same people will have no idea how to turn off personalization.">Most people had no idea how to even log into Google. Now, Google is personalizing results by default and these same people will have no idea how to turn off personalization.
以前許多人可能不會搜尋時登入Google...但現在很多人是不知如何取消「個人化搜尋」的選項 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月3日星期四

Google Caffeine 已經逐步上線測試


Matt Cutts在他的部落格說Google Caffeine將在過完耶誕節後於明年全部上線, 目前釋出其中一個IP ...

根據"Google Caffeine Now Live On One Google Data Center", 209.85.225.103已經是Google Caffeine的架構, 但是這個資料尚不是100%的連接到最新indexing

Matt Cutts說:
My plane landed and I had time to check. 209.85.225.103 as an IP address currently hits the Caffeine data center about 50% of the time, so that's probably what the person at DP was seeing.
I think it's really risky to take a few threads and turn that into a "major Google update.".... So 209.85.225.103 does hit the Caffeine data center more often than other IP addresses, but it's always been the plan that Caffeine would roll out at one data center (no more data centers will get Caffeine until at least January).
But I would avoid generalizing, at least as going by the one report that mentioned a specific site that I looked into. Of course, on a lot of the webmaster forums you can't tell what site they're talking about, so it's hard to do any debugging on what might have happened to individual sites there.

Google Caffeine到底會有哪些變動? Google能否藉由Caffeine提供更精準的搜尋? 還是只是效能上的提升? 明年就可以揭開謎底了...

相關閱讀: Caffeine : Google 搜尋即將使用更新架構

標籤:

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月27日星期五

Google 該不該為搜尋結果道歉?



最近Google牽扯上了種族歧視的問題, 因為在Google透過搜尋美國總統第一夫人, 結果出現了Michelle Obama變成了Ape(猩猩)的照片, 引起美國輿論嘩然, 認為Google挑起種族歧視 ...

這張不當的照片就不貼上了, 相關報導出現在許多媒體上, 也許你可以找到 ...

CNN:
"Google apologizes for results of 'Michelle Obama' image search"

ABC:
"Google Explains Offensive Michelle Obama Image in Search Results"

Search Engine Roundtable:
"First Google Image Result for Michelle Obama Pure Racist"

CBS:
"Google: Michelle Obama Pic Not Our Fault"

中時:
"歐巴馬夫人變猴臉 Google道歉卻不刪"

原本Google知道搜尋結果有不當畫面時有刪除圖片, 但是後來又恢復圖片(似乎只是不在第一頁?), 但是Google在搜尋結果上有內容連結到說明, 處理方式是對於搜尋結果道歉, 但是解釋Google並無法對於搜尋結果負責

其實Google根本無需做出任何道歉, 但是因為「種族歧視」實在是太大的一頂帽子, 而且又跟美國第一夫人有關, 因此不得不做出回應

如果Google需要對於搜尋結果不當而道歉的話, 那大概搜尋引擎需要天天道歉了...

另外值得探討的問題是: 為什麼這張照片會出現在第一頁? Google演算法出問題了嗎? 顯然是利用SEO技術讓這張不雅照片與「Michelle Obama」變成關聯, 這是Google Bomb的又一個代表作

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月21日星期六

Yebol 搜尋結果第一名 !?



先前文章"Yebol 與 Wowd 兩個近日推出的搜尋引擎"才剛介紹完Yebol, 閒來沒事試用來搜尋看看, 竟然出現上面的問題 ... 以「搜尋引擎行銷」搜尋, 排名第一名的文字部分是本站的內容, 但是連結卻連到美國的國會圖書館去 ...

實在百思不解, 本站的網頁跟美國國會圖書館的內容有何關係? 會造成Yebol把兩者串在一起呢?

除了「搜尋引擎行銷」搜尋之外, 連「搜尋引擎優化」搜尋也發生同樣的狀況



這些錯誤是使用搜尋引擎以來, 所看到最離譜的錯誤, 希望只出現在Yebol Beta版本, 正式版應該會更正吧?

相對於Yebol這個錯誤, 雖然Bing與Google沒有類似問題, 但是其搜尋結果也是讓許多人失望

如"Bing, Bang, Boom"這篇文章, 就有Bing與Google正反面的看法
Bing is not only more accurate, but more intelligent in its returns, declares Larry Monuteaux, network services administrator for Boston Properties. "While Google seems to give more results overall, Bing gives more directed, relevant results," he says. "After a while, I set Bing as my default and haven't looked back."
(有人認為Bing的搜尋結果比較準確)

Mark O'Brien, chief technologist for SpectraRep LLC, says that after comparing Bing and Google, Google still returns more accurate results for him. To better test this theory, he uses Google at work and Bing at home. "Many times at home I have to re-run the Bing search on Google to get usable information," says O'Brien.
(也有人認為Google的搜尋結果比較準確)

英文的搜尋不夠準確, 更別說是中文搜尋了, 關於更多Bing與Google的比較及相關內容, 我們另文再談了...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月18日星期三

Google Image Swirl : 關聯性圖案搜尋



Google的Image Swirl推出實驗版, 功能很類似Google Wonder Wheel 搜尋羅盤, 只不過是使用在圖形的搜尋, 這個圖形搜尋的內容如果跟Bing相互比較一下, 還真的蠻有趣的 ...

以下是Google Image Swirl以Taiwan搜尋的內容





以下是Bing以Taiwan搜尋的內容



有無發現第一層的資料還幾乎雷同, 目前的資料深度比較, Google還比Bing遜色一些, 精準度則是互有上下

這些圖形資料的分群或類似的比較, 大抵由幾個資料而來 : (1)檔案名稱 (2)圖案所在的文字敘述 (3)圖案的meta data(4)圖案的像素比對, 所以大量的資料中還是偶爾會發現完全不相干的資料出現

Google產品經理Aparna Chennapragada敘述說:
"It's not just the face, the color, the visual features of the images; we look inside the image and ask how they relate to each other on a pixel level."
所以Bing與Google最後圖案搜尋的決戰就在Pixel Level

從文字類的資料來分析, Bing與Google大概不分上下, 但是透過Pixel Level的分析, Bing其實是略佔上風, 而且Bing已經完全產品化, 但Google還剛從實驗室畢業, 不過Google的Swirl的界面比Bing較為直覺式, 是Bing應該更強化的地方

所以近來Google的Fast Flip news search, Google Squared, Google Image Swirl跟Bing的Visual Search, Bing Image Search都陸續開打, 資料視覺化顯然是文字搜尋之外很大的市場

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google Wonder Wheel 搜尋羅盤



在之前文章"什麼是Google Wonder Wheel?"提過這個, 當時翻譯成「摩天輪」, 現在Google定名為「搜尋羅盤」, 他是Google Search Options(搜尋選項)中的一個功能 ...

在Google Search Options(搜尋選項)中的功能以前也提過, 當你點選顯示選項就會出現 (如下圖)



你可以有下列功能:

(1)選擇特定類型的搜尋結果(如影片/新聞/網誌/論壇)
(2)選擇特定時間的搜尋結果, 但是特定時間還是有限制(如無法搜最近5小時), 但你可以參考Google搜尋工具
(3)篩選已經瀏覽或未瀏覽的搜尋結果
(4)使用搜尋羅盤、圖文並茂、更多敘述來顯示搜尋結果

以下是圖文並茂的搜尋結果


以下是更多敘述的搜尋結果


其中比較值得提的是「搜尋羅盤」, 因為「搜尋羅盤」的相關詞的正確與否影響搜尋品質最大, 目前看起來Google「搜尋羅盤」的中文的相關性還是有些問題, 並不能真正解析出相關詞

如下圖以Kartoo來搜尋, 英文界面還可以正確顯示相關資料, 但中文界面就還不能



但是不管如何, 這總是Google邁向更語意化(semantic)的開始, 以Google的動作來看, 應該在明年內會更加完備...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月10日星期二

Rupert Murdoch 考慮將封鎖 Google



媒體大亨梅鐸(Rupert Murdoch)是News Corporation的主席, 對於長期因為Google、Microsoft...等搜尋引擎免費使用其旗下的新聞內容, 在接受訪談時表示考慮將封鎖Google ...

梅鐸在週末接受也是旗下的Sky News訪問, 表示考慮將封鎖Google, 因為讀者可以未經訂閱而閱讀原本需訂閱的新聞, 在這篇"Rupert Murdoch could ban Google access to his newspapers' content"中顯示:
“I think we will [remove our websites from Google’s search index] but that’s when we start charging,” he said....

也就是說他會封鎖Google, 封鎖後就會開始對內容收費

根據這篇文章"Murdoch to Google: Drop Dead", WSJ.com的流量中有25%來自Google, WSJ.com也是News Corporation旗下的公司, 如果封鎖Google的話, 等於自廢武功丟棄25%的流量

內容是否需要收費? 似乎是沒有正確答案的問題, 不收費的話, 廣告收入無法支撐營運, 收費的話, 閱讀量勢必驟降, 在這個年代想要由內容收費, 除非內容真的具備「獨特性」, 否則大多會以失敗收場, 就算具備「獨特性」, 還必須考慮是否有「可取代性」與「迫切性」

如果Rupert Murdoch最後真的封鎖Google, 那麼真的是一場世紀豪賭, 最後結果會是如何呢? 就慢慢觀賞了 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月9日星期一

Google Commerce Search



Google在2009/11/4宣佈推出Google Commerce Search, 可以義譯為「網路購物搜尋服務」, 這個一般的搜尋有啥不同? 這個服務可以做到什麼地步呢?

Google的官方網站的功能展示如下



也就是讓網購業者可以把產品資料上傳給Google,並且自己定義頁面及搜尋功能,藉以提高購物的達成率

根據Google的說法:
Visitors spend an average of just eight seconds before deciding whether or not to remain on a website, so having a good search tool is important for turning visitors into buyers.
消費者平均在8秒鐘就決定了停留與否, 因此讓消費者很快的找到產品就可以增加銷售

這些搜尋的功能可以由Google Store大略瞭解這個Google Commerce Search的樣貌

這個Google Commerce Search跟Google Customer Search有些類似, 不同的是Google Commerce Search必須由網站另外提供資料定義, 並且需額外付費每年五萬美金, 兩者都是由Google的Cloud Services來運作,
The pricing model for Google Commerce Search is based on the number of products/items (SKUs) in your data feed and the number of search queries entered on your site each year. Pricing starts at $50,000 per year.

每年五萬美金? 對於網購大站來說, 自己應該都有能力建立類似的搜尋, 對於網購小站來說, 根本付不起每年五萬美金

況且這個Google Commerce Search是當消費者到達該網購網站才開始運作, 如果一般搜尋無法把流量導過來, Google Commerce Search就無用武之地

但是如果Google Commerce Search除了原本的功能之外, 還能夠以商場型態集合所有產品, 並且利用這些資料來提高Google一般搜尋的垂直搜尋效能(也就是透過Google Search可以較快搜尋到使用Google Commerce Search的產品), 或是加入到Google Product Search中, 那麼整個狀況可能就又完全不同了, 但是目前似乎看不出來有這樣的描述

另外, 提供更精準的產品資料給Google還要付每年五萬美金? 應該這個服務後續還會有許多修正吧!

參考資料:
Google Launches Commerce Search for Retailers
Google Launches Commerce Search to Boost Your Conversion Rates
Google Commerce Search – a Critique
Google Commerce Search DataSheet

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年10月30日星期五

Eric Schmidt : What the Web will look like in five years?



在上週的Gartner Symposium/ITxpo Orlando 2009, Google CEO Eric Schmidt描述五年後的網路

Eric Schmidt認為以下是五年後的網路趨勢:
(1)Five years from now the internet will be dominated by Chinese-language content.
五年後中文內容將主導網路內容

(2)Today's teenagers are the model of how the web will work in five years - they jump from app to app to app seamlessly.
現今青少年如何使用網路將是未來五年內的模式

(3)Five years is a factor of ten in Moore's Law, meaning that computers will be capable of far more by that time than they are today.
五年後電腦的能力將遠超過目前所看到的電腦樣子

(4)Within five years there will be broadband well above 100MB in performance - and distribution distinctions between TV, radio and the web will go away.
將會出現超過100MB的頻寬, 影音媒體與網路將沒有界線

(5)"We're starting to make signifigant money off of Youtube", content will move towards more video.
Google將投注更多在YouTube上

(6)"Real time information is just as valuable as all the other information, we want it included in our search results."
即時搜尋將被包含在一般搜尋內

(7)There are many companies beyond Twitter and Facebook doing real time.
會出現更多的即時搜尋應用

(8)"We can index real-time info now - but how do we rank it?"
除了索引即時內容外, 如何評等這些內容是必須解決的問題

(9)It's because of this fundamental shift towards user-generated information that people will listen more to other people than to traditional sources. Learning how to rank that "is the great challenge of the age." Schmidt believes Google can solve that problem.
網路更加走向使用者產生的內容, Google一定可以處理來評等這些內容

以上僅就意思翻譯, 如果有翻譯不妥, 還請見諒

上面Eric的意思大概有幾個重點: 中文內容、使用者的即時內容、使用者行為模式、上網的便利性與多樣性

如果各位有在特別注意, 應該會發現Google的搜尋內容中, 簡體中文內容比以往更多了, 當你輸入一個中文關鍵字, 如果不特別選定繁體中文, 常常出現在前幾頁的內容都是簡體中文, 這種情況大概會越來越嚴重, 也就是說未來你大概會被迫不得不開始閱讀簡體中文

使用者的即時內容則在Bing與Google開始把Twitter與Facebook等內容納入後, 真正開始即時的大戰, 相關訊息在"Bing 開始提供 Twitter 即時搜尋", "Google Social Search", 目前還看不出來誰能夠真正主導即時內容

而使用者行為模式、上網的便利性與多樣性...更是可能讓網路呈現各種可能, 如我們在2007年所說的"Internet大破譯(六): 未來網路趨勢", 虛虛實實的境界即將產生, 並且在未來五年內, 新的霸主會慢慢浮出抬面, 到底還是Google跟Microsoft嗎? 還是Twitter、Facebook? 還是另外一個全新的服務? 真的沒有人能夠說得準 ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月25日星期五

Yahoo New Search 與 Google SideWiki


Yahoo推出新的搜尋界面了, Google也推出了SideWiki, 這兩個新聞本身沒啥單獨播報的價值, 但是兩個手牽手的出來, 就有點意思了 ...

在2009/09/22, Yahoo推出了新的搜尋界面, PCMagazine這篇"Hands On with Yahoo's New Search Result Page"介紹了改變的樣貌

整個新的Yahoo Search其實感覺不到有什麼創新, 跟Google、Bing也沒有太大的差異, 但是當進入後出現了以下的畫面...詢問你是否允許Gears來存取資料(如下圖)



怎麼會出現Google Gears呢? 這個Google Gears是Google的Open Source專案, Yahoo的說明是:
Search Pad is a note-taking application that automatically tracks and organizes sites you find on Yahoo! Search to help you complete important tasks such as buying a car or planning a trip.
也就是利用Google Gears來把網頁當筆記本, 把網頁的瀏覽當成一個剪報資料, 而且讓你可以做筆記

註:相關訊息補充在後記

在2009/09/23, Google也推出了SideWiki, 可以讓你安裝plug-in後, 可以針對網頁發表意見, 而且是針對Public, 也就是別人也看得到

真是眼花撩亂了, Google SearchWiki也可以對網頁發表意見, 但是只限本身或分享的對象, 而Google SideWiki可以針對公眾, Yahoo的Google Gears可以把網頁當剪報資料加上筆記, 但只有存在local PC

為啥搞得這麼複雜? 怎麼不整合成一個東西? Yahoo推出新東西之後, 為啥Google隔天也推出新東西? 而且Yahoo還使用Google的Gears?

仔細分析起來還真的蠻好笑的, Google真的是滿手好牌, 以大老二來說, 只要其他業者出個Ace, Google就拿出老二來壓, 你有幾張Ace, Google就有幾張老二 ...

而Yahoo呢? 不是已經跟Microsoft合作, 怎麼還改Search界面? 如果說是為了以後新合作的front-end界面做準備, Microsoft怎麼可能會用Google Gears? 把Microsoft殺了也不可能

所以Yahoo的新搜尋界面, 未必是為了Microsoft-Yahoo Deal, Yahoo想告訴Microsoft跟大眾什麼訊息呢?

真是商場如戰場, 外行看熱鬧, 內行看門道 ...

2009/09/28後記:

為了忠實保留資料, 所有的修正只是標上刪除線, 而不直接修掉

話說造成錯誤判斷的原因為Chrome Browser, 起因為國外的文章也在探討Yahoo!Search Pad怎麼會出現Gears的視窗? 結果用Chrome去開啟http://search.yahoo.com, 確實出現Gears, 但是確忽略了Browser的問題

我們把Yahoo!Search Pad使用各Browser的技術相關訊息整理如下:

(1)Firefox 3.5, Safari 4, IE8: HTML5 localStorage
(2)Firefox 2.x and 3.0: Gecko globalStorage
(3)Safari 3.1 & 3.2: HTML5 Database Storage
(4)IE6, IE7: userData persistence
(5)Google Chrome: Gears Database API

所以在不同的Browser使用的儲存方式是使用不同的技術(如有錯誤,歡迎指正...漏氣求進步吧)

其實這些都不是本文的重點, 就是因為當時認為不是重點而未加深究, 本文的重點在請教各位的想法: Yahoo與Microsoft合作後, 會放棄Search嗎? Who knows?

所以也不是如讀者說的:本文在散佈陰謀論 .... 哈! 這使我笑好久, 本站還沒到那個等級啦

p.s. 筆者不是政治人物, 所以不會因為承認錯而丟臉的問題, 大家把問題看得太嚴重了!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月22日星期二

SEO Tips : Google 根本不理會 Keywords Meta Tag



昨天2009/09/21在Google的部落格有則訊息, 大概會讓許多專搞「搜尋引擎優化結構」的人想要翻桌子, 為什麼呢? 因為Matt Cutts很直接了當的說: Google已經好幾年不理會Keywords這個meta tag了 ....

先看看這個影片:



Matt Cutts很清楚的說明了: Google根本不使用keywords meta tag, 因為太多造假與太多糾紛, 因此也許其他搜尋業者還在使用, 但是Google不理會keyword這個meta tag資料

我們之前在"Macro SEO"文章中也指出: 不要陷入HTML結構的泥淖, 否則你會忘記更重要的事情, 才剛在2009/09/09發表Macro SEO的文章, 就在昨天就證實了這個觀點

當然我們早就在2008年指出的"SEO五大要素"中認為網站結構只是其一要素, 而HTML結構更只是網站結構之一部分, 我們在"SEO白癡手冊"中也指出關鍵字主要表現在Title上及semantic html上 ... Google昨天的說明真的打了許多人一個大巴掌

如果認為HTML結構是「搜尋引擎優化」的重點的話, 那其實不需要太多專家, 只需要一個自動化的軟體, 或者一個接受HTML語法訓練的國中生, 都能勝任「搜尋引擎優化」的工作 ...

並非說不必理會HTML結構, 當然也需要注意, 但是那個只是非常初階的門檻, 如果一本「搜尋引擎優化」的書籍或者一門「搜尋引擎優化」的課程都在強調這些枝微末節, 應該只能當做「SEO的HTML參考手冊」與「HTML訓練課程」

學習搜尋引擎優化應該全面的由「網站優化CLOUDS」與全面的「搜尋引擎行銷」建立整體概念, 而非一味的注意關鍵字比例、與無意義的塞入關鍵字 ...

參考資料:
Google does not use the keywords meta tag in web ranking
Google Asserts That Keyword Meta Tags are NOT Used in Rankings

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月18日星期五

SEO 工具 : 讓Google搜尋更便利



Google搜尋引擎除了預設的搜尋之外, 你可以去選擇搜尋資料的時間範圍(如過去24小時內、一周內、一個月內、一年內), 這個貼心的設計可以取得時間範圍內最新的資料, 而不需要在舊資料中打滾, 但是 ... 如果你希望時間範圍是10分鐘內、12小時內、10天內 ... 那怎麼辦呢? 這篇文章告訴你如何任意設定你的時間範圍 ...

Google只提供如下的時間範圍


但是在某些情況下, 你需要的是30分鐘內、甚至5分鐘內的資料, 例如H1N1疫情, 我們可能需要知道最新的案例報告

在SEO的資料分析中, 我們也可能需要知道某個關鍵字在最近1個小時內是否有相關頁面, 這個資料量的頻率可能就是分析的重要參考, 例如某個關鍵字在30分鐘內一直增加, 大概這個關鍵字就是大家討論的焦點

這個Google搜尋工具就提供了「任意設定時間範圍的功能」, 如下圖:


上面出現了原本沒有的「10分鐘內」的範圍 ... 真是太神奇了吧!

你只需要選擇你所需要的minute/hour/day/week/month/year(如下圖), 再輸入你想搜尋的關鍵字, 就可以把Google Search變成分析資料的利器了!!



現在就開始使用這個更豐富的Google搜尋工具吧 ... 如果好用的話, 記得設成我的最愛喔! 並請大家多多使用這個SEO工具囉!!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月17日星期四

Google 收購 reCAPTCHA



Google收購了reCAPTCHA, 一家由卡內基美隆大學延伸出來的公司, 專門研究文字與圖形轉換的技術並提供安全檢查碼免費服務, Google買下這家公司能夠拿來幹什麼事情?

許多人應該在網路上輸入資料時, 常會看到如下的圖案:



這個圖案式的文字主要是確定操作輸入的是「人」而不是「自動程式」

這個圖案就是所謂的CAPTCHA, 也可說是安全檢查碼, 英文是「Completely Automated Public Turing test to tell Computers and Humans Apart」, 直接翻譯的意思是「全自動區分電腦和人類的圖靈測試」

圖靈測試(Turing test)是一種測試電腦是否具備人類智能的方法, 其來源應該是Turing Machine, 就是在1936年由Alan Turing設計出來的概念, 可以摹擬任何的電腦演算法

所以Google買下這個技術做什麼呢? 根據"Teaching computers to read: Google acquires reCAPTCHA"的說法是: 可以自動的將掃瞄文字準確的還原為純文字, 應用在Google BooksGoogle News Archive Search

也就是紙類的印刷文字將可以更精準的變成Google的資料, 除了這個呢?

既然可以把紙類的印刷文字還原成純文字, 就有可能也將網路上的影像檔文字(image text)抽取出來, 以reCAPTCHA具備比Optical Character Recognition (OCR)更準確的情況來看, Google應該會開始處理影像檔文字, 也就是只要圖案內有可辨識的英文字, 都可能被抓取, 當然處理中文字的困難是更高的, 所以短期內影像檔中文字是無法處理(當然一般掃瞄書籍出來的中文字是可以處理的)

如此一來, 就英文來說, 影像檔就可以多出更多的meta data, Flash檔案中的圖檔物件的文字都可以順利處理了, 這個發展讓Google又多了一項有力的武器, 當然reCAPTCHA還可以把處理後的資料以聲音唸出來, 這個應用也許以後也會陸續出現 ...

參考網站: reCAPTCHA

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月7日星期一

搜尋引擎最佳化與隱性語意: SEO and Latent Semantic



上篇文章談到Latent Semantic Analysis, 指出目前Latent Semantic尚未有大規模的影響, 但是影響已經逐步會顯示出來, 我們利用實際例子來看看到底可能有什麼影響?

有老外的文章舉了例子, 然後最後的結論是Google也沒有Latent Semantic的應用, 他的說法是:

在Google Search上, Results about 825,000,000 for car, Results about 99,600,000 for automobile, 因為automobile查詢中沒有包括car的資料, 所以Google沒有使用Latent Semantic技術

這個分析可以說根本不科學, 使用者使用CAR去查詢, 未必想連AUTOMOBILE也一起查, 同樣的以AUTOMOBILE去查詢, 也未必想以CAR也一起查詢

比較能夠說服的說法是: 如果使用者想查與CAR的所有相關資料, 是否有界面可以讓使用者來利用呢?

很遺憾的是目前的搜尋引擎Google,Bing, Yahoo等, 對於中文的隱性語意是比較弱的, 因為還沒有完整的關聯字庫與演算法, 所得到的結果沒有英文來得好

但是我們來看以下的例子:

我們用Google Wonder Wheel來看, 以「搜尋引擎優化」與「搜尋引擎最佳化」來看, 如下:


以上的「搜尋引擎優化」與「搜尋引擎最佳化」已經可以透過「SEO」這個詞來串起來, 當時"SEO關鍵解碼"出版時, Google Wonder Wheel還沒有中文資料, 才幾個月的時間, Google中文語意資料庫已經逐步備齊了

所以類似的情況下, 未來的SERP未必會以keyword為主要依據, 很可能根本沒有出現keyword也可能因具備Latent Semantic(隱性語意)而出現在SERP中

我們再來看看英文Google的例子, 使用Tilde(流水符號)來查詢Google, 以「~mp3」來查詢, 發現「music」也被當成keyword(如下圖)



所以你認為Latent Semantic(隱性語意)是否已經在Google開始運作了呢? 答案當然是肯定的, 只是一般使用者還沒有察覺出來, 而Bing/Yahoo的英文也已經俱備相關詞的查詢(如下圖)

Yahoo的MP3查詢


Bing的MP3查詢


這些搜尋引擎對於Latent Semantic的準備工作已經逐步就位, 就等適當時機推出更符合人性的使用者界面

如果你認為那麼我在網頁利用關鍵字充塞(Keyword stuffing)來把所有相關的keyword都包含起來, 不就可以應付Latent Semantic的趨勢了嗎? 相關詞只是隱性語意的一部分, 後面再來談這個問題了 ...


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年8月13日星期四

SEM : Search Engine Performance Report 2009Q2



2009年第二季三大搜尋引擎(Google/Yahoo/Bing)的成績單揭曉了, eFrontier近日公佈了2008年Q2~2009年Q2的美國市場統計報告, 這個報告包括了市佔率、投資報酬率等多項指標分析

Google/Yahoo/Bing的Click Share於2009Q2各是: 71.6%, 24.3%, 4.1%
Google/Yahoo/Bing的Spend Share於2009Q2各是: 75%, 20.5%, 4.5%

整體美國2009年Q2的Spend比去年同期下跌21%, 但ROI(Return On Investment)上升29%, 也就是支出降低, 點擊成本亦降低

2009年Q2與去年同期相比, 就小廣告主來說, Spend降低幅度最大(-41%), 大型廣告主Spend降低22%, 但中型廣告主Spend卻上升5%, 小廣告主/中型廣告主/大型廣告主的ROI各是+20%/-12%/+35%

比較Google/Yahoo/Bing 2009Q2的ROI, 各是+43%/-8%/+24% (如下圖)


詳細資料請參考 eFrontier Search Engine Performance Report 2009Q2 (PDF檔案)

除了eFrontier的報告之外, Organic Inc.也公佈了Bing的ROI報告, 這個報告比較了Bing與先前的Microsoft Live Search, 發現在某些大型客戶的ROI提升了近23%

而在eFrontier的另外針對Bing的統計報告中, Bing的paid-click share在六月的兩週中提升13%, 到八月第一週則提升了44%

參考資料:
Organic Studies ROI of Paid Search for Bing Vs. Live Search
Study: Bing Shows Signs Of Positive ROI For Marketers
Study Shows ROI Improvements in Bing Over Live Search

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google Caffeine 與新一代 Google File System (GFS)



前文"Caffeine : Google 搜尋即將使用更新架構"提過, Caffeine Update主要在抓取、索引、評等三大更新, 而這個更新的最底層GFS (Google File System)就是此次更新最重要的元素

我們在"Google資料中心的秘密"提過Google與其他廠商的不同在於整體架構都是客製化, 包括了GFS/BigTable/MapReduce

以往單一的Master Node已經使用多年, 但是已經開始出現瓶頸, 現在這個Caffeine就是在Multiple Master Nodes新架構上

theRegister的文章"Google File System II: Dawn of the Multiplying Master Nodes"就指出:
The trouble - at least for applications that require low latency - is that there's only one master. "One GFS shortcoming that this immediately exposed had to do with the original single-master design," Quinlan says. "A single point of failure may not have been a disaster for batch-oriented applications, but it was certainly unacceptable for latency-sensitive applications, such as video serving."

也就是單一Master Node的設計已經不太符合即時快速的需求

theRegister文章也指出, 除了反應時間的問題外, 單一Master Node對於File Count也有限制:
The other issue is that Google's single master can handle only a limited number of files. The master node stores the metadata describing the files spread across the chunkservers, and that metadata can't be any larger than the master's memory. In other words, there's a finite number of files a master can accommodate.

透過分散式Master與分散式Slave, Master Node所能儲存的metadata就能無限制的增加, 並且透過將Chunks由64MB降低為1MB, 每個Slave Node儲存較小的檔案, 如此讓空間更精簡以因應未來十年的需求

那既然分散式Master比較優秀, 為何當時Google會決定單一Master呢? 負責GFS的總工程師Sean Quinlan表示, 因為單一Master對於設計上比較簡單:
The decision to go with a single master was actually one of the very first decisions, mostly just to simplify the overall design problem. That is, building a distributed master right from the outset was deemed too difficult and would take too much time. Also, by going with the single-master approach, the engineers were able to simplify a lot of problems. Having a central place to control replication and garbage collection and many other activities was definitely simpler than handling it all on a distributed basis. So the decision was made to centralize that in one machine.

所以本次Caffeine Update, 其實架構上的變化比資料上的變化更重要, 如果架構變成分散式Master Nodes成功, 那麼再來可以玩的就更多了, 資料量更大、相關度更高、評等參考資料更多 .... 接著資料的變化就會慢慢出來了

如果有興趣探討更多關於新一代GFS, 可以參考ACM的"GFS: Evolution on Fast-forward"

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年8月11日星期二

Caffeine : Google 搜尋即將使用更新架構


面對Microsoft與Yahoo的合作案, 跟Microsoft Bing的來勢洶洶, Google到底怕不怕? Google這幾天推出了最新的搜尋架構 (代號Caffeine), 顯然Google已經出手要打小孩囉 ...

這個代號為Caffeine的新架構, 其測試的網址為

http://www2.sandbox.google.com/
(P.S. 美國時間2009/8/13下午左右以上網址將暫停使用者測試)

這個新的搜尋更新了資料抓取(Crawling)、資料索引(Indexing)、及網頁評等(Ranking)的架構

這個搜尋到底跟舊的有何差異呢? 資料筆數有增有減, SERP的順序略有變動, SERP中的描述(Description)略有變動

雖然只是稍有增減或略有變動, 但是某些網頁可能在某些Query中會不見, 或排序變化

例如: EZTravel在「機票」查詢中已經不在SERP前三頁, 康健雜誌已出現在「減肥」查詢中(以上刪除,因查詢結果又有變動)

看起來似乎更注重整體內容與關鍵字的相關度及權威度,但是很可惜的是部分黑帽SEO的網站似乎仍舊可以利用漏洞來取得優勢

但目前該架構尚在接受各方意見修正中, 尚未能看出最後結果, 保持持續觀察了, 最後的結果將會牽動整個搜尋市場及Google是否能夠保持領先的關鍵, 因此這個更新可以說是Google很重要的一步 ...

後記:

為什麼Google的搜尋更新代號是Caffeine(咖啡因)? 大概跟Matt Cutts說過的一句話有關, 他說Coffee是"the magic get-work-done powder" (咖啡是讓工作完成的神奇粉末)

多少工程師必須熬夜把工作完成, 大概都少不了咖啡, 如果把Google每年的咖啡用量統計一下, 可能會是很驚人的數字, 所以可能這個因素, 就把next-generation infrastructure叫做Caffeine (純粹猜測)

Matt在他的"More info on the Caffeine Update"文章中戲稱, 如果一個Google工程師寫了一支程式, 這個程式在六個月後可能一半的程式碼都已經改寫了, 也就是一支程式在Google的壽命只有一年的時間, 過了一年後他的演算法就被大翻新了

2009/8/12後記:

Matt Cutts在WebProNews有個影片說明Caffeine Update...
Breaking News: Matt Cutts Explains Caffeine Update

哈哈...怎麼Matt Cutts也理個大光頭了, 看影片兩個大光頭真滑稽, 難道要變SEO大師都要理光頭!?

2009/08/13後記:

昨天有讀者反應, 似乎新的Google Search (Caffeine)沒有差異, 這個Facesaerch Caffeine Compare可以直接比較新舊搜尋的差別

大致上差別會表現在: 資料量, 反應時間, 網站描述, 排名 ..., 有些查詢沒有太大差異, 有些查詢就可能看出差異

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年7月21日星期二

Microsoft 與 Yahoo 聯合打擊 Google



Yahoo與Microsoft之間的合作案已經談很久了, 可說高潮迭起而最後破局, 但是他們同時面對的Google始終佔據大部份市場, 可以說是雙方最大的痛, 如果不聯合次要敵人來打擊主要敵人, 可說一點勝算都沒有, 從今年六月Microsoft Bing的成功提升市佔率後, 讓Microsoft又重新掌握了一個重要籌碼 ...

原本Microsoft打算以四百多億美金買下Yahoo, 這個主意也曾經讓Yahoo一度動心, 但是最後還是沒能達成協議

PC Magazine在這篇新聞"Icahn Wants Yahoo-Microsoft Deal"透露, Microsoft與Yahoo已經很可能協議出合作的策略來對抗Google

從AllthingsD這篇文章"Yahoo Search Ad Deal With Microsoft “Down to the Short Strokes”–But Caution Also Advised", 以及Tomshardware這篇"Yahoo and Microsoft to Sign Search/Ad Deal", Microsoft與Yahoo確實已經蠻可能會在近期達成合作協議, 但是最後還需要Antitrust Division(美國司法部反托拉斯署)的同意

目前由各項資料得知, Microsoft有意接手Yahoo的Search Engine Results ADs(也就是關鍵字廣告), 而Yahoo則可以得到大筆的資金, 但是最後的協議內容尚未完全定案

這個合作案的結果是否會影響搜尋引擎的生態與網站的行銷策略? 值得密切觀察了 ...

其他參考資料
Microsoft wants to purchase Yahoo (2008/2/1)
Microsoft's big bid for Yahoo (2008/5~2008/9)

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年7月1日星期三

Google Blogger 又出問題 .....

Google Blogger又出問題了, POST出問題、Title出問題 .... 解決中

Blogger出問題已經不是第一次 .... 真的Google已經out of control了嗎?

後記:

Blogger這次出的問題蠻扯的

(1)POST文章出現 bX- Error, 諸如 bX-1us3c3...然後就不能刊登文章
(2)在Title及meta上出現怪異的Javascript code, 莫名其妙插入了327583163-csitaillib.js

第一個不能刊登的問題, 解決方式是把Setting-->Formatting中Post Template內容先清空, 就能避開bX- Error .... 這個實在有點離譜

應該是某個programmer錯誤的使用了Post Template中的內容 ... 真是無言

第二個問題沒有完全的解法, 只能部分解決Title出現怪異的Javascript, 但是Browser還是會出現Error, 把</Blogger>拿到</Title>外部, 暫時使title出現正常的字串, 並將description的meta部分移除

這個部分更是離譜的錯誤, 應該是blogger程式某個tag沒有正常的close

以上的兩個離譜的錯誤, 讓許多Blogger都出現錯誤, 並且讓人浪費太多時間去debug, 這樣的品質怎麼做Cloud Computing? 更扯的是在Google Forum中沒有任何解答回應

如果企業許多東西都在其中.....後果真的蠻可怕的..............

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月24日星期三

Google : Lets make the web faster



Google在他的官網上說要讓Web更加快速, 當然這牽涉到太多因素, 除了ISP的連線品質、網站硬體效能、使用者環境...當然常被忽略的就是網站到底如何安排他的資訊 ....

Google要使Web更加快速, 就是建議網站提昇程式的效能、利用工具找出效能的漏洞...Google在Google Speed上提供了工具, Yahoo也有YSlow工具, 都是在協助網站調整效能

影響網站效能的最主要因素, 除了連線品質與流量壓力之外, 最重要的就是Code了

是否你的Javascript吃了太多資源? 是否能夠使用HTML 5的優勢?

除了Code之外, 就是網站所載入每個元素的大小了, 也就是顯示優化, 也是我們在「SEO 關鍵解碼」一書中, 把顯示優化列在網站優化之中的原因了

如果從連線品質、流量壓力、Code優化、到顯示優化都能特別注意, 那麼增加了使用者滿意度後, 就可以連帶的達成網站的目的了 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月18日星期四

Google 氣炸了...推出Explore Google Search

近幾週Bing的後勢看漲, 被許多使用者讚賞, Google看在眼裡真的是吃味十足, 因為Bing被稱讚的功能都是Google早就提供的, 就好像放牛班的學生突然考上大學, 突然吸引許多關愛的眼神, 反而考上台大的被晾在一邊 ...


如上圖, 英文界面中的"Discovering the web:Explore the World of Google Search"...就在提醒大家......喂, 我這裡都有耶!!

由於ComScore的資料, Bing連兩週連續漲勢, 穿透率已經到16.7%(如下圖), 雖然還離Google有段距離, 但是已經讓Google頻頻往後頭瞧....這小子是否吃錯藥了? 還是打了類固醇? 不怕跑歪腰喔!?



在Google的Explore Google Search中, 其實不是新東西(如下)


當你打入Yankees, 就會顯示洋基最新的比數統計(如下)


如果你用中文搜尋, 也可以看到同樣的效果(如下)


Google到底在怕什麼? 因為常期以來, Google沒有對消費者市場做行銷, 很少敲鑼打鼓告訴使用者有哪些新功能, 通常都是用了以後, 才突然發現...嗯, 又不一樣了!

所以面對於微軟砸大錢來行銷Bing, 雖然不足以造成太大威脅, 但是還是怕...「曾參效應」

啥是「曾參效應」? 就是怕大家聽多了, 就認為是真的! 以為Bing比Google優秀

從教育部成語典故中:

春秋時魯國有一個學者,名叫曾參,他是孔子的得意門生。學養很深,品性端正,是個有名的孝子。他住在魯國費(音ㄅ|ˋ)邑時候,有一個和他同名的人殺了人,有人就跑去跟曾參的母親說:「曾參殺人了!」曾參的母親說:「我兒子不會殺人!」就照常織她的布,沒有理會。過了不久又有人又來說:「曾參殺人了!」曾子的母親還是泰然自若地繼續織布。過了一會,又有人跑來說:「曾參殺人了!」曾子的母親就害怕起來,丟下織布的梭子,跳過圍牆逃走了。像曾參那麼賢良的人,只要多幾個人來說他殺了人,那麼連對他最有信心的母親也會相信,可見流言的可畏。後來「曾參殺人」就被用來比喻流言可畏或稱誣枉的災禍。


(註: 為什麼曾參的母親要跳過圍牆逃走呢? 為什麼是跳而不是爬呢? 請問教育部吧!)

另外是怕「連鎖效應」, 就是Bing能! Yahoo也能! 如果沒有壓下Bing的漲勢, 到時可能Yahoo也依樣畫葫蘆

這些搜尋引擎的拼鬥, 對於使用者來說是最大的福音, 因為搜尋更精準了, 但是對於SEO來說更有不可預知的變化, 搜尋引擎優化與搜尋引擎行銷的作業更是會受到影響, 什麼變化什麼影響呢? 等我吃飽再說了...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月10日星期三

Bing 是否能挽回 Microsoft 的劣勢?



Bing自六月初推出沒幾天, 反應有好有壞, 但是我們之前的文章"Microsoft Bing 雖然現身, 但是猶抱琵琶半遮面", 大抵還是保持正面的看法, 現在ComScore出來報告了....

才一週的時間, Bing的搜尋穿透深度(大抵可以說是Reach)已經增加1.7%而到15.5%, 經過proxy的資料密度已經增加2.0%到達11.1% (根據美國用戶的統計資料)

如果微軟繼續推到其他語文都完全上線的話, Google應該會受到點威脅, 因此我們也可以透過Google近日的動作頻頻, 知道確實Google有些想壓下Bing的氣勢

Bing的發展也讓Yahoo擔心受怕, 因為根據StatCounter的統計, Bing曾經在6/4追上Yahoo (參考: StatCounter:Bing搜尋一度超越Yahoo成全球第二名)



所以後續可以預期的是....原本雙雄爭霸的局面, 可能會變成了三國鼎立了, 2009年會是搜尋引擎很精彩的一年!!

2009/6/11 後記:

今天我問Rich Skrenta, 他認為Bing是非常好的產品, 微軟將會透過Bing來取得市場佔有率的大幅成長

跟我的想法有點類似, 只是目前的成長只限於英語系國家, 也許等微軟準備好中文的關聯, 台灣跟中國才會感受到Bing的威力

誰是Rich Skrenta? 其中最重要的是, 他就是ODP的創始人之一, 也是將推出的搜尋引擎Blekko的創辦人, 以他的背景會看好Bing, 大概Google會有點擔心了


標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

NoFollow 真的可以做到 PageRank Sculpting 嗎?



前文"PageRank Sculpting 與 PageRank Siloing"留下了一個疑問, nofollow真的是可以照我們的意思去分派PageRank嗎?? 我們現在來看看到底發生什麼事情了...

PageRank Sculpting 是許多SEO業者常用到的手法, 就是經過rel="nofollow"來限制某些link去分享PR, Google在"關於 rel="nofollow"這麼說:

Google 如何處理 nofollow 的連結?

...表示 Google 不會在這些連結之中傳輸 PageRank 或使用錨點文字。 基本上,使用 nofollow 會使我們將目標連結剔除在網頁整體圖表之外。 不過,如果其他網站在沒有使用 nofollow 的情況下連到目標網頁,或如果網址已經透過 Sitemap 提交給 Google,這些網頁可能還是會出現在索引中。 此外,請您特別注意,其他的搜尋引擎處理 nofollow 的方式可能稍有不同。


Google說他們不會傳遞PR及Anchor Text給具有nofollow的連結, OK...這個沒有問題, 但是根據以往的說法:

如果PR10的網頁有10個link, 其中有8個nofollow, 所以只有2個會接受PageRank分享, 而接受的PR值各是PR10/2

但是在2009 SMX接收到的訊息卻是:

如果PR10的網頁有10個link, 其中有8個nofollow, 所以只有2個會接受PageRank分享, 而接受的PR值各是PR10/10 (8個nofollow沒有收到PR, 但是仍舊除以10)

也就是說nofollow並不能真正達成PageRank Sculpting的目的, nofollow雖讓某些頁面沒有接收PR, 但是PR已經部分遺失, 目前Google尚未正式做出解釋

我們再回去Google的解釋看看: "Google 不會在這些連結之中傳輸 PageRank 或使用錨點文字"....他並沒有說其他沒有nofollow的頁面會接收多少PR

根據非正式管道得知, Google之所以沒照大家認知來處理nofollow是為了保持資料的完整性, 也就是網頁A有10個往外連結, 這個數字10會是其他網頁連入連結的數字來源, 如果要讓PR只除以非nofollow數目, 則必須每個網頁多出一個變數來記錄非nofollow, 也就是多出數十億個以上的counter變數儲存空間

所以Google很可能不會做出處理, 也不會正式回應, 因為有太多更重要的需要處理

那我們應該怎麼面對nofollow呢? 如同我們在outbound link effect說的, 就把nofollow當成關係串聯與否的開關, 不要去想PageRank Sculpting了

後續如何發展...再說囉!

後記 2009/06/16:

Matt Cutts終於在2009/06/15的文章"PageRank sculpting"證實了....

So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page). More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each.


PR=10分, 有10個outbound link, 其中5個是nofollow, 原本應該5個link可以分到2分, 但是Google已經在一年以前修改, 沒有nofollow的5個link只各以分到1分 .... 當然其他5個nofollow的link什麼都沒分到

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google Search Options 將會是 SEO 的惡夢?



以上的圖是Google搜尋英文界面的Options(選項), 雖然中文界面尚未出來, 但是已經可以讓使用者更彈性的選擇資料顯示方式, 這個功能是否將是SEO廠商的惡夢呢??

搜尋引擎大多在英文的功能會比較快速推出, 因為中文的相關資料不若英文完整, 因此總是需等待更久的時間, 如之前所談微軟的Bing也是一樣

Google Search Options提供使用者更多的彈性來顯示資料, 當開啟Options後有如下的功能


你可以選擇只顯示評論文章, 也可以只選擇討論論壇, 也可以就時間來區分

如下就是選擇連同網頁包含的影像也一起顯示


如下就是選擇顯示更多的網頁描述


如下就是選擇相關搜尋


如下就是選擇以Wonder Wheel方式顯示 (因中文沒有可以顯示的資料, 所以用英文資料顯示)


如下就是選擇以Timeline(時間軸方式)來顯示


看完之後....有啥感想? 就是資料已經不是單一型態顯示了, 如果你在一般搜尋有不錯的SERP, 可能在其他類型就不一定啦, 所以如Google/Bing這些顯示資料的轉變, SEO廠商的努力結果可能會更加被........稀釋

這個就是我們在2008年底說個人化搜尋將全盤改變SEO的意思, 如果在加上SearchWiki.....SEO已經不是以往的SEO了, 也就是說....SEO 3.0已經宣佈來到

所以基本上已經沒有純粹的SEO, 而是必須真正的改善網站體質著手去進行我們所說的CLOUDS

如果還只是在進行Backlink的策略, 那肯定會被市場淘汰的! 必須真正進行完整的搜尋引擎行銷才能解決問題! 你準備好了嗎?

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月31日星期日

Google WAVE 與 Microsoft Vine



2009/4/30的文章說到"Vine : Microsoft 對抗 Twitter 的社交工具?", 這個Vine目的也在串聯親朋好友, 並且可以瞭解我所關心區域所發生的大小事, 但是Microsoft還是用類似MSN的client-server方式 ...


首先登入就要你有Microsoft Live的帳號


比較不同的是用地圖的方式來展現


如果你畫出的區域有訊息, 就可以展開來瀏覽


但是用起來有幾個缺點

(1)當然就必須安裝vine-setup.exe
(2)程式雖然不大, 但外掛dll不小
(3)程式跑起來很吃CPU
(4)黏性不夠, 用起來蠻無聊

總歸一句話, 又是一個勢必被淘汰的計畫

相對於Microsoft Vine, Google也在2009/5月底在Google I/O宣佈了Google Wave, 相關畫面就請看參考資料, 不再贅述

Google Wave是一個產品, 也是一個平台, 更是一個通訊協定, 也就是Product/Platform/Protocol三者合一


Google Wave是一個溝通與協作產品, 由展示中看起來很像電子郵件加上即時通, 但是訊息的組織比較像Gmail, 並且他是HTML 5的AP, 以Google Web Toolkit來建置, 所以開發者可以使用Wave API來建立自己的應用, 這個Google Wave是以Cloud為架構, 因此各平台間可以在不同的Wave Clouds間來溝通....所以既是product,platform, 又是protocol

所以Google Wave勢必會引起Cloud Computing/HTML5等技術的更加風行

跟Microsoft Vine比起來, Google Wave的格局大得多了, 不過Google Wave應該在幾個月後才能真正給使用者試用, 後續再來詳細介紹Google Wave

參考資料:
Google Wave Preview
Google Wave: What Might Email Look Like If It Were Invented Today?

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月2日星期六

Blogger For Domain FTP Publish 功能出問題


真是屋漏偏逢連夜雨, 昨天才剛從新聞知道香港也出現H1N1的確定病例, 正不知香港的會議該不該去時, 又發現Blogger竟然無法刊登文章到網站, Blogger For Domain Publish to FTP竟然無法運作啦???

後來經過無數次的檢查及測試, 發現Google真的開始出現了問題 ...

原本於2009/4/30都運作正常的刊登文章, 突然發現在5/1開始沒辦法刊登了, 原本以為應該系統太繁忙, 後來才發現在Google的Groups上已經有一堆人都發生同樣的問題

結果發現幾個問題

(1)使用Google Chrome 瀏覽軟體, 發現FTP User Name是錯誤的
(2)進行更改動作回存後, 竟然改不過來

經過進行以下作業後, Blogger For Domain FTP 功能才恢復正常

(1)使用IE瀏覽軟體, 把FTP User Name改成正確(當然密碼也要確定正確)
(2)使用IE瀏覽軟體, 把FTP Server改成IP Address

目前暫時運作正常, 但必須思考搬遷的問題了!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月30日星期四

Google People Profiles : 用搜尋引擎找人



你應該有用搜尋引擎找人的經驗, 但是輸入名字後一大堆的同名同姓的人, 根本辨別不出來哪個是哪個, 更何況大多人不喜歡在網路上使用真實姓名, 使用搜尋引擎找人確實只能碰運氣了, 但是Google似乎想要改變這個情形 ...

這篇"Hoping To Improve People Search, Google Launches Profile Results"說到, 如果你想讓人搜尋到正確的資料, 可以登入Google Account後, 去修改個人檔案...云云

如上面的圖, 可以把你的經歷資料完整的呈現, 當使用者使用Google People Profiles, 就可以查詢 (如 Danny Sullivan )

並且還提到People Profiles還可以增加連結, 擔心這個功能會不會變成另外link spam的樂園?

Google的這個想法, 應該比較適合用來找「名人」, 而不是用來找「普通人」

因為「普通人」不會把資料登載上去, 但「名人」就不同了, 不過也許網路更普遍後, 也許大家都會記載真實資料也說不定, 不過短期內是不太可能吧!

而擔心這個功能會變成另外link spam的樂園, 也是過度了, 大家都知道link的效果已經越來越不明顯了, 需要的是有效的連結, 而不是更多的連結

Google不太可能自己搞的people profiles, 會沒注意到這個問題

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月29日星期三

Google Personalized Search : 個人化搜尋中文界面問世



我們在"Personal search is coming : 個人化搜尋將全盤改變SEO"說過, 黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌...在"SEO觀點 : SEO面對的是巨變的環境"也談過, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

之前已經在Google Search英文界面測試好一陣子的功能, 現在中文界面也出現了, 如下:



當你登入Google帳號後,Google Search增加了幾個功能:

(1)你可以將不希望看到的結果列表移除, 也可以將希望看到的結果重新排序
(2)你可以加入註解(comment)

當然你也可以回復原先的排序, 並且這些重新排序的結果都是個人化的, 別人並無法看到

What is the catch?

可以分成好跟壞兩方面, (a)好的是使用者可以把非相關訊息過濾掉, (b)壞的方面是SEO技法已經越來越多挑戰

從另一方面看也有好跟壞, (c)好的是正經的好文章可以更被彰顯, (d)壞的方面是黑帽SEO會不會大量利用過濾對手的方式來打擊

(a)跟(c)絕對是正面的好消息, (b)對正派SEO來說沒有困難, 但(d)就看Google如何利用這些個人化資料了

所以SEO的最終目的還是要針對人, 電腦或許可以被欺騙, 但是沒有相關的訊息, 就算出現優秀的SERP, 也會在不到一秒的時間就被使用者過濾了


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月22日星期三

Yahoo WebRank?



網路上有人說Yahoo是以WebRank來評估網頁等級, 並且有圖為證(如上)
我們知道Google的網頁等級是以PageRank, Microsoft是以Browserank, 現在又有WebRank啊? 只能一笑置之, 我們來看看究竟是如何吧!

我們在"SEO觀點 : SEO面對的是巨變的環境"說過

如果您看過美式足球, 一定曾經被足球比賽的多變所震憾過, 一場比賽沒有到結束前, 沒人知道哪個隊伍是最後贏家, 因為任何時刻都是關鍵, 差之毫釐沒有抓到球或是沒有攔到對手, 都可能翻轉整場的勝負

教練必須在各種瞬息萬變的狀況下隨時調整策略, 以應付當時的情勢, 而所有現場的反射動作都是平常多年累積下來的經驗結晶, SEO(Search Engine Optimization)也是如此, 沒有絕對不變的真理, 只有隨著整個網路生態與技術的推移逐步調整出最好的步伐...


Yahoo開始用WebRank嗎? 其實WebRank不是現在的新名詞, 大約在五、六年前就有的, 當時也真的有WebRank Check Tool, 不過已經都查不到東西 ...

WebRank當時的用意跟BrowseRank類似, 我們在"PageRank, BrowseRank, AlexaRank"談到 -- BrowseRank只是Page-level的AlexaRank

而這篇"Microsoft Unveils BrowseRank, Google Feels a Draft"也認為BrowseRank尚未真正成熟

我們如果從PageRank/BrowseRank/AlexaRank/WebRank的資料來源觀察, 大概就可以知道哪些是比較精準而可以延用下來的

何時Yahoo才會重拾WebRank呢? 如果連BrowseRank也搞不起來的話, WebRank大概就無法重見天日了, 後續再以技術層面來探討PageRank、BrowseRank...等ranking algorithm


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月13日星期一

Matt Cutts 回答 Canonicalization Tag 問題

我們在文章提過"Canonical link element : 標準鏈結元素", Matt也在日前針對這個問題再次說明






有人問:

Does the new canonicalization tag make it safe to add tracking arguments to some of my internal links without fear that Google will split the quality signals between the two addresses?

當我使用canonicalization tag後, Google是否會分別評估頁面品質?


以下是另外的訪談:


總之使用Canonicalization Tag可讓search engine不必去處理根本是相同內容的不同URL, 因此如果你有類似example.com與www.example.com的問題, 應該儘速使用Canonicalization Tag來宣告, 讓search engine更有效率

參考:Matt Cutts Answers Canonicalization Tag Question

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月10日星期五

Google adWords 新界面增強 Conversions 計算



Google在六小時前於Twitter宣佈"Updates to AdWords conversion metrics", 讓追蹤廣告更加方便...

根據這則訊息"Google AdWords to Update Conversion Metrics in New Interface", 從原本1-per-click到many-per-click, 也就是說原本某人點選廣告達成交易後, 如果後續交易沒有透過原本的click也會在many-per-click顯示

"Conversions" 表示 (1-per-click), 而 "Transactions" 表示 (many-per-click)

Conversions (1-per-click) count a conversion for every AdWords ad click resulting in a conversion within 30 days. This means if more than one conversion happens following a single ad click, conversions after the first will not count.
Another way to say this is that conversions (1-per-click) will count at most one conversion per click. These metrics are useful for measuring conversions approximating unique customer acquisitions (e.g. leads).

Other metrics related to Conversions (1-per-click) are:
- Conversion Rate (1-per-click): Conversions (1-per-click) divided by total clicks.
- Cost/Conv. (1-per-click): Total cost divided by conversions (1-per-click)

Conversions (many-per-click) count a conversion every time a conversion is made within 30 days following an AdWords ad click. Conversions (many-per-click) will count multiple conversions per click.
These metrics are useful for measuring conversions that are valuable every time they happen (e.g. ecommerce transactions).

Other metrics related to conversions (many-per-click) are:
- Conversion rate (many-per-click): Conversions (many-per-click) divided by total clicks. Note that because you may receive more than one conversion per click, this conversion rate may be over 100%.
- Cost / Conv. (many-per-click): Total cost divided by conversions (many-per-click).

當然這個不算新功能, 只是提供更方便的界面可以做到這個功能

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google新專利: Methods and systems for assisted network browsing


(圖片來源 www.todayandtomorrow.net)

Google於2009/4/7通過了新專利"Methods and systems for assisted network browsing", 可以在點選連結前顯示該頁面訊息, 這個專利早在2003年申請, 目前才剛熱騰騰出爐 ...


"Methods and systems for assisted network browsing"這個是在做什麼?

這個摘要說明如下:
Systems and methods for assisted network browsing are described. In one described method, a client device receives an interest signal indicating a user's interest in a hyperlink contained in a first document. The client device responds to the interest signal by generating a request signal comprising a request for third-party-provided information about a second document associated with the hyperlink. The client device receives the requested third-party-provided information and causes it to be output in association with the first document.

當使用者打開網頁, 可能會出現許多連結到其他頁面, 在網頁上會顯示出到下一個連結的額外訊息讓使用者參考, 這個專利到底有什麼目的?

(1)因為已經提供訊息給使用者, 可讓click更精準, 提高使用者滿意度
(2)因click精準了, 可以收集更多資料讓搜尋引擎參考

如果這個專利可以使用在各種browser, 那Yahoo跟Microsoft要傷腦筋了, 因為連IE上的使用者點選狀況都被Google搜集的話, 將使Google Search更如虎添翼

但是third-party-provided information是什麼呢? 可想而知Google是想推出Open API, 然後收集資料到datacenter, 而information不外連結網頁的PageRank、AlexaRank、摘要訊息...也可能是如部落格觀察的排名等....

這個專利推動的結果, 會讓link spam點選率降低, 讓Google掌握了BrowseRank訊息, 使用者傾向 .... 太多的資訊都集中到Google, 後續發展如何? 我們就等著看了!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月7日星期二

Google 該不該買下 Twitter?


Google該不該買下Twitter? 這個問題我們在"當感覺不到網路的存在時,網路的商機才剛要開始"就已談到問題所在, 現在已經不是該不該買的問題, 而是Twitter願意多少錢被買的問題, 跟Google的眼光到底放在哪裡的問題...

我們說過: "當感覺不到網路的存在時,網路的商機才剛要開始", 必須要把勢力擴張到離開電腦的人, 才是真正戰爭的開始

Twitter的能力不在電腦上, 而在行動設備上

Twitter的價值不在碎碎唸, 而在訊息的快速傳遞上, 以及這些訊息中所能淬取的黃金上

Twitter是Google想要的, 也是Yahoo/Microsoft想要的, 誰能拿下Twitter, 就能實現我們說的"感覺不到網路的存在"的部分境界

Twitter有啥嘛東西? 台灣用戶大概感覺不太出來

(1)Twitter的real time search
(2)Twitter的real communication
(3)Twitter的customer base
(4)Twitter的buzz effects

如果Google野心夠大, 就該買下Twitter

只是到底Google會不會怕這個錢會回收不回來? 如果純粹以商業考量的話, 也許Google大可自己搞另外的Twitter, 因為買下Twitter並不會讓Google立即獲利, 但是如果不買下Twitter, Google後面的路可能會辛苦一些

P.S.
Google CEO Schmidt說: 目前Google不傾向購買Twitter
如果這真的是Schmidt的內心想法, Google應該"傾向"要換一個比較有遠見的執行長!
如果Google收購Twitter最後破局, 大概最高興的是Yahoo跟Microsoft...

後記:

這篇"Google + Twitter = End of privacy"提到, 如果Google買下Twitter, 那麼大家就跟隱私權Say Bye Bye了! (筆者評論.....純為賺稿費的文章)

當然這是科技發達最後必須取捨的問題了, 這個不是科技的原罪, 而問題在於人與管理
這不是Google的問題, 而是美國國會的問題, 換成其他任何一個廠商, 都會碰到這個最棘手的關卡
如果你希望Google提供免費email, 又不希望他hold有你的data, 這個可能是辦不到的事情


標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月3日星期五

Google Buy Twitter ? 會是推特的最後命運嗎?

我們在前幾篇文章談過Twitter, 認為Twitter尚未摸索出獲利模式是致命點, 到底Twitter的命運會是如何? Google會不會買下Twitter?

以下是Google Vice President, Marissa Mayer的訪談 ...












這篇文章"Nine 2009 Techie Predictions: The Fanboy Forecast"就預言了Google會在2009年買下Twitter, 以應付Facebook

而從這篇"Schmidt: Google 'unlikely' to buy Twitter soon", 也聽出蛛絲馬跡, Schmidt說不會很快的買下Twitter....大概等好價錢

而這篇"Report: Google in 'late-stage' talks to buy Twitter", 更是轉彎的證實...很可能Twitter會被買下來

從上面的跡象顯示, 以及Twitter可能補足Google在Social Network的不足情況下, Twitter失身的可能性是相當高的, Twitter大量的資料在Google的併吞後可能會出現不一樣的模式, 而原本依附在Twitter下的工具, 可能也要開始緊張, 在Twitter被買下後, 是否還能繼續原本的服務

似乎目前小公司的命運就是這麼乖舛....就只能等著大咖的寵幸, Google吃下Twitter後, 等於是多了一隻翅膀, Microsoft跟Yahoo會坐視嗎? 就等著看好戲了!


標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google server uncloaked : 谷歌伺服器大公開



上圖是Google最早的server, 雖然壯觀但是還是有點像用資源回收的方式拼湊起來的, 每個空間幾乎都塞滿了線路跟零件, 為的是增加資料中心的容量, 現在Google公開了最新的神秘伺服器...

下圖是早期Google server更詳細的圖, 點選可看大圖


下圖是最新的伺服器及資料中心


詳細說明資料可看這裡:
(英文) CNet: Google uncloaks once-secret server
(中文) ZDNet: Google神秘伺服器大公開

上面已經談過的內容, 我們就不再贅言

我們在"Google資料中心的秘密"談過, Google的神秘面紗包括了: (1)軟體 (2)硬體 (3)叢集平行處理機置

因此這次公開硬體的規格, 其實只是在宣誓他們的領先地位, 不會有被模仿的疑慮 (要模仿也搞不來吧), 而這次的內幕公開, 大概會讓技嘉主機板股票漲停個幾天

Google的伺服器為2U, 說實在一般來說, 2U最為詬病的是散熱問題(零件擠在一起且沒有導風空間), 因此Google其實沒說完全

雖然我們看圖, 電源供應器是在機殼外部, 且配有專利電池, 但是沒看到機殼內部零件的散熱機制, 因此應該有其他奧妙之處

"該公司的資料中心核心是由標準1AAA貨櫃組成,每個貨櫃裡有1160台伺服器,每座資料中心都有好幾個貨櫃"

這個貨櫃的內部如何做散熱才是真正省錢的秘密, 1160台2U的伺服器, 所發出的熱是非常可怕的, 光是冷氣絕對無法應付散熱, 貨櫃應該有特殊的空氣循環, 而且就Google精算的考量, 其冷氣的使用應該不是一般機房的設計方式

看了這些資料, 真佩服Google....不是佩服他們的硬體, 而是佩服他們只公開你模仿不來的, 可以借鏡的資料從來不提, 而且其精準程度, 難怪是Google !

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月27日星期五

什麼是 Google Wonder Wheel ?



Wonder wheel就是摩天輪, Google要蓋遊樂場啦?

這個摩天輪跟遊樂場摩天輪不太一樣, Google winder wheel是為了要讓搜尋結果能夠更貼近使用者的需要而產生的, 因為結果的展現很像摩天輪, 所以稱為Google Wonder Wheel

以下的展現是否很像摩天輪?


(Source: http://blog.searchenginewatch.com/090325-134557)

以下是Google Wonder Wheel的demo:



Google Wonder Wheel跟Quintura類似, 也跟我們前面說的語意搜尋很像, 你可以說他是Universal Search加上Semantic Search, 或是我們說的Search 3.0

這種轉變跟SEO/SEM有什麼意義?

就是傳統的作法會逐漸失去效用, 是否真的內容相關? 是否與權威網站建立關聯? 我們前文也都說明過, 後續持續觀察Google Wonder Wheel是重要的事情

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月26日星期四

SEO趨勢 : Javascript 會影響搜尋引擎抓取?



Javascript會影響搜尋引擎抓取, 這是大多的SEO流傳的觀念, 這個問題跟"動態還是靜態的URL比較好?"一樣, 表示觀念還停留在三五年以前, 這個跟"SEO : 搜尋引擎無法索引Flash檔案?"問題也是類似, 就看你如何處理...

如果你在Flash中把文字轉成圖形物件, 搜尋引擎抓得到文字才有鬼, 所以問題不在"搜尋引擎是否可以索引Flash檔案", 問題在你的檔案呈現給搜尋引擎什麼樣子, 而你所針對的是Google?Yahoo?還是Baidu?

回到主題, Javascript 會影響搜尋引擎抓取?

Javascript是Client-Side的程式碼, 也就是執行在你的browser, 而且Javascript在不同的browser可能有不同的結果, 有些browser可以執行, 但某些語法不支援則會出現錯誤或沒有輸出

因此原則很簡單:
(1)你的Javascript是否在Windows/Linux的IE/FireFox/Chrome...等browser都可以執行?
(2)你的Javascript執行是否可能很久或timeout, 或浪費resource?

如果你的Javascript使用標準語法(各平台都正確), 並且不需等待太久.....那搜尋引擎會抓取執行結果

如果你的Javascript非使用標準語法(某些平台無法run), 或需waiting或使用大量array.....那搜尋引擎大多會bypass

多久算是waiting? 目前沒有可靠數字, Javascript去load flash時, Google就會bypass

因此Javascript 會影響搜尋引擎抓取? 答案是yes and no(針對Google/Yahoo), 完全看是否思考上面兩個問題

後記: 2009/03/27

Google是否會index flash? Google已經說明哪些情況會抓取flash的text, 看過這篇文章"Are The Search Engines Really Indexing Flash?"

這位作者是某SEO廠商的CEO, 她說:

Guess what? Most Flash is still highly invisible in Google.

To test this, I went directly to some Flash sites, and pasted exact words contained within their Flash into Google (using quotes) and most of the sites did not show up in the search results. Upon review of the source code of two sites that did show up I found that one was using the phrase I looked for within their Meta description (see… meta descriptions actually DO count for something with Google, despite what some will tell you). The other site had lots of text within the code beneath the Flash so that search engines and browsers without Flash would have some meaningful info. While that’s a good alternative, the info they had was very different from the info contained in their Flash. That’s a bit of a dangerous game to play with the search engines if you ask me. If that info is good enough for search engines and iPhones, why isn’t it good enough for your most important users?


她去測試一些有flash的網站, 發現許多在flash的文字都沒有被Google index, 所以她結論: 大多的flash還是沒被Google抓來index......

嗚呼哀哉........她大概沒做過flash, 在flash看到的文字不一定是真的text, 有些為了字形美觀或效果, 必須轉換成graphic圖形物件, 光是外部觀察是不容易看出哪些是真的text, 除非你自己電腦的font去變動, 看該flash是否會依你的變動而不同, 如果會的話就是真的text, 不過這個應該沒人這麼閒去做這個測試, 而且大同小異的font這麼多, 你也很難猜出他真正用的font, 而且以javascript去load flash, 就算是flash中是純text, Google也不會抓, 這位CEO的建議是對的, 但是判斷過程是錯誤的......

當然無意義的flash應該盡量減少, 使用flash還是要以HTML搭配, flash text是否可以被Google index也不是太大的問題, 但在這麼出名的網站, 這麼高階的SEO主管都會下這種判斷, 可見沒有追上技術實在很難搞SEO

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Matt Cutts 解釋 Google Backlink Check



當你在Google Search打入 link:www.my-domain-name.com, 出現的結果與Yahoo Search是不同的, 這是長久以來許多人的疑問, 我們曾經在一系列的"Search Engine Optimization 搜尋引擎最佳化的幾個問題"回答過, 現在透過Matt Cutts再來說明一下...

如果你想仔細複習, 可參考
Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)

我們之前說到"link:"這個功能... "只是列出代表性, 並非所有backlink...只有在Webmaster Tools中的資料才是完整資料"

Questions:

- How accurate is Google's backlink-check (link:...)? Are all nofollow backlinks filtered out or why does Yahoo/MSN show quite more backlink results?

- If you have inbound links from reputable sites, but those sites don't show up in a link:webname.com search, does this mean you aren't getting any "credit" in Google's eyes for having inbound links?


Matt Cutts解釋說, 只是列出代表性的目的是為了防止競爭對手瞭解你的網站互聯的狀況, 所有的backlink只在webmaster tool才提供, 並且不會因為"link:"沒有列出而沒有列入網頁評分計算

其實...關於這個問題...Matt Cutts並沒有說實話 (應該說他只說了抬面話吧....)

Google與Yahoo所取得的backlink數目都比實際數目少, 連Google Webmaster Tools中的數目都低估實際數目

原因為何? 不是有某個演算法濾掉不該算的, 就是演算法遺漏了抓取, 目前看起來是遺漏的可能性較高

但是不管如何, 如果大家的backlink都會一視同仁的遺漏計算, 反正也算公平就是了

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月25日星期三

SEO趨勢 : Google SERP Updates - 相關關鍵字與問句式查詢



Google在昨天(2009/03/24)公佈了兩個重要的SERP(Search Engine Results Page)的演算法更新, 一個是Google更瞭解你的關鍵字, 一個是較長的關鍵字會顯示較長的description...

這兩個更新有何重要性呢?

(1)Google更瞭解你的關鍵字

當你輸入一個關鍵字, Google不再只是單就這個關鍵字來搜尋, 而是還會顯示在頁尾跟這個關鍵字相關的建議詞
當你輸入: principles of physics, 除了正常的SERP之外, 還會顯示跟physics相關的

principles of physics serway
quantum mechanics physics
physics special relativity
physics angular momentum
big bang physics
physics for scientists and engineers
physics classical mechanics
equations of physics

並且當你使用英文界面來搜尋"taiwan", 發現建議詞是

taiwan news
history of taiwan
taiwan economy
taiwan google
hong kong
thailand
japan
singapore

已經不只是字面跟Taiwan相關, 而是有點semantic的味道了

這個告訴你什麼? 應該很清楚了吧

(2)較長的關鍵字會顯示較長的description

在SERP(Search Engine Results Page)頁面中, 除了Title外還有描述文字(description或稱為snippet)

在較長的關鍵字時, 這個snippet長度會拉長, 並且符合的詞都會以粗體顯示(台灣界面以紅字顯示)...

這個不是本來就這樣嗎? 是本來就這樣, 只是拉多長大家比較沒注意到

這個對於SEO有何關係?

當然有關係, 目前SEO大多以關鍵字在操作, 但是較沒有注意到"問句式"查詢 (詢問式查詢, 詢問式關鍵字)

也就是如果著眼在"SEO"這個字, 可能就無法在"到底什麼是SEO", "SEO是啥東西", "SEO有何重要", "SEO的縮寫到底是什麼東西", "SEO跟SEM有什麼關係", "SEO是否就是SEM", "SEO與網站排名有何重要", "SEO與PPC的關係"....等問句式查詢出現優秀的SERP

這個問句式查詢的趨勢, 如何破解? 操作方式的改變已經開始發酵...你準備好了嗎?

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月24日星期二

Facebook 與 Google



我們曾經在"Social Network : Facebook v.s. Myspace v.s. Linkedin"比較過這三個Social Network, 但是現在Facebook已經可以開始跟Google來互相比較了, 這個趨勢已經開始在美國影響SEOSEM, 是否台灣也會往這個趨勢發展呢?

看看上面的圖表, Facebook的Reach雖然還離Google很遠, 但已經逐步逼近, 而PageView已經與Google進入纏鬥階段, Facebook的unique visitors也已經是Google的1/2+

這個代表什麼呢? 在美國的SEO/SEM生態已經逐漸改觀, 光是針對傳統搜尋引擎優化搜尋引擎行銷已經無法真正反應需求

那麼台灣呢? 由於Facebook台灣用戶尚未達美國的規模, 所以目前暫時不會有太大的影響, 但是如果台灣用戶持續成長或中文社交網路市場出現Killer Social Site的話, 當然就會改變SEO/SEM生態...BUT WHEN?

沒人能真正預測何時, 但肯定是不會太慢, 由幾個比較活絡的小眾社交網路來觀察, 這些都很有機會成為中文市場的Facebook, 仔細觀察美國、台灣、中國這三個市場, 其所需要的功能/界面...差異相當大, 因此Facebook是否能夠打破這些差異, 是一個關鍵, 同樣也是台灣小眾社交網路是否能夠吃下中文市場的關鍵

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月5日星期五

Bounce Rate與New Window的關係



我們於前面文章"BounceRate是否影響SERP?"談到Bounce rate是一個重要的根據, 可以讓你知道哪些頁面無法讓讀者停留或繼續閱讀, 雖然Bounce Rate並非影響SERP的前因, 但是降低Bounce rate或盡量讓Bounce Rate真正反映讀者的行為是重要的作為...

我們根據Wikipedia解釋Bounce Rate, 可以知道以下會造成Bounce Rate:

-Clicking on a link to a page on a different web site
-Closing an open window or tab
-Typing a new URL
-Clicking the "Back" button to leave the site
-Session timeout


現在如果有幾個情況 :

(1)點選到你的網頁, 沒有閱讀就離開 (可能關閉、另外輸入URL、或back到外部網站)
(2)點選到你的網頁, 點選link到同個網站的另外頁面(在本window)
(3)點選到你的網頁, 點選link到同個網站的另外頁面(在新開的window)
(4)點選到你的網頁, 點選link到外部網站(在本window)
(5)點選到你的網頁, 點選link到外部網站(在新開的window)
(6)點選到你的網頁, 到session timeout(default 30 min)都沒動作

哪幾個會造成Bounce?

(1)最沒有爭議, 絕對是造成Bounce, (6)就有些爭議, 因為有可能讀者在session timeout都還在閱讀該頁面, 但是還是會被算成Bounce, 所以根據(6)的推理, 每個頁面不應該太長, 否則就算有閱讀都會算成Bounce,(2)則沒有疑問的, 絕對不算Bounce

而(3)(4)(5)的狀況就比較複雜, 我們來探討Google Analytic的Bounce如何產生

我們先看(4)(5), Google Analytic code因為只是在自己的頁面執行, 當自己的頁面A點到一個外部link, Google Analytic code當然不知道, 因此若由自己的頁面A在本視窗連到外部link, 自己的頁面A就算關閉, 如果由自己的頁面A在新視窗連到外部link, 頁面A的視窗須等session timeout才算bounce

因此如果自己頁面連到外部link最好以開新視窗的方式

再來看(3), 當一個視窗開啟就形成一個新的session, 因此如果自己頁面連到內部link最好以開本視窗的方式

也許你會問: Bounce Rate並非影響SERP的前因, 那注意Bounce Rate作啥?

讓Bounce Rate盡量正確可以讓Bounce Rate成為修正網頁的根據

如果你以本視窗方式連到外部link, 讀者有繼續閱讀但是同樣會形成bounce, 如果你以新視窗方式連到內部link, 讀者有繼續閱讀但是同樣會形成較高的bounce, 因此修正這些做法可以讓Bounce rate更精準

也許你又會問 : 啊! 我有一堆違反上面所說的怎麼辦 ? 豈不是改到歪腰? 其實只需從現在起注意修正或盡量修正即可, 不需刻意把所有網站的開視窗方式都全部修改

所以記住 :

-- 單一頁面不要太長, 以免因session timeout造成bounce
-- 如果自己頁面連到外部link最好以開新視窗的方式
-- 如果自己頁面連到內部link最好以開本視窗的方式


並不是說如此就可以有好的SERP, 而是就機率來說, 以上3個做法可以讓bounce rate盡量符合實況, 可以讓Bounce Rate成為修正網頁的根據

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)



延續之前文章

"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

我們繼續來談其他問題...

Q: I have a website in 5 languages (and I cannot buy 5 different localized domains), which option is the best? To have different subdirectories (domain.com/en) or to have different subdomains? (en.domain.com)
如果網站有五種不同語言的內容, 網址應該如何取捨? 子目錄或子網域?

A: both versions are fine. I personally generally recommend using a subdomain when the sites are completely different and using subdirectories when it's more or less a shared site, but it's up to you.
當網站是完全獨立的可以用子網域, 若共用則使用子目錄


以上回答如果有聽沒有懂, 請參考:

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory

Q: If my sub domain got high Page Rank, how far it will contribute to the main domain?
次頁的PR是否會貢獻給主頁?

A: PageRank is on a page-by-page basis. The PageRank of a page (on a subdomain or not) is based on the links to it.
不會


雖然PageRank是以頁面來計算, 不會貢獻給上層網頁, 但是如果適當調整link, 可將link的PR貢獻給上層或其他網頁, 因此監看各頁的PR還是必須進行的

Q: Recently you posted on the webmaster central blog that you would suggest to not rewrite dynamic urls to static. Is there penalties for sites that rewrite? Would you suggest changing if a site has 5+ years history? Can you discuss further? Thanks.
將動態URL改寫成靜態URL影響如何?

A: great question. If your site is already doing well and you have rewrites, then you're probably doing them properly so please don't worry about it.
Feel free to spend time on your content and business! Yay! :)
In our blog post, we wanted to discourage new sites, or less experienced webmasters, from feeling they HAD to use rewrites. We've improved our processing of dynamic URLS, so there's no need for newer webmasters to be afraid of them any longer.
沒有必要


在以往靜態URL的SERP比動態URL要好, 但是目前已經沒有差異

Q: Sub-Domains are considered as a new site for Search Engines, if a 5 years old site which uses forums.domain.com, www.domain.com now plans to add shop.domain.com and download.domain.com will this take another few years for both new domains to get rank?
舊站的PR是否能夠貢獻給新的子網域站台

A: PageRank is purely at a page level, so if you forums.domain.com has a high PageRank and links to new urls such as download.domain.com, that PageRank will flow immediately.
如果舊站有高PR, 並且指向新站, 新站很快就會有影響


不管子網域或次目錄等, 應該善用高PR的頁面, 逐步培養新的頁面

Q: Will it make any difference between a shared IP and a dedicated IP on SEO or search results, as opinions are divided on this aspect?
共用IP與獨立IP對於SEO有何影響?

A: most of the web is on shared IP addresses, so it doesn't make much sense for us to give those on dedicated IP addresses any advantages. That said, if your server is struggling with the load of your website, it might make sense to move to a dedicated server that helps to make sure that your users are happy when visiting your website.
沒有


PageRank與SERP並不會以IP來ranking, 只會以IP來判斷區域

Q: If I 301 redirect a well-ranked page to a new domain with the exact same content, will all of the rankings be replaced with the new domain once it has been indexed? How long after indexing can we expect the swap? And is the same thing true for 302s?
301 redirect是否會轉移PR, 那302呢?

A: If you're moving from one URL to another (even if it's on a different domain), ranking signals can be passed via a 301. A 302 is used for temporary redirects, so this is less likely to transfer ranking signals.
301 redirect可用於網站轉移, 302只是暫時


詳見 : SEO策略: PR5+PR4=PR6?

Q: Google takes 200 signals for ranking a query and PR is one among those. If that is the case, why is it still showed prominently on toolbar. Any possibility of seeing PR info dropped from Google toolbar?
之前說過Google使用200個因素來判斷SERP, 為何toolbar要顯示PR...

A: PageRank is just one signal that we use, but it's also one of the easiest metrics to show to users and an easy one to understand where the metrics come from. So I think it's something that still provides value to users and still makes sense to show to them in the Google Toolbar.
因為是一個最早也最簡單說明的因素...


本站文章已經就各種不同因素說明, 200個因素要說好久...慢慢再說明啦

Q: How often does your search algorithm change?
Google多常修正演算法?

A: We change the algorithms all the time - last year we had over 450 changes.
經常, 去年修正了超過450次


參考前文"SEO觀點 : SEO面對的是巨變的環境"

Q: Should I be using hyphens instead of underscores in my URLs to improve a page's rank?
我應該在URL使用底線還是中線?

A: For the time being, I would recommend still using hyphens instead of underscores. If you're already using underscores and that's working fine for you and your rankings, it's not worth switching. But if you're doing a new site, then I would go with hyphens.
中線較好


參考: SEO策略 : 如何產生更多的backlink?

Q: Does link: gives exactly the number of back links to a site?
link:這個指令是否列出所有backlink資料?

A: The link: operator only shows a sampling of links to a site, so it may not show all of the links that Google knows about. To find more information about backlinks to your own site, we give verified site owners more information about backlinks in Webmaster Tools:
http://www.google.com/support/webmasters/bin/answer.py?answer=55281
非也, 只是列出代表性, 並非所有backlink, 可以參考上述連結


只有在Webmaster Tools中的資料才是完整資料

Q: If my website "A", linking to website "B", and "B" linking back to "A" - am I going to be penalized? Does linking strategies still work?
如果A頁連到B, 然後B又連回A, 是否會被懲罰?

A: Participating in linking schemes to impact ranking is not advised it's against the webmaster guidelines.
http://google.com/support/webmasters/bin/answer.py?answer=66356
The best linking strategy is to create a site with unique content or services that people want to link to. Then publicize it.
想要影響ranking的話...是的


link schemes需要好好想想, 並非都不行, 但某些狀況不行, 請詳讀上述link

Q: Are you going to focus more on personalised search? If so, these results we currently look at won't really matter, as different sites will be at #1 for different people, right? - thank you :)
是否某人看到的SERP會異於他人看到的?

A: that's right -- with personalized search it's possible that each user sees slightly different search results. We try to make those search results unique and compelling enough to make the user go visit and stay on the sites listed -- so if your site is really awesome, chances are high that we'd be recommending it to users as well :-).
是的


參考 : "Personal search is coming : 個人化搜尋將全盤改變SEO"

(全文完)

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)



延續"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", "Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)", 我們繼續來談其他問題...

Q: In addition to a XML sitemap, does it make any sense to have also an HTML sitemap on the same website? Does HTML sitemap helps improve the rating?
除了XML的sitemap外, 有HTML的sitemap對於rating有幫助嗎?

A: A HTML sitemap file can help search engines, especially those that don't use XML Sitemap files. Also, the 404 widget in Webmaster Tools (which you can place on your 404 pages) will use "/sitemap.htm" and similar files to help users to find the content they're looking for. So yes, I would recommend making HTML sitemap files, however I'd focus on the user and not the search engines.
是的, 但是是指對使用者有幫助


HTML sitemap可與Webmaster Tools 404 pages結合(也就是當找不到網頁時), 可以指向HTML sitemap, 此舉可以讓讀者繼續停留在網頁上

Q: Recently went through a rebranding of our company name. The old domain name was successful in page ranking, however the new domain name has terrible page ranking. Do 301 redirects transfer the site equity from the old domain to new domain?
當移動網站時, 301 redirect可否轉移ranking?

A: This is a pretty common question, so we actually did a blog post about it recently. In short, 301's are the best way to retain users and search engine traffic when moving domains. You can find the full post here: http://googlewebmastercentral.blogspot.com/2008/04/best-practices-when-moving-your-site.html
移動網站時可參考上述連結


這個問題我們在"SEO策略: PR5+PR4=PR6?"也已經談過

Q: Is the bounce rate and speed taken into account when ranking a page? i.e. if you see a searcher click on a result then return very quickly and choose another result, is the first page ranked lower?
Bounce Rate是否會影響SERP?

A: assuming that users will be jumping out of a site like that, there's a high probability that they won't be willing to recommend it to others (or come back themselves). So yes, indirectly at least, if a site is made in a way that users run away right away, then chances are that we might not be recommending it as much as other sites that users like (and recommend to others).
間接來說, 是的


我們在"BounceRate是否影響SERP?"也談過啦

Q: Many believe that to rank well, you simply need "quality" backlinks. But how important is having your keywords in the , and throughout your site? Is keyword density of any importance to show what the page is about? What % is suggested?
有人認為高品質的backlink是重要因素, 並且關鍵字密度比例應如何?

A: Links are just one factor involved in Google's ranking of pages. We look at both on-page and off-page content, so what you have on your page can be an essential part of ranking. However, there is no recommended "keyword density." Your content should be high quality and written for users. If you try writing for search engines, the language can become very unnatural, which may end up hurting you more than it helps.
on-page與off-page都是重要因素, 沒什麼關鍵字密度比例問題, 只需產生高品質的內容...


請參考之前"SEO策略 : OnPage & OffPage SEO"

Q: Does inconsistent capitalization of URLs cause duplicate content issues and dilution of page rank? For example www.site.com/abc vs www.site.com/Abc. On Windows hosts, these are the same page, but are different pages on Unix hosts.
URL上的大小寫是否造成不同的URL?

A: based on the existing standards, URLs are case-sensitive, so yes, these would be seen as separate URLs. Since the content on the URLs is the same, we'll generally recognize that and only keep one of them. However, we'd recommend that you try to keep all links going to one version of the URL. Keep in mind that this also applies to robots.txt files.
是的, 如果出現大小寫不同的URL指向同一內容, 我們只留其一


在使用英文大小寫需注意, 在UNIX類的機器是大小寫不同, 而windows是大小寫視為相同, 最好在網址與robots.txt上都保持一慣性

Q: Does appearing high in image searches help improve the host sites PR and appearance on standard searches?
影像可被搜尋是否對PR有幫助?

A: Thanks for the question Andy. Well-optimized, relevant images could definitely help increase traffic to your site, especially with the introduction of Universal Search, where we mix images, videos, and more into the web search results.
是的, 影像可被搜尋可以增加流量


在網站的影像影音檔應注意檔案名稱與alt的內容, 以便能夠被搜尋

Q: Is there a META tag we can use to tell Google the geotarget (country) of a particular webpage?
在meta可否標示地區?

A: we don't have META geotargeting capability at this time.
沒有


要讓網頁能夠有地區或語文區分, 可參考
http://googlewebmastercentral.blogspot.com/2008/08/how-to-start-multilingual-site.html
http://googlewebmastercentral.blogspot.com/2007/10/better-geographic-choices-for.html
http://googlewebmastercentral.blogspot.com/2008/04/where-in-world-is-your-site.html

繼續閱讀"Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)



延續上一篇"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", 我們繼續來談其他問題...

Q: Do inbound links from other sites owned by the same company help or hurt rank? 自己公司的自我連結是否有益或有害於ranking?

A: I've see SEOs have 1000 or 2000 different domains and cross-link them. I definitely would not recommend that... if you run a sporting goods site, and you link to your sister companies for camping and tailgating equipment, that's good for the user...Put yourself in the user's seat, and do what makes sense for these links. Good luck! SEO式的胡亂連結並不推薦, 但合理的連結可以接受, 只要站在讀者的角度有意義的連結都算OK


最後那句Good luck...有點毛骨悚然吧, 有些好自為之的意涵, Google並非全然沒發現non-sense link, 只是要不要處理的問題, 如果被處理到...就全盤皆輸了...還是Good luck...保重吧, 合理的連結可以接受, 但是如果是無意義的大量連結就盡量避免吧

Q: Will Webmaster Tools ever give us an option to "disassociate" from sites that link to us? This feature exists in Yahoo's Site Explorer, but not Webmaster Tools. 是否在Webmaster Tools提供拒絕對方連結的功能?

A: So far because we work really hard to make it so that one site can't hurt another site, we haven't really offered this...So that's a challenge, and since we haven't seen a need for it yet, that's why we haven't offered it yet. 對方的連結並不會影響, 目前沒看出有這個需求


Google的演算法中, 他站的連結並無法去搞亂另外站台的ranking, 真的如此嗎?

Google的假設是壞站可能會連到好站, 但好站不會連到壞站, 但是如果你有透過交換連結, 你如何知道對方何時會變成壞站? 更多詳細內容, 我們後續再討論

Q: Does Google plan to let us see rankings/positions of keywords in the webmaster tool? 是否會在webmaster tool工具中, 可以查詢關鍵字的ranking?

A: We already do, for a limited number of keywords, in the "Top search queries" section of Webmaster Tools. While we generally don't comment on future features or plans, expanding this functionality is certainly an idea that's been suggested to us. 已經如此做了, 增強的功能也進行中


Google Webmaster Tool中的查詢關鍵字ranking, 目前功能並不完善, 顯示的排名也似乎與實際資料有落差

Q: Until recentley (the last six months or so) a high ranking was achievable by submitting articles to article directories (providing they were 40%-60% unique), it no longer seems to be the case. Have links from article sites been de-valued at all?
目前一些文章目錄網站的效果是否降低?

A: In my experience, not every article directory site is high-quality. Sometimes you see a ton of articles copied all over the place, and it's hard to even find original content on the site. The user experience for a lot of those article directory sites can be pretty bad too. So you'd see users landing on those sorts of pages have a bad experience.
If you're thinking of boosting your reputation and getting to be well-known, I might not start as the very first thing with an article directory. Sometimes it's nice to get to be known a little better before jumping in and submitting a ton of articles as the first thing.
有些文章目錄網站品質並不高, 並不建議利用文章目錄網站來提高曝光度


文章目錄網站品質不一, 所以在把文章丟到文章目錄網站前, 應先好好審視品質, 否則只是白費功夫, 但是優秀的文章目錄網站還是具有一定的效果

Q: For SEO, I'd like to improve my rankings by removing technical obstacles (starting with dynamic URL parameters), what are the most important site fixes to make and how can I document before and after success metrics using the Google Webmaster Tool?
如何有效找出網站技術缺失並修改?

A: To check the crawlability of your site, I would recommend crawling your site with a crawler like Xenu's Link Sleuth (freeware, for Windows). Doing that gives you a rough look at how search engines view your site and can point you towards areas where crawlers get stuck in a loop or start crawling duplicates based on the URL parameters.
應先了解搜尋機器如何抓取你的站台


以搜尋引擎的角度來審始自己的網站是很重要的, 可以利用Google工具或一些免費工具來看哪些抓取會有困難, 然後修正

Q: Are .gov and .edu back links still considered more "link juice" than the common back link?
如果有被政府或教育單位連接, 是否比一般連結有效?

A: This is a common misconception--you don't get any PageRank boost from having an .edu link or .gov link automatically.
沒有分別


常常有人認為被政府或教育單位連接, 其PageRank/SERP表現會更好, 其實不是, 只是可能因為能導入流量而引起效果, 與gov/edu並沒有直接關係

後續問題分析還有很多內容, 容後再續...繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月4日星期四

Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)



Google搜尋引擎真正的運作機制一直是一個黑盒子, 但在Live Chat Q&A當中, 可以透過一些對話來了解大家關心的重點及解答, 我們來研究這些對話並且解析出到底哪些才是搜尋引擎最佳化的真正核心問題...

Questions and answers from the third online Webmaster Chat from October 22, 2008記載了所有詳細的對話, 但是光是看這些對話只是一些公式化的官方回答, 我們一一來解析中間的奧妙
Q: What weight does the age of a site and the amount of time a domain is registered for have on it's search placement? 網域名稱的註冊時間與長短是否影響搜尋排名?

A: In the majority of cases, it actually doesn't matter ... I try never to rule a signal out completely, but I wouldn't obsess about it. 大部分情形, 這個因素並不太重要 ... 我認為沒有單一因素

從這個回答中, 我們可以知道網域名稱的註冊時間與長短是"其中"一個因素, 只是Matt Cutts認為還有許多因素互相影響...這有點廢話, 不過Matt Cutts並未否認網域名稱的註冊時間與長短的重要性就是了

網域名稱的註冊時間與長短是搜尋引擎最佳化的一個因素
Q: Recently, you removed this suggestion: "Submit your site to relevant directories such as the Open Directory Project and Yahoo!" from your guidelines. Is there any chance that you will be discounting these kinds of links for ranking value in future? 是否將網址送到開放目錄已經不再重要了?

A: There's always the chance that we'll discount directory links in the future...Right now we haven't changed how we're weighting directory links--we've only removed the directory suggestion from the webmaster guidelines. 以後一定會減低這些目錄的重要性, 但目前並未如此做

也就是將網址送到DMOZ等較有公信力的開放目錄還是有效果的
Q: Can you explain how the use of sub-domains helps / hurts a sites ranking? 次網域是否會減損或加強ranking?

A: Good question--do mean in terms of subdomains vs. subdirectories? Maybe we can talk through this one after the official presentations? 沒有正面回答

這個問題被評為好問題, 表示已經觸及了一些重點了, 到底是次網域好?還是子目錄好?哪個可以對於ranking有正面效果呢? 這篇文章"Advice on Subdomains vs. Subdirectories for SEO"可以參考, 以往sub-domain也許可以得到一些效果, 但現在sub-domain與sub-directory似乎已經具備相同效果, 但是有一點值得研究的是site-1.example.com與site-2.example.com到底算同一個site嗎?其ranking的分配與sub-directory如何取捨? 你可以參考以下文章

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory
Q: Since Google is against using ranking software (ie:WebCeO) to monitor SERP rankings, is there any plans on Google creating an approved, in-house rank check application that webmasters can use? Google是否會提供rank check軟體?

A: It's something that we've talked about. My concern is that sometimes people get too worried with paying attention to their "trophy phrase" and want to rank for that even if that's not the best phrase for them, or concentrating on one phrase to the exclusion of all the other stuff they rank for isn't the best idea. I think paying attention to server logs or analytics data gets you a really nice array of keywords that are practical to work on. But this is feedback that we've heard, and personally I think it would be nice if we offered this for some reasonable size of keywords. 回答得好長, 希望不要把重點放在ranking (廢話, 沒Google大家就不會計較ranking啦), 但是重點是可能會提供...以後吧

Google對於PageRank Checker大抵是不鼓勵、不反對, 當然最好的方式是使用Google Toolbar上的PageRank Display, 但因為還要安裝軟體, 所以並不是很方便, 我們提供的PageRank貼紙是一個不錯的選擇

而Google對於SERP的Ranking則是反對的態度, 不過有一些免費工具可以尋找SERP Ranking, 我們整理完後再陸續提供, 其他問題的解析, 我們後續也會繼續探討...

繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月28日星期五

BounceRate是否影響SERP?



在前文"What is bounce rate? 什麼是跳離率?"解釋了什麼是Bounce rate, 有些人翻譯成"彈跳率", 字面沒錯但是似乎不太傳神; 這個跳離率可以讓你知道某頁面無法引起讀者的閱讀慾望, 因此有人就用各種方式證明, Bounce Rate是影響Google SERP(Search Engine Results Page)的重要因素, 到底是否真的如此呢? 我們來研究看看...

許多SEO討論跟黑帽SEO網站都在探討Bounce Rate與SERP的關聯, 並且許多文章也都引用資料證明Bounce Rate影響SERP(由於文章直接或間接連到黑帽SEO網站, 我就不link啦), 雖然資料都對, 但是卻也有些倒果為因的狀況

這些文章舉例, 當頁面的Bounce Rate低時, SERP的表現就好, 因此認為有直接關聯, 這個說法有兩個問題:

1. 如果網頁沒有使用Google Analytics, Google如何知道Bounce Rate? 有Bounce Rate資料的網頁與沒有Bounce Rate資料的網頁, Google如何比較?

2. Bounce Rate低的網頁, 表示對於讀者來講有閱讀誘因, 也就是質量好, 質量好的網頁具有好的SERP, 並不能代表Bounce Rate就是Google Ranking的因素, 也就是Bounce rate是果而非因


Google SERP的演算法確實已經從網站間的評分(PageRank,Backlink...)慢慢加入讀者間的評分(traffic,click,bounce rate...), 但是想用人為的因素來影響讀者間的評分是很難的, 除非你有無數的IP與無數的人力

BounceRate是否影響SERP? 答案是Yes and No

Yes是說讀者對某網頁的喜好會造成各種Bounce rate數據, Bounce rate低的就會有較好的SERP

No是說Bounce rate不是左右SERP的前因, 影響Bounce rate之前的因素才是重要因素

Bounce Rate是改善網頁的重要指標, 讓你可以知道哪些頁面無法誘使讀者繼續閱讀, 進而修改內容與配置, 但那不是為了獲得更好的SERP, 而是為了加強網頁的品質

也許哪一天Google完全掌握了Client端, 也就是Google Chrome佔領瀏覽軟體市場, 可能Bounce Rate就可以當成決定SERP的重要因素, 但至少現在還不是, Bounce rate只是眾多因素導致的結果, 而這個結果與SERP表現剛好一致而已

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月21日星期五

Matt Cutts在2009年看到什麼?



Webpronews在這篇文章"What Google’s Matt Cutts Sees In 2009"中談到明年的SEO趨勢, 也就如同我們在昨天文章提過的"Personal search is coming : 個人化搜尋將全盤改變SEO", 由於Matt Cutts是大卡, 所以我們來看看他到底怎麼說的...

首先Matt被問到是否Ranking已經宣告死亡, Matt表示確實Ranking將不再如以往重要, 由真正經營內容來獲得流量與轉換率才是真正的重點, 以後將不能把Google SERP抓圖下來告訴別人說, 你看我的SERP表現如此突出了

還有一句話很值得分析, Matt說: "...in 2009 you can't just think of yourself as an SEO", 沒有人能夠說他是SEO, 廣義來說大家都是SEO, 專注在自己Content的SEO, 也就是本網一直在宣導的"內容為王", "SEO : Honesty is the best policy (誠實是SEO最佳策略)"

沒有優良內容的空洞網站將面臨SEO空前浩劫

Matt表示 "SEOs are starting to embrace the fact that they are marketers. It's a broader spectrum. You have to think about how you build buzz, how do you get loyal customers, how do you optimize your ROI. All those different things and that can include how do I make good videos, do I have a book, things like that."


2009年以後, SEO已經不是以往的SEO, 應該變化成行銷者而非單純的技術工匠, 只靠黑帽式的網路技術已經無法生存, 必須整體思考如何建置一個吸引人的網站, 並且經營客戶的向心力, 將投資變成營收, Matt亦表示, 往後Google將可以處理所有的多媒體檔案, 如Flash、Video, 檔案中的文字內容將都可以搜尋得到

總之回歸網站的最初起點: 內容, 是往後應該專注的目標, 正正當當的組織自己的網站, 搜尋引擎自然會把最好的內容呈現給所有讀者...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月19日星期三

Personal search is coming : 個人化搜尋將全盤改變SEO



各位不知是否在近期的Google Search上發現SERP有異於往常的結果? 第一個是Google Dance的頻率較為頻繁, 第二個是在不同的電腦搜尋可能出現不同的SERP, 這就是我們在之前文章"Search Engine Optimization 六大心法", "SEO觀點 : SEO面對的是巨變的環境"都提過的, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

Bruce ClayPubCon上提出了他的看法, 認為明年第一季Google的搜尋技術將有重大的改變, 這個改變就是個人化的搜尋, 而此改變將連帶影響SEO的技術

語意搜尋(Semantic Search)尚未完全成熟前, 個人化搜尋 (Personalized Search)是改善搜尋的一個方式, 也就是您的IP, Cookie以及搜尋歷史資料來決定SERP, 當使用"java"來搜尋時, 有可能是要尋找程式資源, 可能是要尋找渡假資料, 也可能是要尋找咖啡資料, 若使用目前的ranking方式, 並無法讓使用者快速找到訊息, 因此讓不同的SERP出現在使用者面前, 是Google明年即將進行的大工程

這個變革將改變了什麼? Pagerank不再只以backlink為主要依據, 因此黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌

除了個人化搜尋之外, Google在明年還將有其他重大技術改革, 因此持續觀察並調整策略是SEO的重要課題, 在明年結束前應該就會有確定的答案, 如果無法隨時跟上Google或其他搜尋業者的腳步, 可能就會在這波趨勢上滅頂...

參考: System and method for providing preferred language ordering of search results

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月10日星期一

什麼是Google Dance?


Google也會跳舞? Google Dance指的是當Google進行更新各個資料中心的資料時, 在不同的資料中心所搜尋到的SERP(Search Engine Results Page)會上下跳動, 所以稱之為Google Dance...

我們在"Google資料中心的秘密"已經提過Google在全球各地的資料中心架構, 也在"SEO笑話 : 買相機請到阿呆照相機器材行"說到SERP的在地化問題

Google在每年會進行數次的Google Dance, 有人說一年約十次, 但其實是不太確定的說法, 到底有幾次也並不是太重要, 在這些更新行動中, indexing/backlink/pagerank會做最新的更新到各個資料中心, 其結果就是影響了SERP, SEOCHAT Google Dance Tool可以觀察這個更新

如果某個關鍵字的SERP在各不同的資料中心排名不同時, 就顯示Google正在Dance當中, 這個動作會持續數天的時間, 不過據觀察Google Dance的頻繁度越來越高, 可能與整個效能增加有關, 已經不太像一年只有十次

除了效能增加的因素外, 整個網路的資料量變大, 更新更頻繁也有關係, 如果Google不更頻繁的更新, 也不會有我們之前在文章提到的"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP", 所以也許Google Dance的大跳舞是一年數次(global update), 但是小跳舞(local update)卻是每個時間點都在劇烈的進行著, 等小跳舞到一個地步就來個真正的Google Dance...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月7日星期五

SEO觀點 : SEO面對的是巨變的環境



如果您看過美式足球, 一定曾經被足球比賽的多變所震憾過, 一場比賽沒有到結束前, 沒人知道哪個隊伍是最後贏家, 因為任何時刻都是關鍵, 差之毫釐沒有抓到球或是沒有攔到對手, 都可能翻轉整場的勝負

教練必須在各種瞬息萬變的狀況下隨時調整策略, 以應付當時的情勢, 而所有現場的反射動作都是平常多年累積下來的經驗結晶, SEO(Search Engine Optimization)也是如此, 沒有絕對不變的真理, 只有隨著整個網路生態與技術的推移逐步調整出最好的步伐...

決定SEO巨變的環境有幾個因素: 搜尋業者的生態、搜尋技術的演進、整體網站的生態、網站技術的演進

以上生態與技術的觀察就是維持SEO策略精準的重要因素

因此如果對於整個生態與技術的錯誤評估, 就會造成錯誤SEO策略的開始, 所以SEO並沒有不能公開的秘密, 因為我在"網站優化是一個既科技又藝術的大工程"提到過-各種時空背景的因素讓網站優化變成一門很容易入門, 但是很難出師的課程

技術公開不代表就能被全盤取走, 沒有公開的技術在沒多久就可能變成一文不值的技倆

這裡說的"網站優化"當然包括了SEO(Search Engine Optimization), 所以SEO也是容易入門但很難出師

如果SEO專家一疏於研究, 沒多久就會被淘汰, 所以真不是人幹的行業

什麼是"搜尋業者的生態"? 就是Google、Yahoo、Microsoft等業者的分分合合、起起落落, 前陣子Google確定不跟Yahoo廣告合作後, Yahoo開始對Microsoft拋媚眼, 如果真的某一家被併購, 以前針對某個search engine的優化就可能付諸流水或降低成效, 但如果不針對某個search engine, 優化效果又可能不盡人意, 故需隨時注意各種生態風向而機動調整

什麼是"搜尋技術的演進"? 就是PageRank、BrowseRank...等等演算法的修正, 會直接影響優化的成果, 要看緊搜尋技術的演進是最累人的, 因為這些演進不會公開, 只能由各種學術論文去預測走向, 由各大外國網站瞭解蛛絲馬跡, 並且透過實際作業來驗證, 目前就有許多研究顯示: 對於backlink的分析已經有許多不同以往的成果, 只是不知何時會被正式納入

而整體網站的生態、網站技術的演進就比較容易觀察, 我們的文章也一直在談這些範圍

因此SEO專家必須如球場上的教練一樣, 所有判斷的反射動作都必須靠多年累積下來的經驗結晶來產生, 容易入門但很難出師的情況, 讓許多對於SEO有興趣的人常常覺得似乎學了很多, 但又好像沒真的學到什麼, 只能逐步慢慢培養, 好在SEO的場子上面對巨變的環境...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月17日星期五

SEO觀點 : 我們都是白老鼠



不知道各位有沒有看過實驗室的白老鼠? 當我們在實驗室裝置迷宮, 然後把白老鼠放進迷宮中, 我們就可以在多次實驗中瞭解老鼠對於各種環境的反應, 如上圖的白老鼠勇闖迷宮, 完全沒有依照實驗設計的情況, 在現實中大概不會發生, 而我們網路使用者在這個被設計好的網路規則中, 就如同一隻隻白老鼠

... 前進 ... 向左 ... 向右


還記得小時候曾經把白老鼠放在障礙物中, 看它是否能夠順利的吃到食物, 不然就在一群螞蟻中用手沾水, 在螞蟻四週畫上路線, 看螞蟻如何走出水路...

而我們現在不知不覺中也變成了一隻隻白老鼠或是螞蟻

在大型網路業者操控之下, 在網路中自以為老大的走著, 卻不知所有的反應都變成一串資料, 背後的更大的老大正分析著資料, 決定是否在某個角落再放一塊乳酪

如果有任何一隻老鼠想要破壞規定, 則會被抓起來 ... 讓它沒有乳酪可以吃

當然這些白老鼠也不是純然一無所獲, 它們可以不必在垃圾堆中找食物, 不必擔心路上被獵食者追捕, 只需要乖乖的配合實驗, 自然可以吃到香噴噴的乳酪, 只是能夠吃到什麼時候不知道

能吃就是福, 先吃再說 ...

一堆文字與圖片充實了各個部落格與相簿服務網站, 一個個如免費的主編替他們賣命, 一個個漂亮帥氣、或者恐龍嘔心的模特兒搔首弄姿的免費出賣自己...的相片, 就這樣堆起了無名、天空 ... 所引起的利潤就是給你更大的空間, 讓你更賣命的付出

想要分贓? 門都沒有!

而Google與Yahoo等搜尋業者則站在更高的位置, 把這些你我貢獻的資料加以排列組合, 遵守規則的就讓你參加遊戲, 不遵守規則的則把你把你打入地獄, 表現良好的就讓你出列曝光, 表現差的就把你擺在一邊思過

然後整個遊戲中自行準備食物與水壺

所有買票入場的企業則在旁觀賞然後見機掠奪遊戲者的物品, 門票收入則大部分歸老大所有, 小部分則施捨給遊戲者去買零食, 當然還是得向企業購買, 最後金流又回籠 ...

這個就是網路遊戲規則, 也是實體世界的寫照



哈哈, 寫完了 ... 該回到迷宮去排隊了 ... 等等啦

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO觀點 : Google Analytics & PageRank



對於免費提供給網站站長使用Google Analytics, 到底Google打什麼如意算盤? 其背後的目的早已經被許多人懷疑, 因為這些工具在一般的網路公司都非屬於免費服務, 使用或不使用Google Analytics對於PageRank或SERP是否有任何影響?

Google在近年推出許多大部頭的免費服務, 當然天下沒有白吃的午餐, 既然是免費的, Google當然希望從中取得除了金錢之外的東西, 或者從third party取得其他的利益

這兩篇文章就談到了這些議題:

Why Google Analytics might be bad for your PageRank
Google's Gain in Google Analytics

Google在提供Analytics的背後獲得了什麼?

(1)了解網站的流量/來源, 這些資料就成了分析線上廣告的最好資料
(2)透過這些資料可以精準的定義PageRank, 讓SERP更加符合使用者需求

這兩項資料是所有網路業者夢寐以求的, 而Google就是具有先天優勢來取得, 目前Yahoo正朝著同樣的方向前進

因此, 如果您的網站並非大流量, 而您正在進行系列的SEO作業, 就必須思考是否要使用Google Analytics, 因為可能會曝露您網站的缺點, 如果您的網站流量不小, 那就趕緊使用Google Analytics, 讓您的PageRank/SERP更符合實際狀況

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月13日星期一

網路是一個大糞坑? Internet is a Cesspool?

"網路是一個大糞坑 - Internet is a Cesspool", 這句話說得真...坦白, 說這話的人不是別人, 他正是Google的CEO Eric Schmidt, 他為何會這麼說呢? 這句話的背後代表了什麼意義呢 ...

如果其他人說網路是一個大糞坑, 可能還不太算數, 但是如果Google的CEO說的, 這就有點值得來探討一下了

Cesspool是啥?
cesspool [美] [ˈsɛsˌpul] [英] [ˈsesˌpuːl]
污水坑;糞坑;污穢場所

Eric SchmidtEric Schmidt在上週二與雜誌負責人見面時說: "The internet is fast becoming a "cesspool" where false information thrives"...

因為太多的爛資訊讓網際網路已經快速變成一個大糞坑...


說這句話的意思跟我之前文章的意思很類似, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

如果真的如Eric說的, 那Google的Data Center真是"大便處理中心"了....

想像一下這個場景:

在Google的辦公室, 剛喝完下午茶, 兩位工程師正閒聊著 ...

"你猜, 昨天那個傢伙又用程式產生了幾篇完全無意義的內容?"

"哦, 又來啦 ... 大不了幾千篇吧?"

"你猜錯了...這回這傢伙可能很下心來幹了, 竟然產生了十幾萬頁的內容..."


這種類似的對話, 可能在Google是一些茶餘飯後的笑話, 如果您對SEO稍有瞭解, 應該也常會發現種種另人噴飯的作法, 我就常看到本站文章常被竄改成為別站的文章, 更好笑的是刪除某些相關聯結會讓讀者滿頭霧水

這些胡扯產生的內容或連結就是Eric所說的cesspool ...

Google的CEO Eric Schmidt說這句話當然有某些程度上有其背後的目的, 因為他講話的對象是雜誌的重要人士

他認為這些實體內容與Google是天生的夥伴, Google讓實體內容在網路上可以搜尋得到, 並且由於這些實體企業的品牌讓讀者信賴...但是他沒說因為網路上的內容讓實體雜誌失去利潤, 是否會讓有品質的內容逐漸減少?

不產生內容的Google大賺其錢, 卻讓產生內容的雜誌報紙苦撐, search engine的演算法讓網路變成是一個大糞坑, 讀者必須在大糞坑中撈有價值的鑽石, 其實是很無奈的一件事

內容產生者如何產生利潤? search engine如何避免讓internet變成cesspool? 讀者如何在cesspool中辨識鑽石? 這些問題實在很難有一個簡單的答案

這些問題的現象其實就是"你在看誰的部落格?"的作者Andrew的憂心, 要在這些網路亂像中生存只有兩個方向: 內容產生者要著重經營品牌, 而透過Google的機置應該回饋利潤給內容產生者

Eric Schmidt提到了品牌的經營, 但沒有說到如何回饋利潤 .... 高招

在回饋利潤尚未有定論前, 內容產生者只能努力的先經營品牌, 靠著各種廣告機置來貼補成本, 不過話說回來廣告機置又被search engine的關鍵字與Google Adsense瓜分了大半, 內容產生者就只能走一步算一步了

網路是一個大糞坑? Internet is a Cesspool? 確實是如此, 產生有品質內容的業者被淹沒在糞坑中, 讀者每天在糞坑中打滾, 而利潤都跑到處理糞便的大型糞便處理中心了

參考資料 : http://adage.com/mediaworks/article?article_id=131569

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月1日星期三

SEO策略: PR5+PR4=PR6?

許多網站會碰到一個類似的網址問題, 就是網址前面有無WWW都可以連到同樣的站台, 更有些網站使用多個網址指向同一個站台, 當這樣的狀況產生時對於網頁的評分,backlink的計算及SERP的結果到底有哪些影響呢?

有些專家指出, 若您有兩個網址(如www.dns.com.tw與dns.com.tw)都指向同一個網站, 而其PR各為5與4的話, 如果您把這兩個整合為一, 將可獲得一個PR6的站台...真的假的?

我們實際測試的結果, 答案是否定的, 但是 ... 裡面還有許多值得思考的地方

不同網址指向同一個網站, 有幾種情況:

(1)使用DNS Server的A Record或CNAME來指向同一個Server(IP), 並在Apache或IIS設定允許該URL(或沒設定禁止, 當然太開放會引發另外問題, 他文再談)

如果該Server有www.dns.com.tw/blog, 則也有dns.com.tw/blog, 或有www.another-domain-name.com/blog

(2)使用DNS Cloaking Redirect來轉址

當使用虛擬主機與third party DNS Service時, 可能就無法使用DNS Server的A Record或CNAME來指向同一個Server(IP), 這時候DNS Cloaking Redirect就可能被使用

(3)使用302 Redirect與301 Redirect, 及meta refresh

302 Redirect又有on-domain/off-domain之分

所謂on-domain 302 Redirect例如將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.dns.com.tw/prog1, 或反向轉

off-domain 302 Redirect則是將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.another-domain-name.com, 或反向轉

301 Redirect與302 Redirect的分別是: 301 Redirect為"永久轉址", 302 Redirect為"暫時轉址", 兩者對使用者沒有差別, 但是對於search engine的差別是, 被301 Redirect的page就不被index

如http://athletics.mlb.com被302 Redirect到http://oakland.athletics.mlb.com/index.jsp?c_id=oak, 如果您使用"oakland a’s"當關鍵字在Google Search, 會看到athletics.mlb.com

根據Yahoo與Google的文件, 說明基本原則如下

Yahoo在處理301,302,meta refresh上, 其處理方式為:

- 使用301, 302由domain A->domain B, 則index domain B
- 使用302由domain A URL->domain A其他URL, 則index前者
- 使用301由domain A URL->domain A其他URL, 則index較上層的URL
- Yahoo處理meta refresh為301 redirect

Google在處理301,302,meta refresh上, 其處理方式為:

- Google處理meta refresh為302 redirect
- 使用302 redirect, 則index source, 也就是index來源頁
- 使用301 redirect, 則index destination, 也就是index目的頁

但實際上, Google可能會處理off-domain 302 Redirect與301 Redirect為相同, 也就是URL A->URL B的話, URL A就不index, 而以URL B為目標

因此這麼多的狀況下, PR與backlink的轉移就不是redirect就會轉嫁, 不同的search engine在處理這些問題上也有不同的作法, 所以PR5+PR4=PR6? 答案是Yes and NO, 必須以長期與短期效益來仔細分析才能獲得最佳狀態

參考工具: Redirect Checker

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月27日星期六

Google PageRank 於9/27陸續更新

上次最近的Google PageRank Update在2008/7/24左右, 當時本部落格由零變四, 現在Google的各Data Center又陸續開始更新PageRank, 目前看到本部落格內頁的PR部分已經由零到三, 是否最後更新會有什麼驚喜...

Google每次更新PageRank都會造成不小的震盪, 如去年對於paid link的處罰, 讓許多大站都應聲倒地, 甚至於還有一些重量級人士說要出來抗議抵制, 最後都是沒有下文

本站也是無辜受到牽連, PR由五被降到三, 原因也是被Google判定為銷售link, 後來經過說明後Google又將本站PR調回原值, 因此不管是PR升值或降值, 其實一定有許多都可能與事實不符的情事

也曾經看到許多網站在某些SERP的表現優秀, 但一經檢驗就發現許多黑帽SEO的證明, 有些明明內容精彩卻又排在SERP非常後面的位置, Google的演算法顯然還有很多不完善的地方

但是不管如何, 大家就靜候PageRank的最後更新結果吧, 預計應該在幾天到一週的時間會完成所有更新

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月26日星期五

什麼是PageRank Hijack?

顧名思義"PageRank Hijack"就是PageRank綁架, 也就是所謂的Fake PageRank

再說清楚一些就是利用黑帽方式來欺騙search engine, 在PageRank的評分上創造出假的數值

例如您手上有一個網域your-domain-name.com, 原本站台www.your-domain-name.com其PageRank為零, 但利用search engine的演算法漏洞, 把www.your-domain-name.com快速提升到零以上

這樣的手法有何目的? 我們如何辨別Hijacked PageRank或Fake PageRank?

在說明整個內容之前, 我先舉一個發生在今年七八月間的實例 (詳細人名等資料就不公開)

話說有一個可能缺錢缺到發慌的人, 他去註冊一個過期的網域名稱 (Domain Name), 這個網域名稱在2002年到2005年被使用, 2005年三月之後就不再營運, 後來就被這位仁兄在2008年七月註冊起來, 他利用URL Redirect的方式把該URL的PageRank造假到PR=7, 剛好因為Google PR Update在2008年七月底左右進行全面更新, 所以這位仁兄很快就讓該URL達到PR7, 在短短幾天就讓他幸運的把PR0->PR7, 還在網路引起許多不熟悉search engine的人稱羨

透過URL Redirect到別人的網站後, 等待Google PR Update後, 再把URL Redirect回自己的網站, 此時就看似擁有一個高PR的網站, 目的就是要高價銷售網域名稱

這位仁兄得逞之後, 在DNForum就張貼廣告開始大吹特吹, 說他有一個特好的網域名稱要割愛, 結果被DNForum的專業級人士吐槽

為什麼會被吐槽? 因為手法太兩光了, 兩光在哪裡?

(1)對search engine有點了解的人都知道, PR0->PR7在不到一個月的時間完成是不可能的
(2)Google在2005年以後已經修改演算法在處理PageRank Hijack的問題
(3)Wayback Machine可以把網站歷程記錄, 該網站中間兩年斷掉, 不可能快速恢復PR
(4)使用Google搜尋技巧就可以破解Fake PageRank

雖然網路上有一些PageRank Validation Tool, 但大多不好用, 其實Google本身就可以確認(如下)

在輸入欄打入 info:URL-to-Check

URL-to-Check就是指要查詢的URL



如果經上面方式查不到資料或上圖中的(1)(2)的URL不是同一個, 就是經過URL Redirect, 而URL 2的PageRank就會被URL 1所綁架

但是因為Google演算法的改版後, 已經對Fake PageRank做篩選, 因此URL Redirect並不保證能夠綁架PageRank

也就是說, URL Redirect不一定能綁架PageRank, 就算你綁架了別人的PageRank, 也會輕易的被辨識出來

況且當綁架別人網站的PageRank後, 等於向search engine說你的網站是不存在的, 因此所有內容就不會被index

最後一句話

好好做人, 不要使用詐欺的手段來造假, 魔高一尺 ... 道高一丈

後續再找時間來聊Fake PageRank Detecting Algorithm ...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月25日星期四

Google 10的100次方:Google Project 10 to The 100


Google為了慶祝歡度10周年, 特別推出Project 10 to The 100, 也就是希望這個十週年能夠有100次方這麼長久且威力強大的大未來, Google在昨天表示"We know there are countless brilliant ideas that need funding and support to come to fruition."(我們知道有無數的聰明的主意需要資金來讓他實現)

"我們投入了美金 $ 1000 萬元的資金,用來執行這些計劃,並希望儘可能讓更多人受惠。資金只是一塊跳板,創意才是整個活動的靈魂。"

例如Hippo Water Roller, 將傳統在落後地方的運水方式稍加改變, 使得他們運水不再傷害身體, 這種改變就是一種值得回饋的發明

您也可以在十月20日前登上Google Project 10 to The 100, 發表您的妙點子, 但您必須回答六個問題, 例如"如果您的主意被實現, 脽最能夠受惠?"

這項專案主要的範圍包含

社群團體:如何讓人們的聯繫更緊密、建立社群並保護特殊文化?
生活機會:如何協助人們及他們的家人過更穩定的生活?
能源需求:如何讓大眾使用安全、乾淨又便宜的能源呢?
環境保護:如何喚起全民共識,一同打造更乾淨的永續全球生態系統?
衛生保健:如何才能讓人們活得更長壽、更健康?
教育課題:如何讓更多人享受更完善的教育資源?
平安生活:如何維護社會安寧,讓大家都能安居樂業?
其他議題:某些好創意是不能用類別來限定的。上述範圍之外的創作就歸在這個部分下。

評分標準則是

影響力:這個創意能讓多少人受惠?
深度:這個創意能造成的影響有多深?議題的嚴重性和迫切程度又有多高?
執行度:這個創意可能在一、兩年之內化為實際行動嗎?
效益:創意是否實作簡易的同時兼具成本效益?
持續度:創意的影響力能有多深遠?

Google的這個點子徵求的活動, 將在十月20日截止, 肯定不會像之前人事行政局的"尋求公務人員拼經濟良方"如此玩笑的, 請大家動作快囉!

標籤:

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月24日星期三

SEO : How Google Handle Duplicate Content? (Google如何處理重複內容)

在網路上尋找資料時, 經常發現重複或近似內容, 有些是splog造成, 有些是惡意的SEO動作, 有些則是有其必要的原因, 在Google關於重複內容的說明文件中, 指出:

非惡意的重複內容可能包括:
-可針對行動裝置產生的一般網頁和精簡網頁的討論區
-透過不同的URL儲存顯示或連結的項目
-列印用網頁

但在某些情況下,有心人士會故意在整個網域中重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。 這種欺騙的做法會帶來不好的使用經驗,因為訪客會在搜尋結果中看到大量相同的內容。

Search engine到底如何處理重複內容? 如何才能避免因重複內容而導致處罰?

我們先來看看幾個檢查重複內容的網路服務:

http://www.webconfs.com/similar-page-checker.php
http://tool.motoricerca.info/similarity-analyzer.phtml

當然以上只是初淺的查詢, 並非search engine所依靠的方式, 到底Google如何確定兩個網頁是重複的呢?

根據Google的專利資料"Methods and apparatus for estimating similarity", "Detecting duplicate and near-duplicate files" :

A similarity engine generates compact representations of objects called sketches. Sketches of different objects can be compared to determine the similarity between the two objects. The sketch for an object may be generated by creating a vector corresponding to the object, where each coordinate of the vector is associated with a corresponding weight. The weight associated with each coordinate in the vector is multiplied by a predetermined hashing vector to generate a product vector, and the product vectors are summed. The similarity engine may then generate a compact representation of the object based on the summed product vector.

就是透過由文件形成vector, 再由hashing function產生的值, 與vector相乘後總合, 由這些總合後就變成sketch, 來比較這些sketch求得重複程度

在這篇研究文章中"Detecting Near Duplicates for Web Crawling(PDF)", 使用Charikar's simhash將高維的向量轉成f-bit fingerprint

這篇論文也指出, 辨識重複資料的目的:

(1)減少search engine在處理重複資料的空間浪費與計算浪費
(2)可以比對找出散佈在各地的類似新聞, 形成相關連的叢集(cluster)
(3)利用檢查結構類似, 可以用來淬取資料
(4)用來檢查文章的盜用(plagiarism)及垃圾網站(spam)
(5)用來檢查文章的改版

如Google所說的, 重複資料不是都屬於黑帽SEO, 有其必要性, 但是還是必須小心參考Google關於重複內容的說明文件, 好好審視您的網頁的重複狀況, 因為判斷重複內容的技術越來越精準, 事先避免才能保持與search engine的友好關係

以下是影片的說明:
Getting Serious, Series 1: Avoiding Duplicate Content


Do You Have Duplicate Content and Not Even Know It?


其他參考資料:
http://www.seobythesea.com/?p=999
http://www.vizioninteractive.com/search-engine-optimization-tip-14-fix-duplicate-content/
http://www.searchenginejournal.com/duplicate-content-penalty-how-to-lose-google-ranking-fast/1886/

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

正妹與SEO


上圖是兩個網站的Alexa Reach比較圖, 至於是哪兩個網站並不是重點, 就不說明了, 紅色線是某個人氣頗盛的部落格, 藍色線是專門貼正妹照片的網站, 前者寫了半天卻在流量上輸給掠人之美的養眼網站, 就投資報酬率來說, 真是氣死人吧 ...

正妹現象是一個全球的狀況, 拜數位相機普及之賜又讓正妹自拍多了一個展露自信的好工具, 也讓男性動物滿足了偷窺的欲望

在去年的新聞裡"網路自拍研究"引起不少的轟動, 因為論文中轉載多到不行的女性自拍照片, 其中甚至還有不少三點全露的畫面, 蠻好奇當教授在審查這篇論文時候, 不知有無任何生理反應? 還是心中充滿道德淪喪的悲哀?

在YouTube中一個影片"What you Learn from Porn", 更是把色情網站詮釋得令人噴飯


另外一篇"Facts about Internet Porn", 更是舉了一些數據 (數據來源,正確性僅供參考)

(1)San Fernando Valley is the porn capital of the world.
(2)12% of all websites are pornographic
(3)25% of all search engine requests are pornographic
(4)35% of all Internet downloads are pornographic in nature
(5)Every second 28258 Internet users are viewing pornography
(6)Every second $ 89.00 are spent on Internet porn
(7)Every day 266 new porn sites appear on the Internet
(8)Sex is the most searched word on the Internet
(9)U.S. Revenue from Internet porn in 2006 $ 2.84 Billion
(10)72% of Internet porn users are men
(11)28% of Internet porn users are women
(12)70% of Internet porn traffic occurs during the 9-5 workday
(13)There are an estimated 372 Million porn web pages
--- 3% produced by the UK
--- 4% produced by Germany
--- 89% produced by the US
(14)Most trafficked adult website: Adultfriendfinder.com
(15)Countries that ban pornography: Saudi Arabia, Iran, Bahrain, Egypt, UAE, Kuwait, Malaysia, Indonesia, Singapore, Kenya, India, Cuba, China (China好像不該入列吧...)
(16)Most visited websites daily:
--- 1. MSN.com: 220 Million visits
--- 4. Youtube.com: 196 Million visits
--- 49. Adultfriendfinder.com: 7.2 Million visits
--- 145. Nytimes.com: 4.1 Million visits
(17)3,412 people visit Kellemarie.com daily

以上這些資料顯示了一個重點: 美女經濟的可怕

所以...有些台灣大型入口網站是以網路情色媒體起家, 許多大站更是把美女自拍當成金雞母

更有人想用美女照片要來賺Adsense的錢 ... 不過大都無功而返, 因為一些porn keyword (如正妹/自拍...)一搜尋下去, 顯示的是上億的資料頁, 因此這些網站在網路行銷上大多費盡心思, 不過倒是有人拒絕為這類網站進行SEO ...

我們從這些正妹現象裡可以觀察到這些網站的一些特性:照片美、內容豐、更新快、找得到, 更重要的是...就是提供您想看的

這些特性對照一般網站, 以SEO的觀點來看:

(1)您的網站提供網友真正需要的內容嗎?
(2)您的網站提供的內容真的高品質嗎?
(3)您的網站提供的內容量夠嗎?
(4)您的網站提供的內容更新夠快嗎?
(5)您的網站能讓網友快速找到或快速散播嗎?

雖然一般網站很難有太多令人難以抗拒的內容, 以上的幾點也是應該努力的目標

本篇文章瞎扯半天, 把正妹與SEO扯在一起, 其實也是在進行一項實驗 .... 等實驗結果出爐再公告結果

[後記:實驗結果]

沒有想到剛貼文出去, 以"正妹"當keyword, Google Blog Search顯示共有一百四十幾萬筆資料:


但是以Google Search, 當然沒有出現 ...

當然以上結果會很快被後續文章刷新, 但是這個結果顯示了:

(1)新鮮度與主題主宰了Google Blog Search的結果
(2)TrustRank影響是否被Google Blog Search快速抓取
(3)其他影響SERP的因素在Google Blog Search並不明顯

其他後續Google Blog Search的觀察, 再擇期說明了 ... 看正妹照片去了! 呵呵!!


[補記:實驗結果 2008.09.25]

後來發現剛刊登的文章, 在數秒之隔就出現在Google Blog Search ... 怎麼可能呢? 後來觀察後終於明白 ...

因為本部落格使用Blogger For Domain, 原來Google並非來抓取資料到Google Blog Search, 而是我自投羅網, 我送出資料時其實已把資料丟到Google (Blogger就是Google的啊!)

所以如果使用Blogger的服務, 不管是Blogger For Domain或是刊在Blogspot, 都有快速被抓取查詢的優勢, 而其他部落格就只能等Google定期的抓取了

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月22日星期一

SEO與Google網誌搜尋 (續)

經上個星期的文章"SEO與Google網誌搜尋"與本週的資料比對顯示, Google的blog search更新速度實在快速, 可以搜尋到最新的部落格文章, 如果更新速度不夠快, 會很快的被他頁面排擠下去, 剛剛的文章"SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗"幾乎剛刊登就同步被Google抓取 ...

剛剛才寫完的文章就被Google抓在第一名, 但會因時間被更新的文章往後推(如下)


而更重要的是, 頁面title的文字就是被抓取當keyword的重要依據, 如此被顯示在blog search第一位置, 就能夠快速增加被搜尋的可能與點選率, 這也就是網頁的更新度為何會影響SERP結果的重要因素之一

也許有些人會質疑, 為何我的部落格也是更新很快, 也都注意使用清楚的title, 為何都不出現在blog search中呢? 這些問題容後慢慢再告訴您, 其實答案已經都在本部落格中了, 只是我尚未清楚整理出來, 如果您等不及想要找出答案, 就請先看看本部落個的SEO系列文章吧 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗

當您在網頁上瀏覽資料時, 眼光到底聚焦在什麼地方, 一直是科學家有興趣的題目, 如果能夠統計出一個可靠的資訊, 不僅對網路廣告商是一大福音, 對於研究SEO的人也可以有不少的助益, 我們就來研究看看這些結果與您的習慣有哪些差異 ...

這篇"Distribution of Clicks on Google’s SERPs"文章, 實驗認為網路搜尋結果(SERP, Search Engine Results Page)的前幾個項目(約是第一到第三名)會佔用大部分的目光, 依序往後遞減, 但最後一個項目卻反常的會被瀏覽者注目, 而在點選率而言, 中間部分項目(第七項)的點選大多在瀏覽整頁後才進行點選

當然以上的數據一定會有差池, 但是說明了一個趨勢:

-- 排名在SERP頁面的前三名, 被注目的比例較高
-- 排名在SERP頁面的中段, 反而會在最後才被點選

其實以上數據還牽涉到顯示項目的Title與Description, 大部分人瀏覽SERP時, 會先看Title, 在螢幕上可以看到的Title看完, 再往下滑(Scroll)看其他內容, 有些情況看到該Title剛好就是您要的就進行Click, 如果Title不太清楚, 再去讀Description, 而上面的趨勢顯示的是: 大家都不太有耐心, 因此看完前幾項就會往下滑, 至於是否能夠概括所有使用者行為, 就見仁見智了 ...

另外一個Eye Tracking的研究是Microsoft的"An eye-tracking study of information usage in Web search:Variations in target position and contextual snippet length", 這個研究與上述結果大同小異, 也是SERP前幾項較容易被注意, 但稍有不同的是實驗顯示, Description太短的比較不會被點選, 而另一個特別的是"第七項" ...

當SERP頁面被來回瀏覽後, 第七項目被點選的機率又逐漸高出後面項目, 真的是Lucky Seven ...

另外一篇"F-Shaped Pattern For Reading Web Content"則研究不同類型的網頁, 來看使用者目光的聚焦度, 該研究認為使用者在瀏覽網頁時會因網頁類別的不同而有差異

網友在瀏覽一般文章與電子商務內容時會有呈現類似"F"形狀的聚焦(如下圖1,2), 而瀏覽網路查詢頁面時會呈現"E"形狀的聚焦(如下圖3), 所以使用者幾乎不太觀看一般文章與電子商務內容的下半部, 但網路查詢頁面(SERP)反而是中間部分常會被忽略, 這個結果與上兩個實驗有異曲同工之妙

(圖1)


(圖2)


(圖3)


這篇"Google’s Golden Triangle"也提及類似的聚焦結果, 不過這種結果似乎不同年代會或多或少有差異, 如這篇在2005年與2008年的資料顯示, 使用者越來越沒耐心看完所有資料了 ...

這篇"Eye tracking and online search: Lessons learned and challenges ahead"更具體的說明了一些數字, 96%的查詢結果, 只有第一頁會被瀏覽, 並且只有前幾個項目會被點選, 如果前幾個點選沒有意義, 則使用者會放棄該查詢結果, 並且在Google與Yahoo的搜尋行為分析中顯示, Google的使用者會花較多時間在閱讀查詢結果內容

最後總結是: SERP的結果如果不能在前三名, 倒不如列在該頁底部, 並且頁面的Title文字敘述應該更加清楚明瞭, 以增加被點選的機率


標籤: , , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月19日星期五

SEO的簡單數學問題

前幾天與朋友吃飯, 因為他經營鋼板生意, 閒聊中不免抱怨現在的景氣蕭條, 做生意越來越難賺錢, 因為跟他已經是多年的朋友, 因此大膽的問他現在營收如何? 利潤好不好? 他給了我ㄧ個出乎意料的答案 ...

他說雖然營業額已經上億, 但是利潤只有5%, 並且最近希望能夠請電腦公司變更網頁設計, 以及尋找更好用的ERP軟體

我不免計算了起來 ... 以最保守的估算

100,000,000 X 0.05 = 5,000,000

也就是扣除成本, 每年的收益有五百萬, 這樣的收益還不好, 大概很多人都要撞牆了, 但是這樣的營收與收益, 竟然沒有任何網路策略, 竟然還在找ERP軟體

我問他公司網頁有無進行SEO? 他回答 : 什麼是SEO?

所以可想而知, 他的生意都是一步一腳印用腿跑出來的, 網頁只是一個型錄, 沒有任何行銷的作用, 這也是一般中小企業的狀況, 因此我就簡單的介紹一下

以該公司經營類別來說, 他的關鍵字組合可能是:

stainless (Google每月平均搜尋量 8,100)
steel (Google每月平均搜尋量 33,100)
stainless steel (Google每月平均搜尋量 6,600)
不銹鋼 (Google每月平均搜尋量 22,200)
不鏽鋼 (Google每月平均搜尋量 27,100)
鋼板 (Google每月平均搜尋量 8,100)

所以如果以上的組合都能在SERP第一頁, 以上依照關鍵字不同其點擊成本在NT$6 ~ NT$45不等, 我們以NT$5來計算的話

8,100+33,100+6,600+22,200+27,100+8,100=105,200 平均每月曝光數目

以最保守估計1%會click進入, 105,200 X 5 X 0.01 = 526,000 X 0.01 = 5,260 (NT$)

也就是如果進行SEO達到效果的話, 每個月至少節省 NT$5,260 (每年至少節省NT$63,120), 當然都是以最保守估計, 如果再精算的話, 就可以知道SEO到底值多少錢了

如果點擊成本在NT$10, 5%會click進入, 每年就節省了NT$631,200, 如果點擊成本在NT$20, 10%會click進入, 每年就節省了上百萬的廣告開銷, 如果把Yahoo的效益也算進去, 您覺得該不該進行SEO?

其他更精確的討論, 來確認以上的數據來源, 後續再談了 ...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO與Google網誌搜尋

我們在之前文章談及"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP", 現在我們來驗證看看新鮮度與更新率對SERP的影響結果, 到底目前這個部落格的文章搜尋曝光度如何呢? 以下是一些結果, 並且當成資料, 以供後續對照 ...

我們進到Google的網誌搜尋, 打入"seo"得到以下結果, 並且我們後續來觀察SERP變化:

在三千多萬筆的搜尋結果下, seo這個關鍵字目前結果:


在二十多萬筆的搜尋結果下, serp這個關鍵字目前結果:


在一萬多筆的搜尋結果下, 網路行銷這個關鍵字目前結果:


(本站的資料都在第一個位置, 但以上資料可能因時間會有變動, 並且在Google Chrome browser無法顯示圖檔)

這個結果代表了幾個事實, 內容新鮮度影響SERP甚鉅, 以及在Google認定的blog範圍內, 談論SEO,SERP,網路行銷的繁體資料實在少得可憐

為何會有如此現象? 大概都把自己知道的內容暗幹起來, 不願意公開討論吧, 如果能夠把這個主題當成學術議題來看待, 如前文"SEO : Honesty is the best policy (誠實是SEO最佳策略)"所談的, 也許可以教育更多的企業主, 讓SEO成為大家重視的問題, 也能讓網路使用者真正搜尋到想要的資料 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月17日星期三

SEO : inception date的意義

所謂inception的意思是初始, inception date就是初始日期, 一個網頁文件的初始日期對SERP(Search Engine Results Page)的影響在前文已經討論過, 我們現在來看看Google如何決定網頁文件的inception date ...

根據Google的專利文件US 7,346,839 B2的說明, inception date由好幾個方式來決定

(1)由搜尋引擎抓到該網頁文件的日期
(2)由該網頁文件所在domain之註冊日期
(3)該網頁文件被其他網頁文件關聯的日期
(4)由儲存該網頁文件的伺服器time stamp

找出以上日期後, 依最早的日期或經演算法判定該網頁文件之初始日期, 這個日期就會影響該網頁文件的評分, 新網頁文件有10個backlink, 會比十年前的網頁文件具有100個backlink來得好 ... 但是也有可能會有例外

什麼時候會出現例外? 當演算法由初始日期與backlink的計算中, 發現異常數字時, 會將之歸類為spam, 這個時候就會降低原本的評分

而什麼是異常數字? search engine會由正常的網頁文件中的inception date與backlink, 算出一個參考值, 如果某網頁文件的backlink成長率超出一個範圍, 就是異常, 至於正常成長率是多少? 超出的範圍是多少? 這個資料並沒有揭露, 但是我們可以由幾個方式了解

(1)一些PR同等級而且值得信賴的網頁的backlink平均成長率
(2)自己網頁的成長率曲線 (參考)

由他站的成長曲線可以知道曲度(slope), 由自己網頁的成長曲線可以知道是否平滑, 如果往上成長的曲度合理並且平滑, 大致就沒麼問題, 但是一定會有被誤判的情況, 不過如果時間拉長, 以上的計算不失為蠻精準的演算法


標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月16日星期二

SEO : SERP的影響公式探討

在之前文章"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"談到時間因素會對SERP (Search Engine Results Page)有所影響, 到底是怎麼個影響法呢? 我們由Google的專利資料中來研究一下 ...

第一個公式:


其中
H: History-adjusted link score
L: Link score given to the document (也就是PageRank U.S. Pat.No. 6285999)
F: elapsed time measured from the inception date associated with the document
(詳細關於inception date, 後續再來談)

由以上的公式可以知道, 剛開始link score會放大, 然後慢慢以平滑曲線遞減
L=5, F=1, H=10.47
L=5, F=2, H=8.30
L=5, F=3, H=7.15
L=5, F=4, H=6.42
...
L=5, F=59, H=2.80
L=5, F=60, H=2.79

但是某些SERP data set的average date並無太大差異的情況下, 新產生的網頁就未必有優秀的SERP,所以你會看到某些查詢結果幾乎不太變動, 但某些查詢結果卻一日數變, 就是這個因素

第二個公式:


其中
U: Update score
f: a function, such as a sum or weighted sum
UF: Update frequency score
UA: Update amount score

也就是網頁的更新頻率與更新量會來決定U, 同樣的如果SERP data set的average date-of-change並無太大差異的情況下, 以上公式就不會去影響SERP

至於search engine如何知道哪個網頁有更新呢? 更新量如何呢? 基本上search engine不可能把所有頁面都全部cache, 某些頁面就以signature來判斷(例如在頁頭抓一個字,頁中抓一個字,頁尾抓一個字,如此就能產生該頁面的signature), 當signature變動時, 就知道本頁已經update

至於update amount就可以用多個signature來判斷, 例如一個頁面中的10個signature有3個已經變動, 就比10個signature中有2個變動有較多的update amount, 當然不一定精準, 但平均而言差異不大

所以根據你下的關鍵字所產生的SERP, 其特性到底是哪個種類?

是否會因時間而影響? 如果不會的話, 新網頁就很難打破這個SERP

是否會因更新頻率與更新量而影響? 如果不會的話, 你再如何時常更新也於事無補

因此瞭解了以上的公式, 對您網頁的SEO多少有些助益

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月8日星期一

The United States of Google?

在上一篇文章提到"Google at 10", 指出了一些令人佩服與憂慮的現象, 但是Google一家私人公司所發展出的網路規模, 不僅令小國為之遜色, 連美國都可能自嘆不如, 因此會不會產生"The United States of Google"? 已經是大家很好奇的一件事 ...

我想大家先想幾個問題 :

(1)Google的市值會比台灣還高嗎?
(2)Google的員工數目與聰明度會比台灣IT工作人口多嗎?

當然這個問題問得有些白癡, 一個國家(姑且稱之)當然不能與一個商業公司比較 ... 但是為什麼

台灣沒有辦法提供給所有台灣人一個免費的email? 台灣為什麼沒有辦法有一個像樣的政府資訊平台?

另外一個問題就是 : 如果真的有一個國家提供的免費郵件或檔案平台, 您敢放心的用嗎?

思考這個問題, 其實是很傷心的, 而且台灣一個小國能夠創造了全球知名的硬體王國, 但是卻是一個軟體未開發國家, 能夠提得上抬面的軟體公司有幾家? 大概一隻手都數得出來!

台灣的軟體公司最大的特色就是 : 倒得很快

台灣軟體公司的服務, 最大的特色就是 : 做得很慢

在這樣的狀況下, 公家的網路服務不是交差了事, 就是倒了一家再找一家, 從頭來過 ... 就算建置了完整的資訊服務架構, 但是裡面的內容確是十年不變或是錯誤百出

台灣的NII(國家資訊基本建設)已經推幾年了? (1996年至今有12年了), 竟然還能夠公文說不見就不見? 根據96年度中央政府總決算歲入歲出簡明比較分析表, 歲入共一兆六千多億新台幣, 這樣的金額經過巨大的政府機器消化後, 就是台灣現在這個樣子 ...

Google在2008年4月公佈的季營收約50億美元, 整年營收已經達台灣總歲入的三分之一 (沒算錯吧?若有錯誤請指正)

如此下去, The United States of Google與Taiwan, ROC會是什麼光景? 一家是10年的私人公司, 一個是兩千三百萬人拼出來的國家

拿台灣與Google來類比, 是污辱台灣還是污辱Google? 這都不是我的原意, 聽聽就算了吧!

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google at 10 : Google十週年

近日BBC與CNN都撰寫了Google十週年的回顧文章 (Google at 10, Google - is the love fading?, Google turns 10: A look back)

其中有褒有貶, 有期待有悵然 ...

我想就不再翻譯以上已經說過的內容, 有興趣自己去看看吧

Google想要成為一家與眾不同的公司, 某種程度上是成功的, 但是Larry Page的"Don't be evil!", 似乎已經有些變質

也許當大到一個程度, 要負責任的對像越來越多, 已經不是最初的赤子之心所能夠承擔的, Bill Gates不也被當成惡魔的化身?

我們就看看Google如何能夠繼續Don't be evil! 還是會變成一個如"愛台灣"的宣示口號?

Google的另一個口號就是: "Our whole mission is to organize the world's information"

而此口號也早已經被質疑 ... "Can Google organize world’s information?"

大家都在用Google的各種services, 都把所有的data給了Google, 大家真的相信Google嗎? 其實也只是一個不得不信任的無奈!

由於Google的方便, 大家肆無忌憚的上傳各種影片到YouTube, 大量不經整理的放置電子郵件在Gmail, 胡謅瞎掰的寫各種文章在Blogger, 為了能夠讓搜尋引擎找到, 一堆flog/splog應運而生 ...

人們近十年產出的資料已經超過人類有史以來的資料量, 到最後Google要組織全球資訊所需的功夫會越來越可怕

因為全球的資料量越來越龐大, 所以必須投入更多的資金來因應 ... 因為需要更多的經費來投入, 所以可能會越來越evil ...

這樣的惡性循環, 到最後會是如何的光景? 如果Google不再存在了, 你我該何去何從?

Google十週年, 不只是Google該思考這些問題, 所有的Google使用者也該想看看 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月5日星期五

SEO for Dummies : SEO白癡手冊

許多經營部落格的人, 常常剛開始充滿熱情, 但寫到最後因為幾乎沒有人看而退出江湖, 其中不乏有許多精彩內容的部落格, 為何沒有人看? 因為經營部落格的方式錯誤, 並且沒有做到基本的SEO (Search Engine Optimization)

這篇文章來談談以非技術觀點下, 您可以輕易運用的SEO方式, 因為連白癡都看得懂, 故名為"SEO for Dummies : SEO白癡手冊", 所以沒有任何特別誣蔑的意涵 ...

由於本篇文章定位為入門, 所以必須把SEO先做最簡單的解釋

SEO(Search Engine Optimization)就是指運用一些方式, 把您的網頁調整成搜尋引擎喜歡的方式, 一但被搜尋引擎喜歡以後, 就比較容易被網友找到, 當然流量就會增加

談到流量, 我們先談談網友到訪您的部落格的三種方式 :

(1)在瀏覽軟體打入您部落格的網址, 或由他們的"我的最愛"進入您的部落格
(2)透過別人的網頁上的連結, 點選後進入您的部落格
(3)透過搜尋引擎打入您部落格的名稱或關鍵字, 由搜尋引擎連到您的部落格

另外一種是搜尋引擎或網路機器人, 透過指令式方式進入您的部落格, 這點與本文無關, 我們就不談

因此以上三種方式就決定了您的部落格的流量

所以建議剛剛成立部落格的人, 最好先使用大型入口網站的部落格服務, 等流量到達一個程度後, 再另外擁有自己網址(註一)的部落格 (如本站 : http://www.dns.com.tw/blog), 這樣才能累積自己網址的信用度(註二)

(註一:以上姑且以網址代替網域名稱, 以方便入門者瞭解)
(註二:所謂信用度就是搜尋引擎信任您的部落格網址的程度, 當擁有自己網址, 這個信用度才屬於您的)

為何要先使用大型入口網站的部落格服務? 因為您的部落格文章至少會出現在他們網頁(如最新部落格文章...), 也就藉由上面三種流量來源的(2), 會漸漸增加您的流量, 而您的內容如果不錯, 被別人收入他的"我的最愛", 就有了(1)的流量

所以內容不錯以後, (1)(2)的流量就會自然產生

但是上面三種流量來源的(3), 就必須靠自己的調整了, 這個調整的動作就是在做SEO

哪些動作要做呢? 整理如下:

(1)談大家可能有興趣, 但是經過網路搜尋後, 大家比較少談的主題
這點困難度稍高, 但如果能就自己專業範圍內, 盡量比別人早一步談這個主題, 可以建立權威性, 並且內容新鮮度高, 可以容易被搜尋到, 如果有興趣看細節, 詳細內容在: "Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"

(2)最重要的關鍵字一定要出現在"主題(title)"上, 並且如果長度允許, 最好中英文都有, 如本篇的主題:"SEO for Dummies : SEO白癡手冊"

(3)在內文中, 認為有可能可當關鍵字的字串, 以<h1>...</h1>, <h2>...</h2>等tag夾起來, 會顯示如下

SEO for Dummies : SEO白癡手冊

... 但是不要用得太離譜

(4)使用Social bookmark (如funP, Hemidemi ...), 把您的文章自我推薦上去

(5)將您的部落格網址推薦到DMOZ, Google Directory, Yahoo Directory

(6)與朋友較優質的部落格互相交換連結
與其他網站交換連結時必須慎重, 因為根據Google的判定, Bad page會連到Good page, 但是Good page不會連到Bad page, 因此如果您連到一個被Google判定為Bad page的話, 您也會被受到牽連

(7)使用其他的社交網路工具 (如部落格觀察...)

(8)使用PageRank checker貼紙, 可以隨時觀察自己部落格的頁面PR值變化, 當有不錯PR值時, 可以適度在該頁面增加連到自己其他相關內容 (但是如果內容是八竿子打不著的就不必了)

關於PageRank (PR) 如果有興趣可以參考 : Pagerank 演算法研究

(9)使用Counter (如http://www.shinystat.com/), 可以觀察詳細的流量狀況, 或稍微進階者可以使用Google Webmaster管理員工具

(10)Anchor link策略
不管建立Forward link(往別人頁面的連結)或Backlink(連回自己頁面的連結), 在建立連結時最忌諱使用以下的樣子:

<A Href="http://www.dns.com.tw">這一篇可以參考</A>

因為以上"這一篇可以參考"這個字串, 與連往的站台一點都不相關, 這個字串就好像向搜尋引擎介紹一樣, 這個介紹詞就成了此互連網頁的關聯, 不管是Forward link或Backlink都要仔細編輯這個字串

(11)使用NoFollow
在一個頁面中雖然可以有無數的Forward link(往別人頁面的連結), Google也都可以抓到, 但是一個頁面的Forward link最好在數目100以下, 並且如果您不希望Google把某些Forward link也算下去, 您可以使用如下的語法

<A Href="http://www.yahoo.com" rel="NoFollow">Yahoo</A>

減少一個頁面中的Forward link數目, 可以防止被不必要的頁面去瓜分評分

當然以上的方式如果要效果明顯, 前提是您的部落格或網站必須要有好的內容, 如果沒有好的內容, 神仙都沒辦法 (之前文章有提到過 : "網路行銷/網路營銷 -- 內容為王"), 但是除了有好的內容外, 如果能夠依照上述方式好好調整, 相信對於流量會有不錯的改善

以上盡量以比較淺顯的方式, 來說明如何讓不懂技術的人來進行SEO, 如果有任何意見或建議, 歡迎多多指教啦 ...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Query Deserves Freshness (QDF) : 由內容新鮮度談SERP

什麼是Query Deserves Freshness?

就是在搜尋時SERP會因為內容的age而出現不同的結果, 也就是說, 新的頁面在某一段時間內, 其SERP會比舊資料更有優勢, 那到底這段時間多長? 這種現象是否合理? 與其他SERP規則有無牴觸?

我們先撇開所有既有的想法, 純粹由使用者觀點來看的話, 使用者當然希望找到最新的資料, 並且要找到最正確的資料

如果所有的網路文章撰寫者都是很負責任的話, 當然最新的資料等於最正確的資料是可以成立的, 但是 ... 網路文章撰寫者都是很負責任的嗎? 所以很有可能新資料有可能是不成熟的

如果您看過之前文章, 應該會同意我的看法, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

話說回來, 另外有些資訊是不會變的, 這時反而舊資料是可能比較權威的, 例如許多wikipedia上的資料初始日期是很早的, 並且後續還有許多更新

到底Google在處理這些資料時, 如何判斷哪個頁面是fresh(新鮮)? 哪個頁面是stale(陳舊)?

在Google的專利資料顯示了許多影響SERP的因素: "Information retrieval based on historical data", 對於想要研究SEO的人應該好好閱讀, 這裡面就隱含了所有影響SERP與PageRank的因素

如果能夠把Google近期的專利都讀完, 大概您對search engine就能有更深一層的瞭解了, 以下是相關資料(html與pdf), 如果您沒有時間讀那麼多密密麻麻的資料, 我在後續文章會再說明這些內容

DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE
Publication number: US 2007/0094254 A1
Filing date: Nov 20, 2006

DOCUMENT SCORING BASED ON DOCUMENT CONTENT
Publication number: US 2007/0100817 A1
Filing date: Nov 21, 2006

DOCUMENT SCORING BASED ON QUERY ANALYSIS
Publication number: US 2007/0088692 A1
Filing date: Nov 22, 2006

DOCUMENT SCORING BASED ON LINK-BASED CRITERIA
Publication number: US 2007/0094255 A1
Filing date: Nov 30, 2006

DOCUMENT SCORING BASED ON TRAFFIC ASSOCIATED WITH A DOCUMENT
Publication number: US 2007/0088693 A1
Filing date: Nov 30, 2006

Personalizing anchor text scores in a search engine
Patent number: 7260573
Filing date: May 17, 2004
Issue date: Aug 21, 2007

Information retrieval based on historical data
Patent number: 7346839
Filing date: Dec 31, 2003
Issue date: Mar 18, 2008

光從上面的專利標題, INCEPTION DATE, DOCUMENT CONTENT, QUERY ANALYSIS, LINK-BASED CRITERIA, TRAFFIC ASSOCIATED WITH A DOCUMENT, anchor text, 您大概就可以知道Google在對網頁評分的標準了, 這些因素在之前一系列SEO文章也都提過

話題扯遠了 ... 我們回到主題, 本篇只談文章的新鮮度

現在假設有一篇熱呼呼的文章剛被Google抓取, 姑且稱網頁A其初始時間(INCEPTION DATE)為2008.09.05 12:00:00, 這篇文章會不會出現在SERP的第一頁, 就完全取決於query analysis後, 網頁A內容與keyword的相關性緊密度評分, 如果評分後有其他網頁更優勢, 當然網頁A就被排擠下來

如果相關性緊密度評分相等或相近, 並且這個SERP set中的其他頁面, 其他評分並不顯著優勢(如backlink), 這時網頁A就可能出現在SERP的第一頁, 但是這個優勢會隨著時間因素而遞減(公式後續再談)

網頁A如果在因時間因素遞減下, 但增加了自然的backlink, 就可能繼續存在SERP第一頁

網頁A如果在因時間因素遞減下, 沒有增加自然的backlink, 若其他頁面也同樣沒有增加自然的backlink, 網頁A也可能繼續存在SERP第一頁

對於Google而言, 網頁A如果在一週內有10個自然的backlink, 其link analysis評分當然比存在一年的網頁B具有30個backlink要優秀, 但是這裡強調的是"自然的backlink", 非自然的backlink就可能會被演算法抓出, 以人為的方式降級或列入sandbox中

這也就是為什麼一些很新的網頁會出現在SERP第一頁的原因, 但是別太高興, 如果內容不好, 就會被其他相關文章擠下去

有興趣的話, 請期待後續文章啦 ...

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月29日星期五

Semantic Ranking : Search Engine 的另一扇窗

由前文"Pagerank 演算法研究"與"SERP v.s. PageRank : PR值與搜尋排前的關係", 我們瞭解了影響網路搜尋結果的幾個因素

但是網頁的互相連結並無法表示支持的程度, 目前PageRank計算一概以均分的方式, 而網頁互相連結也無法表示網頁間的關聯, 如科技類的網頁A連接到科技類的網頁B, 對於網頁的重要度評比, 當然應該比生活類的網頁C連接到科技類的網頁B要來的重要

而使用網頁結構與keyword的關聯性來產生SERP的結果, 也有可能出現錯誤的狀況, 比如keyword為"SERP PageRank" 與 "PageRank SERP", 就可能產生不同的SERP結果, 同義與相近詞也無法透過搜尋有效率的尋找

這些都是由於PageRank與SERP目前都尚未真正融入Semantic語意技術, 沒有語意技術實在很難以分析這麼多看似不相關的資料 ...

"Context-Aware Semantic Association Ranking", "Ranking Complex Relationships on the Semantic Web", "Ontology-Driven Semantic Ranking for Natural Language Disambiguation in the OntoNL Framework" ... 等等文章就提出了Semantic Ranking的概念, 希望以語意的關聯來建立網頁間的關係, 如果您希望看更多訊息, 可以用"semantic ranking"去進行搜尋

什麼是Semantic Ranking? 就是用語意技術去評比網頁, 當您下一個關鍵字, 網頁就可以用semantic ranking的大小來依序顯示, 不像現在只是純粹比對字串

當網頁間存在Semantic Connectivity (語意連接性) 或Semantic Similarity (語意相似性), 就是存在Semantic Association (語意關聯性)

例如: 當網頁A的內容討論車子的性能, 網頁B的內容討論重型機車的性能, 網頁C的內容討論BMW汽車的性能, 網頁D的內容討論寶馬汽車的性能, 則網頁A-C,A-D互相具有Semantic Connectivity, 網頁C,D互相具有Semantic Similarity, 而網頁B則可透過另外網頁與網頁A產生另外一個Semantic Connectivity

不過可惜的是以舊有的網頁語法, 如果沒有使用RDF (Resource Description Framework), 比較困難建立這些關係, 如何在既有的HTML語法下, 或簡化使用RDF的方式來改善PageRank與SERP是Search engine的一個困難的難題

如果這個問題可以解決的話, Search engine的市場就可能重新洗牌, SEO的方式可能就全面改觀了, 拭目以待吧 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SERP v.s. PageRank : PR值與搜尋排前的關係

許多搞SEO (Search Engine Optimization) 的人一定都有一個困惑:為什麼許多搜尋結果, 反而PR值低的會排在前面?

在前文"SERP : Search Engine Results Page"已經提到, PR值與SERP不一定成正比, 也許您會問 : 那花那麼多功夫把PR值提高, 不是白費功夫了嗎? 有那麼多的backlink不也是如夢一場了嗎?

大家真的都被Google耍弄了嗎? 事實真像如何呢? 繼續往下看就能解開您的疑惑了 ...

首先解釋一下, 我們由前文"Pagerank 演算法研究"知道, PR值完全看有多少網頁投票給您, 這些投票給您的網頁其本身的質量與該頁的連結數目決定了您的PR值, 這個值跟keyword無關 (真的無關嗎?我們後續會來研究)

而SERP主要由哪些因素決定呢?

(1)keyword在您頁面的密度相關性
(2)您頁面被Google index的時間
(3)PR值

在說明以上因素之前, 我先用近日文章的SERP來說明:

"WREL : Wireless Resonant Energy Link 未來的無線電力傳輸"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Wireless Resonant Energy Link"為keyword, SERP=第一頁位置5, 中文SERP=第一頁位置1

"DPR : Dynamic Physical Rendering 未來的變形金剛"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Dynamic Physical Rendering"為keyword, SERP=第一頁位置7, 中文SERP=第一頁位置1

"PageRank, BrowseRank, AlexaRank"
2008.08.26刊登, 於2008.08.26被Google index
在Google search以"BrowseRank"為keyword, SERP=第一頁位置2, 中文SERP=第一頁位置1

"使用手機或PDA離線瀏覽Google Map"
2008.08.12刊登, 於2008.08.12被Google index
在Google search以"mgmaps"為keyword, SERP=第一頁位置4, 中文SERP=第一頁位置2

(以上資料可能會因時間等因素而顯示不同結果)

由以上例子看, 為什麼這麼新的網頁能夠有優秀的SERP? 因為該文就是以keyword為title或tag, 談的內容就是keyword完全相關的

在以上提的SERP三個主要決定因素中, (1)是最重要的, 其次是(2), 最後是(3)

除此之外, 據觀察結果, 還可能與TrustRank有關係, 不過這點尚無法詳細證明, 但根據一份PageRank/SERP統計資料顯示結論: SERP與PR有關, 但隨著時間PR會逐漸減少對SERP的影響

因此如果您看到某些頁面的PR比較低, 但SERP比您的頁面好, 原因就是: keyword比較有關連或被index的時間比您早

Google處理SERP的方式, 以上面的觀察來看, 其實是很符合使用者需求的, 因為網路上不斷出現新的優秀內容, 如果光是以PR順序來顯示資料, 也許根本找不到要的資料, 況且目前一堆黑帽SEO, 不符合網頁的PR值也很多, 因此Google把PR的影響遞減, 其方向大致沒什麼問題

另外由以上的觀察, 也覺得台灣在新科技相關的研究內容實在少得可憐, 提到DPR(Dynamic Physical Rendering)的中文內容竟然屈指可數, 不過就因為如此, 只要您能夠在內容與結構上好好耕耘 (如本站一系列的SEO探討文章所說的), 您的高品質內容也會有出頭的一天, 其他亂七八糟的黑帽SEO就忘了他吧 ...

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月27日星期三

SERP : 搜尋排前對消費者的影響

不管公司的大小, 許多產品都希望能夠讓消費者於網路搜尋時可以排列在最前面, 到底搜尋排前對消費者的影響是如何呢? 3位武漢大學的學者在2007年WiCom研討會上有一篇論文: "Does It Pay to Get to the Top? Contextual Factors of Branding in Search Engine Marketing", 做了一個SERP的研究 ...

他們把使用者分成兩大類, 一部分是具備搜尋技能的人, 一部分是不具備搜尋技能的人, 進行四項實驗, 然後去評估他們對產品的認知

這個研究得到幾個結論:

(1)具備搜尋技能的人較不易被SERP結果影響, 但不具備搜尋技能的人易被SERP結果影響對產品的認知

(2)當他們瞭解許多產品有進行SEO(Search Engine Optimization)來影響SERP時, 沒有顯著影響他們原有的產品認知

(3)不知名產品在搜尋排前時, 產品認知的影響比知名產品來得顯著

以上結果代表什麼意義呢? 就是沒有名氣的產品如果能夠搜尋排前是非常重要的, 可以快速建立產品的Branding, 相對的知名產品就沒必要花太大心力在SERP上, 並且對於廣大的不具備搜尋技能的人影響較大, 就算他們知道SERP可能是被操作的, 也不太會對於搜尋排前產生太大疑問

所以如果您的產品越沒有名氣, 把精力放在SEO來改善SERP, 是決對能夠逐步建立品牌的一個快速方式, 並且能夠獲得消費者對於您的產品的正面認知!

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月26日星期二

SERP : Search Engine Results Page

前幾篇文章談了一堆關於Ranking的技術, 最後也就是最重要的就是SERP (Search Engine Results Page), 不管您的PageRank, TrustRank ... 等等指標多好, 如果使用者在搜尋時無法出現在前幾頁, 也就是有較好的SERP的話, 所有的指標都只是白費功夫, 空有好的內容, 但搜尋引擎並不認識你, 可說是非常可惜的事情, 如何才能夠讓您的網頁有優秀的SERP表現呢?

SERP與keyword及網頁結構關係最密切, 而高的PageRank不能保證有好的SERP, 高的流量也不能保證有好的SERP, 如果能夠有好的內容再加上優秀的SERP, 那才是網站成功的保證

當使用者下了一個keyword, 哪些重要因素影響SERP的結果呢?

(1)網頁title

例如本文章的重點在談SERP, 而title就是"SERP : Search Engine Results Page"
如果您的內容無法表現在title tag上, 當然SERP就無法有好的表現, 這也就是上次談到: SEO 三大建議, 希望能夠使用blog結構的原因, 因為可以不需額外功夫就讓內容的title顯示出來

(2)網頁meta data

meta data中的keyword, 與內容中的heading處理, 也可以讓search engine特別注意, 這個在上文Semantic HTML也提到過, 使用正確的tag, 可以讓search engine瞭解您的內容

(3)網址與目錄

如果您的網址或目錄中含有keyword, 如http://www.serp.com/serp-pagerank/serp.html, 如此也可以讓您針對SERP這個keyword有較好的結果, 並且就網址後綴來說, 一般org/net/com 也比ccTLD (Country Code Top Level Domain, 如org.tw/net.tw/com.tw)要好

(4)網頁內容

當然在您文章的內容一定要出現該keyword, 並且真的就是關於該keyword的文章, 否則使用者找到您的網頁也就沒啥意思了

(5)Refresh rate

什麼是Refresh rate? 就是您網站的更新頻繁度, 如果您的網站內容時常更新, 除了能夠讓search engine加快抓取頻率外, 也能夠讓SERP有更好的結果

也許有人會問:到底search engine會多久來抓我的資料? 除了使用http://www.google.com/webmasters/可以讓您上傳sitemap來告知之外, search engine也會自動根據您更新頻繁度來修正抓資料的頻率, 也就是如果每次search engine來抓資料都發現您已經更新, 他會修正縮短抓資料的區間, 如果來抓資料時發現您的網站沒有更新, 則放慢抓資料的區間

因此當您的網頁如果已經被indexing後, 並且您的網站屬於Trust那個區塊, 其實search engine抓資料的頻率有很大因素決定在您手上

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

TrustRank, PageRank, SERP

許多站長常常問一個問題 : 為何我的網頁已經建置很久了, 但一直沒被Google index? 另外一個問題也常常被問到 : 為何許多PageRank值比我低的網頁, 搜尋時出現在我的網頁前面?

第一個問題的答案是 : TrustRank, 而第二個問題的答案是 : SERP (Search Engine Result Page)與PageRank不一定成正比

本部落格的網頁最快約10~30分鐘就會被Google抓走, 最慢也在一天內就被Google抓走, 原因是TrustRank

什麼是TrustRank? 詳細資料請看 : Combating Web Spam with TrustRank

由於全球的網頁數目太龐大, 因此Google的Sandbox, TrustBox技術會將網頁區分為兩大區塊-被排除的區塊(Sandbox)與信任的區塊(TrustBox)

哪些網站會被信任? 被Dmoz list的網站, 被Social bookmark熱門推薦的網站, 被TrustRank/PageRank高的網站所連結的網站 ... 這篇文章也提到一些成為TrustBox區塊的方式

另兩篇文章 : What is Google TrustRank (TR)?, The Social Side Of Trustrank 也提出許多提高TrustRank的方式, 本站之前的文章也都提到過

當TrustRank較好時才會快速被抓取, 被抓取後才可能有好的SERP, SERP就與網頁結構有很大的關係, 但是真正決定SERP的因素, 現在還是只能由結果來猜測, 尚無真正能夠證明哪些因素來決定SERP (SERP的研究倒是不錯的研究題目)

不過不管如何, 研究了一堆PageRank, TrustRank, SERP ... 之後, 其實最重要的還是老話一句 - 內容與結構! 就把一些指標暫時放一邊, 好好研究如何產生好的內容與正確使用Semantic HTML比較實在吧!

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

PageRank, BrowseRank, AlexaRank

在八月初的SIGIR (Special Interest Group on Information Retrieval)研討會上, 出現了BrowseRank: Letting Web Users Vote for Page Importance

這個微軟研究中心的BrowseRank演算法, 大抵是想跟Google的PageRank一別苗頭, 到底這個BrowseRank是否能夠比PageRank來得好呢? 我們來研究一下

大略瀏覽了上述的論文, 發現BrowseRank只是Page-level的AlexaRank, 他的data set來自於瀏覽軟體的使用者資料, AlexaRank由Alexa toolbar所得到的資料來分析, 而BrowseRank由微軟的IE所得到的資料來分析

AlexaRank只是Domain-level ranking, BrowseRank比較仔細一些, 進到Page-level Ranking, Website-level Ranking, 而PageRank是透過link-analysis來取得頁面的重要度

論文題目說: Letting Web Users Vote for Page Importance, 其實是值得商確的, 網友到訪了一個網頁, 未必就認為該頁是重要的, 可能看完後幹聲連連 ...

因此我們可以粗略的說AlexaRank標示了網域的熱門度, BrowseRank標示了網頁/網站的熱門度, PageRank標示了網頁的重要度

到底哪個比較精準, 就牽涉到幾個問題:

(1)比較熱門的網站是否就比較重要?
(2)link數目多就代表比較重要?
(3)不同階層的使用者, 熱門度如何參考?
(4)廣度網站與深度網站, 熱門度如何參考?

當然上面問題沒有正確答案, 學術研究的網站一般不能跟入口網站比熱門度(AlexaRank與BrowseRank), 而新興網站一般不能與歷史悠久的網站比重要度(PageRank), 但是也可能會有例外 (而且例外還不少)

所以也很難去比較AlexaRank,PageRank,BrowseRank到底哪個好, 後續有更多資料再來分享啦...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月25日星期一

Pagerank 演算法研究

Larry Page在1996年間發明了Pagerank的演算法, 爾後又與Sergey Brin在Stanford發表了"The Anatomy of a Large-Scale Hypertextual Web Search Engine", 這個Web Search Engine就是現在使用的Google, Pagerank詳細內容到1998年才發表, 並且直到2001年才取得專利

Page Rank公式如下



(以上公式圖形由http://www.sitmo.com/latex/產生)

以上d指damping factor, 其值在0~1, 一般設為0.85
PR(Vi)為Vi這個頁面的PR值
In(Vi)為連進Vi這個頁面的link數目
Out(Vj)為Vj這個頁面連出去的link數目

也就是說如果有3個頁面A,B,C

A如果連到B,C
B如果連到C

如果A的PR=4
則PR(B)=(1-0.85) + 0.85 * 4/2 = 1.85

而PR(C)=(1-0.85) + 0.85 * (4/2 + 1.85) = 3.4225

B,C會平均繼承A的PR值, 但C會單獨繼承B的PR值

Pagerank是一種link-analysis algorithm, 是根據citation analysis而來, 原本使用在學術期刊論文被引用次數的技術

在Pagerank之後, 1999年Kleinberg發表了HITS algorithm(Hyperlink-Induced Topic Search), HITS決定兩個值: authority value & hub value, 並且是在query time計算, 而不是像Pagerank是在indexing time計算, Teoma就是使用HITS (目前被Ask.com收購)

相對於link-analysis algorithm的content-analysis algorithm, 於另外文章再討論

不管是Pagerank或是HITS, 都是iterative ranking algorithm, 非常耗費演算時間及資源, 因此許多研究者提出了不同的方式來加速計算時間:

1999年 Efficient Computation of PageRank(Haveliwala and et al.)

2002年 Pagerank Computation and the Structure of the Web:Experiments and Algorithms(Arasu and et al.)

2002年 I/O Efficient Techniques for Computing PageRank(Chen and et al.)

2003年 Scaling Personalized Web Search(Jeh and et al.)

2003年 Exploiting the Block Structure of the Web for Computing PageRank (Kamvar and et al.)

2003年 Extrapolation Methods for Accelerating PageRank Computations (Kamvar and et al.)

2004年 Parallel PageRank computation on a gigabit PC cluster (Manaskasemsak and et al.)

2006年 Parallel adaptive technique for computing PageRank (Rungsawang and et al.)

2007年 Improvement of Pagerank for Focused Crawler (Yuan and et al.)

但是不管怎麼加速演算法, 其iterative ranking algorithm的特性不會改變, 但可能會加入content-analysis algorithm的一些特性來走向semantic web

而Pagerank公式內的Out(Vj), 使得一些做SEO的人注意到HTML中的nofollow特性, 來進行一些link quality的改善

深入探討:
PageRank Algorithm : 別說你懂PR演算法

相關訊息:
什麼是PageRank Hijack?
善用PageRank指標提升企業競爭力
Google Analytics & PageRank
SERP vs PageRank : PR值與搜尋排前的關係

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月20日星期三

網路行銷/網路營銷 : SEO 三大建議

在許多網站上可以看到諸如: "如何快速提升Pagerank", "Pagerank 7的快速捷徑" ...等等的文章或影片, 但是仔細去看這些網站的Pagerank竟然都是低於3或甚至降到0, 他們教您購買軟體, 他們教您快速增加backlink, 他們教您如何以短短幾分鐘的作業去提升PR值, 但是經事實證明, 不但無法達成目的, 還可能造成反效果, 在本篇文章中, 我們很誠實的告訴您真正被Google認可的方式 ...


在前幾篇文章已經提出許多觀念, 您可以去回顧一下:

Internet大破譯(五): 看不見的網路行銷戰場
善用PageRank指標提升企業競爭力
搜尋引擎的運作背後
網路行銷 : SEO 五大要素
網路行銷 : SEO 十大守則
網路行銷/網路營銷 -- 內容為王

除了以上一些觀點之外, 我們再提供三項實務的建議, 當然這些不管是五大要素, 十大守則, 或是三大建議, 最後回歸的都是 Content (內容), 沒有價值的內容創造不出有價值的網站

但是有價值的網站需要讓search engine瞭解, 並讓讀者可以搜尋到您的內容, 這也是所有搜尋引擎希望所有webmaster能夠協助的地方: 在search engine還不夠智慧的情況下, 讓search eninge能夠真正反應讀者想要尋找的內容

哪三項實務的建議呢?

(1)建立部落格

以目前的網頁結構來說, blog是最適合search engine抓資料的, 因為tag/category/publish date等等要素, 讓文章與文章之間會自然產生關聯, 這些關聯會讓片段的文章形成一串互相有關的內容, 這些關聯可以讓search engine知道如何index這些片段, 也可以讓讀者去一層層找到需要的資料, 因此如果您的網站沒有blog的結構, 應該盡快構思如果組織您的內容去建立有價值的blog

(2)善用網路社交工具

什麼是網路社交工具? network bookmark (網路書籤)就是一個例子, 建立部落格後僅是在您的內容上建立關聯, 而使用網路書籤可以讓blog間串聯起來, 並且讓更多人來看到您的內容, 並且網路書籤的tag可以將這些關係標準化, search engine可以很輕易的index相關內容

(3)使用Semantic HTML

什麼是Semantic HTML? 根據wikipedia的Semantic HTML解釋, Semantic HTML不是一般webmaster能夠瞭解的, 但是有另外一篇比較淺顯的說明您可以參考: Writing Semantic HTML

Semantic HTML的目的就是讓您的內容可以清楚呈現給search engine, 因為search engine並不瞭解您的內容, 但是透過HTML tag, 他可以知道這段文字是屬於哪個類別

總而言之, 其實以上三大建議, 是希望您的網站在結構關聯上, 能夠替search engine做更清楚的描述, 如此一來search engine瞭解您的網站, 也同時讓讀者知道搜尋到的是否是需要的內容

真正的Search Engine Optimization (SEO)是在協助search engine, 而不是在欺騙search engine


許多人都說做SEO要偷偷做, 不要讓search engine知道您的作法, 其實只要是正確的SEO作業, search engine反而是鼓勵的, 因為您可以改善他們的搜尋效能

在內容上提升, 在結構與關聯上修正, 才是真正在進行SEO, 請大家光明正大的進行, 如此一來才可以讓讀者找到需要的資料而不是一堆不相干的垃圾

標籤: , , , , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月19日星期二

SEO : 搜尋引擎無法索引Flash檔案?


以往大家都認為盡量不要使用Flash, 因為Flash檔案文字內容無法被搜尋引擎抓取, 但是這種情況已經會逐漸改善, 根據Adobe的SWF說明資料, Adobe已經陸續提供技術給搜尋業者, 以防止Flash會被網站開發者排除使用...

雖然如此, 但是目前使用的搜尋引擎只有Google, 並且目前讀取SWF資料的技術尚未純熟, 因此還是盡量不要整頁使用Flash, 並且需依照Google對於Flash/Image的Guideline:

(1)Googlebot does not execute some types of JavaScript. If your webpage uses JavaScript to load a Flash file, we may not be able to discover and index the contents of that file.

不要使用Javascript去載入Flash
如果使用Javascript載入Flash, 這個Flash就無法順利被index

(2)We currently do not attach content from external resources that are loaded by your Flash files. If your Flash file loads another file - such as an HTML file, an XML file, or another SWF file - we may index the contents of those files, but we won't consider that content to be part of the content in your Flash files.

不要使用Flash去載入另外檔案
如果使用Flash載入其他檔案, 這個被載入的檔案就無法順利被index

(3)We're currently unable to index the bidirectional language content (for example, Hebrew or Arabic) in Flash files.

第三點跟我們比較無關

除此之外, Yahoo只是承諾使用Adobe提供的技術, 並未正式使用, 而Microsft Live Search等也尚未有任何相關訊息

雖然Flash檔案會逐步被搜尋引擎接受, 但在使用上還是要注意許多細節, 提供Flash與Non-Flash版本, 才能夠讓您的網站美觀之外, 還能夠俱備搜尋引擎的可讀性

後續可能發展, 將密切觀察後再跟各位報導啦 ...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月1日星期五

YouTube/Google又被告了 ...


真是樹大招風, 義大利一家公司又上法院告上YouTube/Google, 詳細新聞請看這裡 ...

YouTube/Google認為他們已經盡到守門的責任, 只要有問題的檔案被發現, 他們都會盡速下架, 在以上新聞的回應中也引起正反兩面的意見

如同昨天本站的文章所說的, 網路的發展必定會衝擊所有權的問題, 另外Web 2.0的發展亦會引發整個結構上的問題

(1)在網路上發表的創作該不該保護? 該如何保護?

(2)網友在Web 2.0上傳的內容, 系統提供者該不該負責? 該如何負責?

以上兩個問題在實務上是很難解決的問題, 當然理想上, 創作當然該保護! 系統提供者當然應該盡到責任!

在實際的情況上, 網路創作者實在沒有心力去維護所有權, 除非您有辦法天天上法院, 甚至於有辦法控告海外的剽竊者

YouTube/Google的問題與之前P2P音樂侵權問題很類似, 也與大賣場產品出問題有些類似

前陣子也出現一位工程師被刊登假辣妹照片的詐騙集團騙了上千萬的情事, 系統平台提供者該不該負責?

這些系統平台提供者的態度是違法與否的關鍵! 如果一味的控訴他們違法, 可能最後受害的是廣大的使用者...

但是這些系統平台提供者的機制是否真的已經盡到最大的能力, 是Web 2.0的一個很大的商機

在理想上應該做到, 但目前實務做不到, 並不代表永遠做不到, 如果能夠出現一套機制來保障網路著作權及Web 2.0的亂像, 網路的大同世界才能到來

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年7月30日星期三

網路行銷 : SEO十大守則

SEO人人會變, 但各有巧妙不同, 有些手法可以讓您乍看來有效, 但時間一過卻比以前還慘, 有些手法根本無效, 卻口沫橫飛的說得讓您誤以為真, 提供SEO十大守則讓您建立正確的觀念, 以餉網友 ...


守則1: 不要為Rank而Rank
許多網站很熱衷於改善Rank, 但是卻忽略了...網站是給人看的, 不是給搜尋引擎看的, 遵守搜尋引擎的遊戲規則是很重要的, 如果search engine已經很明白告誡的作法, 就千萬不要以身試法, 除非您建立某些站台是用來測試search engine的algorithm, 因此切記...該進行的合法SEO動作以後, 一切就交給search engine啦,如果有SEO廠商告訴您, 讓您的網站在十天內PR值變成5 ... 忘了他吧, 肯定會讓您得不償失, 就好像唸書一樣, 得獎狀不能保證您能獲得高報酬的工作, Rank之外還有更重要的事情等著您 ...

守則2: Ranking只是一個過程,不是目的
Ranking只是一個指標, 更重要的是由這個指標去改善您的網站, 不是獲得好的Ranking就能高枕無憂, Ranking起起落落只是在提醒您是否忘記該進行哪些事項, 建立任何網站重要的是否達成您的目的 ... 有時候忘掉Ranking, 好好耕耘內容反而是比較健康的事情, 沒有一年半載的時間, 成果是看不出來的, 從事網路服務提供已經十餘年, 看到太多網站轟轟烈烈開站而草草了結, 沒耐心的人來搞網路行銷會讓您得憂鬱症的 ...

守則3: 瞭解您的對手
SEO的成果不是絕對的, 它是比較的結果, 十幾年前隨便搞個站, 幾天SERP (Search Engine Result Page)就明列前茅, 現在競爭者多了, 越來越困難, 但是您不是要跟Yahoo比, 您不是要跟YouTube比, 只需要鎖定您的對手, 就能清楚規劃出SEO的策略 ...

守則4: 讓搜尋引擎瞭解您的網頁
網站不是為Search engine而設立, 但是要讓它瞭解, 如此才能妥善的抓取您的內容來indexing, 瞭解最新的W3C規則, 健全您的網站結構, 清楚的sitemap, 都能讓您的SEO策略事半功倍...

守則5: 選擇適合的關鍵字
思考您的客戶可能使用哪些Keyword, 進而使用一些工具來分析來客傾向與導引, 是非常重要的, 對於關鍵字的focus不要一次太貪心, 剛開始選擇一兩個關鍵字, 效果出來了再慢慢增加關鍵字, 例如本站在近期才將"網路行銷"加入關鍵字策略, 並且相近簡體字"網路營銷"亦加入, 目前已經從Google SERP 30幾頁的位置, 提升到前三頁

守則6: 內容至上
沒有內容就一切免談, 胡說八道或到處亂抄只能暫時讓您的網站看似豐富, 但最後除了會被Search engine封殺之外, 也會被網友拋棄, 所以還是回歸最重要的原點 -- 內容, 好內容總有出頭的一天, 何況search engine掃瞄的速度之快, 一定可以讓您的網站浮出抬面的...

守則7: 使用正確的鏈結策略
一堆無用的backlink可能讓您的Ranking緩慢提升, 但高品質的backlink可以讓您的Ranking快速改善, 但是如何呢? 前面文章已經說太多次了, 就不再贅言

守則8: 撰寫正確而適合的Meta內容
除了網站正確的結構之外, meta內容是否真的符合您的網站也是很重要的, 您明明沒有賣相機, 但meta內容卻會讓網友透過"相機"找過來, 這些無效搜尋對Ranking的提升是毫無助益的, 只是浪費大家的時間

守則9: 與相關link站在一起
在一些Open Directory的適當類別可以找到您的網站, 在類似的網站能夠link到您的網站, 您自己網站的相關內容能夠link在一起 ... 都是search engine的最愛, 為啥有人說search engine喜歡blog的結構? 因為blog的特性 : 文字多/RSS/tag ... 這些都讓內容相近的文章可以互相串聯

守則10: 如果需要的話, 還是要向專家諮詢
SEO看似簡單, 大家都可以做, 但卻是非常技術性的工作 (也是很勞力的工作), 因此多多向專家諮詢以獲得量身訂做的SEO策略也是非常重要的, 更重要的是您自己要具備正確的SEO觀念, 如此一來才能讓您的網站常久經營下去, 並且日漸茁壯 ...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年6月25日星期三

Google資料中心的秘密



Google提供全球大量的服務,幾乎已經快橫跨整個資訊科技的服務,但是Google資料中心的內部運作一直都是秘而不宣,許多人可能都碰過Google的服務出狀況,但是這些狀況總能在可容忍的範圍內解決,你可能發現你的Gmail的容量一直在改變,是什麼架構讓空間像捏橡皮糖一樣越捏越大?前陣子Google伙伴Jeff Dean在Google I/O會議中稍微揭開了公司基礎設施的神秘面紗。

Google的神秘面紗包括了: (1)軟體 (2)硬體 (3)叢集平行處理機置

Google軟體的三個核心要素:GFS(Google檔案系統)、BigTable和MapReduce演算法。而硬體卻是一般的伺服器、處理器、硬碟、記憶體等等。另一方面伺服器的叢集能在半秒之內回應700至1,000台伺服器的搜尋請求。

根據Google的說法,GFS是"a scalable distributed file system for large distributed data-intensive applications. It provides fault tolerance while running on inexpensive commodity hardware, and it delivers high aggregate performance to a large number of clients". 就是這個GFS的分散式檔案系統,讓Google服務可以隨時長出空間或是切去毀損的部分,而管理這個GFS的機置就是BigTable。目前有超過200個叢集在執行GFS,其中許多都包含數千台主機。

GFS把一塊儲存的資料(通常是64MB),至少放在三台稱為chunkserver的主機內。

如果chunkserver發生故障,Master Server(主伺服器)便負責把資料備份到一個新的地方。至少在儲存層級,主機故障完全由GFS系統處理。

Google到底擁有多少台伺服器?據Dean表示,每個機櫃存放40台伺服器。而根據某項估計,Google目前在全球有36個資料中心,以每個中心有150個機櫃計算,Google的伺服器至少超過20萬台,並且每天都在增加中...下圖就是Google最早期的server rack,當然目前的硬體比這個肯定更驚人了。



Google之所以成為Google,部分原因是他們推翻了電腦界的傳統作法。當所有的超大型資料中心都使用主流伺服器和軟體,Google的資料中心絕大部分是靠本身的技術構建而成。Google把命運操縱在自己手中,共同創辦人Larry Page鼓勵員工"別太相信有什麼不可能的事情"。

要維持如此大規模的運作,也許可以說全世界是卯起來操Google的架構,Google必須對每一台機器抱有一種隨時可犧牲的態度。伺服器製造商喜歡主打他們的高階主機承受故障或當機的能力,但Google寧願把錢投資在容錯軟體上。他們認為擁有兩倍數量但較不可靠的硬體,勝過一半數量但較可靠的硬體。你必須在軟體的層級提供可靠度,如果你有1萬台主機在運作,每天一定會有一些東西掛掉。這個跟我們一般的認知確實有蠻大的差異,我們通常都希望有數量雖少,但功能穩定的機器,而不願意有一大籮筐兩光的機器。

每個新叢集上線的第一年,通常會發生1,000次個別主機的故障,數千次硬碟故障...

一次電力輸送問題,導致500至1,000台主機失效約6小時...

20次機櫃損壞,每次造成40至80台主機下線...

5次機櫃搖晃,導致半數的網路封包在傳送過程中遺失...

整個叢集至少一次重新上線,在兩天之內的任何時間,影響5%的主機...

整個叢集還有一半的機率會過熱,在5分鐘之內讓幾乎所有伺服器當機,並且花上1到2天的時間恢復...

雖然Google用一般硬體組件來組裝其伺服器,但卻不用傳統的封裝,他們要求Intel提供特製的主機板。Google目前在每40台伺服器的機櫃外,包覆一層外殼,而不是每台伺服器有個別的外殼。

Google在2004年開始設計的BigTable,用BigTable為所有資料提供若干結構,目前用在超過70個Google計畫,包括Google Maps、Google Earth、Blogger、Google Print、Orkut和核心搜尋索引。最大的BigTable實用範例管理橫跨數千台主機、約6 PT(petabytes)的資料。

Google在2003寫出第一版的MapReduce,讓該公司有辦法實際發揮那些資料的用處。舉例來說,MapReduce能找出某個特定字彙在Google的搜尋索引中出現的次數、列出所有特定字彙出現的網頁,和連結到某個特定網站的所有網站。

利用MapReduce,Google能用相對迅速的時間,建立一個包含"digital"、"network"和"society"三個字的所有網頁索引。"Dean說:「你必須能夠依序地橫跨數千台主機作業,才能在一個合理的時間內完成這項工作。」

MapReduce軟體在Google內部的應用日漸增加,2004年8月,該軟體執行2.9萬項工作,到2007年9月,已經暴增到220萬項。在這段期間,完成一項工作的平均時間也從634秒降至395秒,而MapReduce的工作產出則從193 terabytes上升到約1.4萬terabytes。Dean說,Google在任何一天都要執行約10萬項MapReduce工作,每一項工作佔用400台伺服器,且需要5到10分鐘完成。

MapReduce就像GFS,是特別設計用來迴避伺服器問題的。Dean表示:「當某台主機故障,主伺服器知道那台機器正在執行什麼工作,將命令其他主機接手那項map工作。你可能影響到100個map工作,但會有100台主機接手那些工作。」

MapReduce的可靠度一度遭到嚴厲的試煉,當時一個1,800台伺服器的叢集正進行維護作業,工作人員一次拔下80台主機的插頭,同時另外1,720台主機必須接下停頓的工作。Dean說:「速度變得有點慢,但工作全部完成。」而在一次2004年的簡報中,一個1,800台叢集的系統,承受了1,600台伺服器同時故障。

所以,Google資料中心的運作似乎如魚得水,一切順利。但該公司還不滿足,列出了一長串待改進的事項。大多數公司都試圖找出如何平順地將工作在伺服器之間轉移,但Google已經超越了那項挑戰,他們要能夠自由、平順,且自動地,將工作在各個資料中心間轉移。

Dean說:「我們下一代的基礎設施要是一個能夠橫跨大區塊主機轉移,而非單一機器的系統。」目前,某些大型的檔案系統具有不同的名稱,如GFS/Oregon和GFS/Atlanta,但他們都是彼此的拷貝。他表示:「我們要一個單一的名稱集。」

Google種種獨創的系統替他們開創了天下,也建立了其他競爭者很難跨過的門檻,但是隨著越來越複雜的環境,Google自己需要解決的問題,肯定挑戰會越來越大。

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院