2010年1月20日星期三

搜尋趨勢 : 又來五個專家的預測 (2010 Search Predictions)


這篇"2010 Search Predictions: The Experts Weigh In"又有五個專家的預測, 而且這五個預測更為勁爆, 不談談實在可惜...

1.Google will make a corporate decision to become seen as a software brand rather than as just a search engine. Google將不再只是搜尋引擎, 而會以軟體品牌姿態出現

這點應該不必預測 ... 小狗小貓都知道 ... 連隔壁的瑪麗亞都知道, 而且應該會以更多不同的姿態出現

2.Vertical search will finally take off in 2010: local search enabled by GPS on mobile devices will capture the imagination of consumers during 2010. 垂直搜尋將在2010起飛, 並且GPS加上在地搜尋將擄掠消費者的想像

這點有些類似我們在"網路行銷的最後一哩 : Google Nexus One?"所說的, 這個應該Google與微軟都可能有機會

3.Twitter will launch its own social version of AdWords -- And contrary to what chief operating officer Dick Costolo said earlier this year, we're not sure everyone is going to love it. 推特將推出自己的社交廣告, 但不確定是否能夠獲得喜愛

這個就無從說起了....who knows? 而Twitter似乎在台灣怎麼不如Plurk熱呢? 有機會再來談了

4.Google gets hit with an antitrust suit. Google將會面臨反托辣斯官司(如之前微軟所面臨的一樣)

話說大家已經開始對Google從喜愛, 敬佩 ... 到懼怕了, 似乎只要Google想插手的, 都無法抵擋(當然也許China除外了), Google現在正在走微軟的老路嗎? 還是會維持"No Evil"?

5.Google's search engine will group related results. Google將會群組包裝更多內容, 很可能會把跟搜尋相關的廣告產品群組包裝起來

這點許多專家都認為此舉將使Google帶入更多的機會與利潤

以上幾點, 以「垂直搜尋+在地搜尋+GPS」「相關的廣告產品群組包裝」較值得注意, 因為對於自然搜尋結果與搜尋行銷會直接影響, 如何因應呢? 有空再聊聊了...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月19日星期二

搜尋引擎的盲目測試 : NoBrandSearch.com



Hakia是一個語意搜尋引擎的業者, 大概對於搜尋引擎市場分配很不滿意, 所以做了一個NoBrandSearch.com, 分別以不顯示搜尋引擎品牌的方式隨意抽出Google、Yahoo、Bing、Hakia 的搜尋結果, 然後讓你決定哪個是比較符合搜尋者需要的, 這個實驗顯示了什麼樣的結果呢?

Hakia在"NEW YEAR, NEW PROJECTS AT HAKIA"表示過新年來點新玩意, 這個實驗會以你輸入的關鍵字來顯示10個搜尋結果, 並且在左邊跟右邊以亂數的方式來使用Google、Yahoo、Bing、Hakia產生這10個搜尋結果, 當你選擇哪邊的結果比較中意後, 才會告訴你這些搜尋結果是哪個搜尋引擎產生的

如果你用"台灣 搜尋行銷"當關鍵字搜尋, 出現了以下的結果


結果左邊是Yahoo, 右邊是Hakia : 結果Hakia的搜尋結果比較符合需求


但是奇怪的是以Yahoo.com來搜尋(如下圖), 跟上面的好像不太一樣


再次用"台灣 搜尋行銷"當關鍵字搜尋, 出現了以下的結果


這次結果左邊是Yahoo, 右邊是Bing : 結果Bing的搜尋結果比較符合需求 (所顯示的Yahoo結果還是怪怪的)


NoBrandSearch的結果與Bing比較, 結果是一樣的(如下)


更怪的是如果以中文當關鍵字來搜尋NoBrandSearch, 出現Google的搜尋結果都會是亂碼(如下); 顯然Hakia沒有經過懂中文的來測試吧!? 還是因為瀏覽軟體引起的?



當然Hakia的用意很清楚, 就是希望你拋棄既有的印象, 不要再認為Google,Bing或者Yahoo才能產生最佳的搜尋結果, 然後來認同Hakia

不過這個實驗只有顯示10個搜尋結果, 而沒有顯示比較各搜尋引擎的其他特殊功能, 而這10個搜尋結果確實在許多搜尋上, 真的有許多雷同的地方, 也就是好像大家的演算法越來越接近的感覺

但是這個NoBrandSearch還是有太多感覺粗糙的地方, Hakia這個企圖應該很難打動搜尋者的心意, 也許可以算是產品行銷的一個失敗範例: 沒有真正瞭解使用者會鍾意哪個搜尋引擎的真正原因, 應該只是幾個搞技術的人童心未泯而推出來的吧!?

標籤:

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月15日星期五

搜尋行銷 : PageRank 的三兩事



常常有人會問: 我應該如何才能讓網站的PageRank提高? 為什麼我的PageRank提高後, SERP根本沒有提升? 為什麼有些網站可以在短期內拉高PageRank? 我們在之前已經寫很多關於PageRank的文章了, 現在稍微來整理回顧一下 ...

1)影響PageRank的因素已經不一樣

首先目前的Pagerank演算法, 已經跟最初的公式有所差異了, 雖然精神一樣, 但是相關的因素已經不再只有Backlink

如"Pagerank algorithm improvement by page relevance measurement"所提到的「內容相關」

"Topic-sensitive PageRank: a context-sensitive ranking algorithm for Web search"所提到的「主題相關」

"Hyperlink Classification: A New Approach to Improve PageRank"所提到的「連結分類相關」

2)PageRank跟網站信賴度

網站信賴度高的, 相對會俱備高的PageRank; 但是高的PageRank未必是俱有高的網站信賴度; 同樣的, 網站信賴度低的, 相對會俱備低的PageRank; 低的PageRank大多是低的網站信賴度; 也就是PageRank高不一定好, 但是低的通常不好 ... 這些內容在"SEO 關鍵解碼"也都有清楚的說明

網站信賴度代表的是: 抓取頻率跟索引量; 網站信賴度高的話, 新資料在短期間就會被抓走, 並且被索引的資料量會更多; 如此一來, 能夠出現在較優的SERP的機率就會增加

為什麼高的PageRank未必是俱有高的網站信賴度呢? 如果你的PR是因為被幾個高PR連結拉高的, 例如: 透過幾個PR7的連結就可以把PR拉到5或6, 這樣的PR值並不代表「網站信賴度」, 也就是透過多樣性網站的連結來傳入PR值累積, 會比少數高PR值加持而達到的效果高, 而俱備更好的「網站信賴度」...當然這裡指的"多樣性網站的連結"必須不是link farm才算數啦... 當然如果同時有「高PR值加持」跟「多樣性網站的連結」當然就更好了

這也就是為什麼有些高PR的網站並沒有「高的抓取頻率」跟「高的索引量」的原因, 如此下來, 當然SERP就沒有好的表現

也許有人會問: 為什麼有些低PR的網站的抓取頻率也很高呢?

我們說「高網站信賴度則有高的抓取頻率」, 但是決定「抓取頻率」的因素不是只有「網站信賴度」, 所以低PR的網站如果抓取頻率也很高...也許是流量高, 也許是網站歷史時間長 ... 等等其他因素而造成的

3)PageRank值的來源關係到SERP

我們上面說到, 「高PR值加持」跟「多樣性網站的連結」當然兩者都有最好, 但是後者反而比前者好, 也就是同樣是PR6, 如果靠的是「高PR值加持」, 倒不如是由「多樣性網站的連結」而來

"SERP v.s. PageRank : PR值與搜尋排前的關係", "SERP : Search Engine Results Page" 說過: PR值與SERP不一定成正比, 隨著時間PR會逐漸減少對SERP的影響 ...

並且由第(1)項中許多探討PageRank改善的研究顯示, PageRank值的背後應該還有其他的屬性(Attributes), 只是這個屬性沒有連帶公佈出來, 這個屬性就可能才是真正影響SERP的因素, 而非PageRank本身; 如同英文檢定分數相同的人, 可能有些人的聽力分數高, 有些人是閱讀分數高, 如果只比總數的話, 就無法分出分項能力了

所以我應該如何才能讓網站的PageRank提高? 如果你只在意PR值本身的話, 只需要積極跟高PR的網站打好關係, 然後看是否有機會互連; 如果你在意的是「網站信賴度」, 那就必須花更多的時間去產生quality links

為什麼我的PageRank提高後, SERP根本沒有提升? 就是上面所說的, 要提高的是「網站信賴度」而不光是PageRank

為什麼有些網站可以在短期內拉高PageRank? 除了可能使用黑帽手法之外, 就是靠「高PR值加持」, 當然就可以做到短期內拉高PageRank

套句俗話: PageRank不是萬能, 但是沒有PageRank就萬萬不能

在提升PageRank的同時也注意「網站信賴度」是很基本的工作, 如果連PageRank都拉不高, 很難進行後面的作業

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月14日星期四

搜尋引擎在中國 : Baidu , Google



搜尋引擎基本上跟語言文字的關係密切, 如果再加上國情、文化、政治...等等因素的影響, 搜尋引擎想進入中國市場, 是一件很大的挑戰, 目前谷歌(Google)就面對了這樣的局面

上圖是2009年iResearch的統計資料, 谷歌Google市佔約為27%, 百度Baidu市佔約為63%

根據"iResearch:09Q2 China Search Engines Market Size Reached 1.72 Billion Yuan"顯示搜尋引擎市場在2009Q2比去年同期成長35.7%到達十億七千兩百萬人民幣的規模

根據"iResearch最新資料", 2009年中國搜索引擎市場規模達六十九億五千萬元人民幣,其中百度和谷歌中國兩家市場份額之和超百分之九十六點三,基本壟斷中國搜索引擎市場。其中百度占據百分之六十三點一的市場營收份額,谷歌中國占百分之三十三點二。

根據"China Search Engine – Behind the Great Wall", 到2008年底止, 中國的搜尋引擎使用人口達兩億五千萬人

再根據"Google Gained Market Share in China in Last Six Months - StatCounter", 顯示到2009年底, 百度Baidu市佔56%, 谷歌Google市佔43%

(註: ComScore資料顯示的是2009/8, 谷歌Google市佔14%, 百度Baidu市佔64%, 由於資料比較舊就不加以參考)

不管是iResearch的數字正確, 還是StatCounter的估計準確, 谷歌Google都佔有約中國1/3的市場, 而且這個市場是一直往上攀升的, 而2009/01的StatCounter資料更顯示Baidu市佔58.67%, Google市佔38.85% ... Yahoo看起來是躺平 (如下圖)



佔有中國這麼大市場的百度Baidu與谷歌Google剛好在前幾天都無獨有偶的發生了幾件大事:

百度首席營運官(COO)葉朋離職
百度被攻擊癱瘓
Google可能停止中國的運作
百度癱瘓擺逾 去年底twitter也遭同集團襲擊

葉朋雖然宣稱是個人因素離職, 但大多被解讀為百度將大幅調整營運策略, 而這個調整當然就是要針對Google而來, 不把Google趕出中國豈能鬆懈? 就在這麼緊張的混戰中 ... Hacker也來湊熱鬧了

我們來談談Baidu與Google先後被黑的過程及Google的心路歷程探討; Baidu被宣稱是「Iranian cyber army」的組織搞了一手移花接木; 而Google則是宣稱被某組織滲入民運人士的Gmail

百度被攻擊癱瘓, 主要是DNS(Domain Name Server)被挾持, 根據中國電子商務研究中心搜索引擎分析師卜梓琴全程跟蹤分析: (來源)
1、2010年1月12日上午約6點起,百度域名DNS伺服器被劫持更換,同時主域名已經被解析到一個荷蘭的IP;
  2、域名被更換後,訪問百度時頁面自動跳轉到一租用雅虎伺服器的空間;該IP的網站實際使用英文yahoo下的租用空間,因此訪問百度旗下網站時,會出現英文yahoo的出錯資訊頁面。
  3、由於頁面請求數量過於龐大導致雅虎伺服器癱瘓或者流量超限,伺服器癱瘓;
  4、伺服器癱瘓後,訪問百度的網民頁面自動跳轉到雅虎的提示頁面;
  5、在超限之前,部分網民伊朗網軍的駭客頁面,攻擊者在百度首頁自稱是Iranian Cyber Army的組織承認篡改了百度主頁,並留下阿拉伯文字;
  6、2010年1月12日上午,國內大部分城市用戶和海外用戶只能通過未被劫持的備用域名www.baidu.com.cn訪問;
  7、2010年1月12日上午近10點,百度相關人士出面表示,故障還在查,目前原因不知,此前均表示不知情或拒接電話;
  8、2010年1月12日上午約11點起,部分地區陸續恢復正常訪問;
  9、下午起,百度正在陸續恢復域名解析,所以也出現了各地逐漸恢復訪問的情況;
  10、根據解析速度,如不出意外,全世界將在48小時內全部恢復訪問。

分析師卜梓琴指出, 這次百度的安全事件顯示出百度並沒有充分的應變機制, 並且衝擊了所有網路的流量, 如騰訊、新浪預計流量將下降大約在5%左右, 而搜狐和網易預計流量將會下降10%左右, 並且網域名稱的安全性將再次被關注(不知Register.com是否會因這個事件而被求償?), 這篇"專家聊百度大面積故障實錄:企業應重視域名資產"則呼籲企業要重視域名資產

Baidu的這個事件應該會讓中國更體認「控制權」的重要性, 就因為Baidu.com不是掌握在自己手裡, 結果被玩出這場戲 ...

而Google的事件則是「控制權」過了頭 ... Google高級副總裁David Drummond在Google官方Blog發表文章表示由去月中旬, 他們偵測到一次來自中國、針對公司基礎架構發起的非常高技術、有針對性的攻擊, 有證據顯示黑客的主要目的, 是進入中國人權活動人士的Gmail帳戶 ... 而Google則很罕見的大喊不爽, 並不排除退出中國市場

這是許多關於Google可能退出市場的報導:

豁出去?!Google.cn搜到六四
雅虎公司聲援谷歌﹐譴責網絡攻擊行為
首家西方企業翻臉——Google向中國說不
谷歌遭遇網絡攻擊後引入新安全措施
谷歌聲明原文
Google’s China Stance: More about Business than Thwarting Evil
A new approach to China

Google會不會退出中國市場? 官方的說明中:
We have decided we are no longer willing to continue censoring our results on Google.cn, and so over the next few weeks we will be discussing with the Chinese government the basis on which we could operate an unfiltered search engine within the law, if at all. We recognize that this may well mean having to shut down Google.cn, and potentially our offices in China.

公司已經決定不願再對Google.cn上的搜索結果進行內容審查﹐因此﹐未來幾週﹐公司和中國政府將討論在什麼樣的基礎上我們能夠在法律框架內運營未經過濾的搜索引擎﹐如果確有這種可能。我們認識到﹐這很可能意味著公司將不得不關閉Google.cn﹐以及我們在中國的辦公室。

由Google在中國的市佔率逐漸起色及中國搜尋市場的成長, Google當然不願意就此放棄, 但是又不願意扮演審查衛兵的角色, 想必是身心煎熬... 但是Google會不會退出中國市場? 其實決定權不在Google, Google其實還是希望可以談, 但如果中國持續封鎖或要求審查Google相關內容, Google根本無法做生意

如果真的最後讓Google退出中國市場, 那麼將沒有任何阻礙Baidu的能量了, 中國的搜尋市場變成一家獨大, 其實對於中國互聯網的發展是很大的傷害, 這個傷害很可能會陸續感染到其他週邊的外國企業, 長期而言中國將是最大的受害者!

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月9日星期三

Effective SEO : 什麼是有效的搜尋優化策略?



由於"SEO關鍵解碼"受到不錯的好評, 因此上星期受邀了兩場演講, 由這兩場演講中瞭解許多企業希望從SEOSEM中真正受益, 但是卻對於整個遊戲規則不太熟悉而不知從何做起, 我們就來談談2010年的趨勢與相關細節 ...

先來看看2010年起的SEO趨勢, 大致有以下幾個方向:

(1)網站信賴度將仍舊延續2009年的態勢, 只有提升網站信賴度才能在SERP有優秀的表現

(2)搜尋引擎將更朝向個人化的設計, 每個人看到的搜尋結果將更符合個人需求

(3)語意分析在2009年已經有不少成果, 這些成果將會廣泛應用在搜尋引擎技術上

(4)社交網路將更緊密與搜尋引擎結合, 唯有Search+Social才能打開搜尋行銷的大門

(5)jQuery, HTML5CSS3等技術將更廣泛運用在網頁設計上

(6)行動設備的網路存取將開始影響網站流量, 所以企業是否準備好Mobile版本的內容呢?

(7)介於blogging與MicroBlogging的MiniBlogging(如tumblr,posterous等)將紛紛開始搶佔市場

(8)RSS的運用正確與否將影響SEO的成效

(9)影音與圖檔的運用將更影響SEO成效

(10)SEO成效將更取決於網站優化的整體效果, 因此不要只把重點放在SEO本身

以上是大方向, 但是一般的企業可能還在摸索:

我到底如何才能讓搜尋引擎抓取更多的資料?
我應該如何建立有品質的backlink?
我應該如何配置Falsh與AJAX讓搜尋引擎抓到重要資料?
為何我的競爭對手的SERP都在我的前面?
為何別的網站有效的策略對我沒有效果?
為何SERP的提升無法有效的提升流量?

其實所有的問題根源都在網站信賴度!

沒有到達一定的網站信賴度, 搜尋引擎不會想辦法抓取你的網站上的更多的資料; 沒有到達一定的網站信賴度, 所有有效的SEO策略都會消減其效果 ... 因此追求網站信賴度是最重要的開始

那麼如何才能增加我的網站信賴度呢? "SEO關鍵解碼"已經把該說的都說了, 不過我們陸續會再擇要的說明 ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月4日星期五

2009 Traffic Review : 搜尋引擎優化成果檢視



時間過得真快, 還覺得剛剛迎接完2009年, 怎麼又要開始準備2010年了, 我們來檢視這一年的搜尋引擎優化作業的調整結果 ...

如上圖

2008年內的搜尋流量26.18%, 直接流量31.44%, 他站引進流量42.38%

2009年內的搜尋流量39.01%, 直接流量25.77%, 他站引進流量35.06%

並且總體流量在2009年比2008年增加了23%, 搜尋流量增加12.83%, 雖然直接流量與他站引進流量的比例降低, 但數字均有成長

顯示本年的搜尋引擎優化作業看起來是算不錯的成績

基本上搜尋引擎優化相關內容的讀者與其他的網站內容比起來, 其量是非常有限的, 大抵都是相關業者或是學術研究者, 對於其他讀者來說, 本站的內容是一點都不有趣, 因此流量能夠有23%的成長算是相當欣慰了

在搜尋流量中, 2009/01/01~2009/12/01約有兩萬個keywords, 其中與搜尋引擎優化相關的關鍵字以「bounce rate」457個最高, 其次是「sem」200個, 「搜尋引擎優化」179個, 「pagerank checker」151個, 「seo」133個, 「搜尋引擎行銷」127個 ... 顯然Long Tail Keyword的存在

因此如果你的網站只注意「主要關鍵字」的操作, 而沒有注意「衍生關鍵字」, 搜尋流量是比較難以提升的, 再者如果沒夠多的內容來支撐衍生關鍵字, 內容的關聯性也比較難以有突出的表現

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年12月2日星期三

Microsoft Pivot : 微軟最新推出的瀏覽軟體



微軟的Live Labs推出最新的瀏覽軟體Pivot, Microsoft Pivot這個瀏覽軟體已經完全不像IE, 以視覺的方式來進行資料的搜尋, 這個瀏覽軟體到底能夠做什麼呢?

Pivot原意是支點或中心點, 原本這個詞跟Microsoft Excel有關, 但在這裡應該是「以...為核心」或「圍繞」來解釋比較貼切, 也就是以你所需要的為核心, 所有相關的資訊就圍繞在四周
We tried to step back and design an interaction model that accommodates the complexity and scale of information rather than the traditional structure of the Web ... At the heart of Pivot are "Collections." They combine large groups of similar items on the Internet, so we can begin viewing the relationships between individual pieces of information in a new way. By visualizing hidden patterns, Pivot enables users to discover new insights while interacting with thousands of things at once.
微軟說為了能夠瀏覽大量而複雜的資料, 以「Collections」的概念把類似的資料集合起來, 以發掘更多以往找不出來的關聯 ... (僅大略翻譯)

以下是Microsoft Pivot的展示影片



以下是Microsoft Pivot的另外展示影片


Microsoft Pivot需要邀請才能安裝, 筆者原本已經收到邀請, 但後來才發現只能安裝在Vista或Windows 7上, 其詳細需求是:

(1)Recommended System Configuration: Windows 7 with Aero enabled, 2-GHz 32-bit (x86) processor, 2 gigabytes of random access memory.
(2)Supported System Configuration: Windows Vista with Aero enabled, 2-GHz 32-bit (x86) or 64-bit (x64) processor.
(3)Pivot is supported only on US English-based operating systems with US English date and time formats.
(4)256 megabytes of video memory
(5)Pivot requires .NET Framework 3.5 SP1 and Internet Explorer 8

如果你也想試用, 可到這裡來看詳細資料及邀請碼, 等筆者安裝試用完再來報告了 ...

相關參考:
Microsoft Pivot: New Visual Search Power
Microsoft Launches Pivot, A Radically New Visualization of Online Objects
Microsoft Pivot Rethinks Browsers and Search

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月21日星期六

Yebol 搜尋結果第一名 !?



先前文章"Yebol 與 Wowd 兩個近日推出的搜尋引擎"才剛介紹完Yebol, 閒來沒事試用來搜尋看看, 竟然出現上面的問題 ... 以「搜尋引擎行銷」搜尋, 排名第一名的文字部分是本站的內容, 但是連結卻連到美國的國會圖書館去 ...

實在百思不解, 本站的網頁跟美國國會圖書館的內容有何關係? 會造成Yebol把兩者串在一起呢?

除了「搜尋引擎行銷」搜尋之外, 連「搜尋引擎優化」搜尋也發生同樣的狀況



這些錯誤是使用搜尋引擎以來, 所看到最離譜的錯誤, 希望只出現在Yebol Beta版本, 正式版應該會更正吧?

相對於Yebol這個錯誤, 雖然Bing與Google沒有類似問題, 但是其搜尋結果也是讓許多人失望

如"Bing, Bang, Boom"這篇文章, 就有Bing與Google正反面的看法
Bing is not only more accurate, but more intelligent in its returns, declares Larry Monuteaux, network services administrator for Boston Properties. "While Google seems to give more results overall, Bing gives more directed, relevant results," he says. "After a while, I set Bing as my default and haven't looked back."
(有人認為Bing的搜尋結果比較準確)

Mark O'Brien, chief technologist for SpectraRep LLC, says that after comparing Bing and Google, Google still returns more accurate results for him. To better test this theory, he uses Google at work and Bing at home. "Many times at home I have to re-run the Bing search on Google to get usable information," says O'Brien.
(也有人認為Google的搜尋結果比較準確)

英文的搜尋不夠準確, 更別說是中文搜尋了, 關於更多Bing與Google的比較及相關內容, 我們另文再談了...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月18日星期三

Google Image Swirl : 關聯性圖案搜尋



Google的Image Swirl推出實驗版, 功能很類似Google Wonder Wheel 搜尋羅盤, 只不過是使用在圖形的搜尋, 這個圖形搜尋的內容如果跟Bing相互比較一下, 還真的蠻有趣的 ...

以下是Google Image Swirl以Taiwan搜尋的內容





以下是Bing以Taiwan搜尋的內容



有無發現第一層的資料還幾乎雷同, 目前的資料深度比較, Google還比Bing遜色一些, 精準度則是互有上下

這些圖形資料的分群或類似的比較, 大抵由幾個資料而來 : (1)檔案名稱 (2)圖案所在的文字敘述 (3)圖案的meta data(4)圖案的像素比對, 所以大量的資料中還是偶爾會發現完全不相干的資料出現

Google產品經理Aparna Chennapragada敘述說:
"It's not just the face, the color, the visual features of the images; we look inside the image and ask how they relate to each other on a pixel level."
所以Bing與Google最後圖案搜尋的決戰就在Pixel Level

從文字類的資料來分析, Bing與Google大概不分上下, 但是透過Pixel Level的分析, Bing其實是略佔上風, 而且Bing已經完全產品化, 但Google還剛從實驗室畢業, 不過Google的Swirl的界面比Bing較為直覺式, 是Bing應該更強化的地方

所以近來Google的Fast Flip news search, Google Squared, Google Image Swirl跟Bing的Visual Search, Bing Image Search都陸續開打, 資料視覺化顯然是文字搜尋之外很大的市場

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google Wonder Wheel 搜尋羅盤



在之前文章"什麼是Google Wonder Wheel?"提過這個, 當時翻譯成「摩天輪」, 現在Google定名為「搜尋羅盤」, 他是Google Search Options(搜尋選項)中的一個功能 ...

在Google Search Options(搜尋選項)中的功能以前也提過, 當你點選顯示選項就會出現 (如下圖)



你可以有下列功能:

(1)選擇特定類型的搜尋結果(如影片/新聞/網誌/論壇)
(2)選擇特定時間的搜尋結果, 但是特定時間還是有限制(如無法搜最近5小時), 但你可以參考Google搜尋工具
(3)篩選已經瀏覽或未瀏覽的搜尋結果
(4)使用搜尋羅盤、圖文並茂、更多敘述來顯示搜尋結果

以下是圖文並茂的搜尋結果


以下是更多敘述的搜尋結果


其中比較值得提的是「搜尋羅盤」, 因為「搜尋羅盤」的相關詞的正確與否影響搜尋品質最大, 目前看起來Google「搜尋羅盤」的中文的相關性還是有些問題, 並不能真正解析出相關詞

如下圖以Kartoo來搜尋, 英文界面還可以正確顯示相關資料, 但中文界面就還不能



但是不管如何, 這總是Google邁向更語意化(semantic)的開始, 以Google的動作來看, 應該在明年內會更加完備...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年11月12日星期四

Yebol 與 Wowd 兩個近日推出的搜尋引擎



這兩個在今年中被批露的搜尋引擎, 終於推出了Beta版, Yebol是由華裔前Yahoo工程師Hongfeng Yin(尹紅風)所創設, Wowd的CEO是Mark Drummond, 這兩個新網站有啥值得討論的呢?


(Yebol創辦人尹紅風)

關於尹紅風及Yebol, 這篇文章"Yebol搜索:一個知識型殺手的告白"有介紹, 就不再贅言 ...

以下是Yebol的畫面, 已經頗具搜尋引擎大將之風 ... 真是吹起一陣「紅風」乎?



Yebol已於2009/07正式上線, 運用語意搜尋技術(Semantic Search Technology), 提供超過1000萬個關鍵字搜尋資料, 目標是建立以人類思考模式為主的搜尋, 提供最全面的搜尋服務, 目的在將information轉為knowledge

Yebol搜尋不只出現單純結果, 其包括的範圍與Bing、Google比起來絲毫不遜色, Yebol使用的是Cloud Computing、MapReduce、Hadoop、Data Mining、Semantic...等技術

Yebol總部設在矽谷, 在北京中關村設有開發中心, 目前僅有英文版, 但可以搜尋中文資料, 未來下一步則考慮增加中文版, Yebol可以說是目前語意搜尋技術中比較貼近可廣泛使用的網站, 值得持續觀察

另外一個Wowd如何呢? 以下是Wowd的畫面, 速度雖快但是不能順利顯示中文!?



Wowd比較不像一般的搜尋引擎, 根據CNET的說法:
Wowd is a search engine without a data center. It puts the heavy lifting on the computers of the engine's users. With Wowd, you are the data center.
他是沒有資料中心的搜尋引擎(正確說法應該是沒有資料中心來負責crawling/indexing/ranking), 搜尋內容是由“Wowd Crowd”所產生, Ranking也是由“Wowd Crowd”來決定, Wowd Crowd就是指使用Wowd的使用者

這兩個搜尋引擎顯示了兩個趨勢:語意搜尋(Semantic Search)及使用者為中心(User-Centric), 其所使用的技術及索引評等的演算方式, 也應該持續觀察研究 ...

參考資料
Two cool search start-ups: Wowd and Yebol
Yebol in Wikipedia

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Bing 與 Wolfram Alpha 合作,提供精準搜尋


Bing與Wolfram Alpha在今年八月簽署合作協議後, Bing預計將推出更精準的搜尋, Bing強調的decision engine再加上Wolfram Alpha的answer engine, 會是什麼樣貌呢?

Wolfram Alpha的強項在於精準的回答問題, 雖然不能回答所有問題, 但是在某些領域上, 他的表現已經讓人很滿意了

Bing是Wolfram Alpha的第一位API的客人, 將透過Wolfram Alpha的資料來強化Bing的決策能力, 根據資料顯示首波將會使用在健康與數學的查詢(如下圖)



當在Bing查詢「BMI calculate」, 將會顯示BMI(body mass index)的計算器; 並且也可以讓Bing幫你把數學方程式畫出圖形; 或者比較各種食物的卡洛里 ...

但是目前為止, 這些功能尚未公開, 因此你只能透過Wolfram Alpha來瞭解往後Bing會如何提供搜尋資料

例如你在Wolfram Alpha打入「plot x^3 - 6x^2」, 結果如下:


當你搜尋「who is the president of taiwan」, 結果如下:


當你搜尋「who is the president of japan」, 結果如下: 他還知道日本沒有總統 :)


根據ReadWriteWeb的Frederic Lardinois質疑, 認為如果Bing只是把Wolfram Alpha的資料抓過來在Bing上顯示, 這個根本不是Integration(整合) ...

Wolfram Alpha的技術使用Mathematica(webMathematicagridMathematica), 但是資料來源呢? 根據Wolfram Alpha的說法是:
Does Wolfram|Alpha get its data from the web?
No. It comes from Wolfram|Alpha's internal knowledge base. Some of the data in that knowledge base is derived from official public or private websites, but most of it is from more systematic primary sources.

Where does Wolfram|Alpha's data come from?
Many different sources, combined and curated by the Wolfram|Alpha team. At the bottom of each relevant results page there's a "Source information" button, which provides background sources and references.

如果想讓Bing+Wolfram Alpha能夠回答更多問題, Bing與Wolfram Alpha必須更深入的整合, 因此雖然目前已經有合作的開始, 要真正能夠讓大眾享受到, 可能不是短期能夠達成的任務...

相關參考資料
Bing Launches Wolfram|Alpha Integration, Enhanced Hover Preview, and Full Page Weather/Events Results
Bing Teams Up With Wolfram Alpha
The Arrival of Wolfram Alpha Knowledge Engine

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月25日星期五

Yahoo New Search 與 Google SideWiki


Yahoo推出新的搜尋界面了, Google也推出了SideWiki, 這兩個新聞本身沒啥單獨播報的價值, 但是兩個手牽手的出來, 就有點意思了 ...

在2009/09/22, Yahoo推出了新的搜尋界面, PCMagazine這篇"Hands On with Yahoo's New Search Result Page"介紹了改變的樣貌

整個新的Yahoo Search其實感覺不到有什麼創新, 跟Google、Bing也沒有太大的差異, 但是當進入後出現了以下的畫面...詢問你是否允許Gears來存取資料(如下圖)



怎麼會出現Google Gears呢? 這個Google Gears是Google的Open Source專案, Yahoo的說明是:
Search Pad is a note-taking application that automatically tracks and organizes sites you find on Yahoo! Search to help you complete important tasks such as buying a car or planning a trip.
也就是利用Google Gears來把網頁當筆記本, 把網頁的瀏覽當成一個剪報資料, 而且讓你可以做筆記

註:相關訊息補充在後記

在2009/09/23, Google也推出了SideWiki, 可以讓你安裝plug-in後, 可以針對網頁發表意見, 而且是針對Public, 也就是別人也看得到

真是眼花撩亂了, Google SearchWiki也可以對網頁發表意見, 但是只限本身或分享的對象, 而Google SideWiki可以針對公眾, Yahoo的Google Gears可以把網頁當剪報資料加上筆記, 但只有存在local PC

為啥搞得這麼複雜? 怎麼不整合成一個東西? Yahoo推出新東西之後, 為啥Google隔天也推出新東西? 而且Yahoo還使用Google的Gears?

仔細分析起來還真的蠻好笑的, Google真的是滿手好牌, 以大老二來說, 只要其他業者出個Ace, Google就拿出老二來壓, 你有幾張Ace, Google就有幾張老二 ...

而Yahoo呢? 不是已經跟Microsoft合作, 怎麼還改Search界面? 如果說是為了以後新合作的front-end界面做準備, Microsoft怎麼可能會用Google Gears? 把Microsoft殺了也不可能

所以Yahoo的新搜尋界面, 未必是為了Microsoft-Yahoo Deal, Yahoo想告訴Microsoft跟大眾什麼訊息呢?

真是商場如戰場, 外行看熱鬧, 內行看門道 ...

2009/09/28後記:

為了忠實保留資料, 所有的修正只是標上刪除線, 而不直接修掉

話說造成錯誤判斷的原因為Chrome Browser, 起因為國外的文章也在探討Yahoo!Search Pad怎麼會出現Gears的視窗? 結果用Chrome去開啟http://search.yahoo.com, 確實出現Gears, 但是確忽略了Browser的問題

我們把Yahoo!Search Pad使用各Browser的技術相關訊息整理如下:

(1)Firefox 3.5, Safari 4, IE8: HTML5 localStorage
(2)Firefox 2.x and 3.0: Gecko globalStorage
(3)Safari 3.1 & 3.2: HTML5 Database Storage
(4)IE6, IE7: userData persistence
(5)Google Chrome: Gears Database API

所以在不同的Browser使用的儲存方式是使用不同的技術(如有錯誤,歡迎指正...漏氣求進步吧)

其實這些都不是本文的重點, 就是因為當時認為不是重點而未加深究, 本文的重點在請教各位的想法: Yahoo與Microsoft合作後, 會放棄Search嗎? Who knows?

所以也不是如讀者說的:本文在散佈陰謀論 .... 哈! 這使我笑好久, 本站還沒到那個等級啦

p.s. 筆者不是政治人物, 所以不會因為承認錯而丟臉的問題, 大家把問題看得太嚴重了!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月21日星期一

SEO智慧:搜索引擎优化与网站营销革命


SEO智慧:搜索引擎优化与网站营销革命」是「解密SEO」作者歐朝暉的新書, 這本新書比上一本談到更多搜尋引擎行銷的整體概念, 是一本值得看的好書 ...

近來關於「搜尋引擎行銷」與「搜尋引擎優化」的書越來越多, 但是主題大多圍繞在HTML結構上打轉, 既沒有網站優化整體的分析, 也沒談到搜尋引擎行銷的未來趨勢, 這本「SEO智慧」基本上則涵蓋了技術與趨勢的分析, 是值得推薦閱讀的書籍

前陣子透過網路書店, 訂了將近一個月的時間才拿到手, 這本厚達461頁的書可不容易馬上讀完, 尤其是簡體中文的關係, 花了好長的時間才閱讀完畢

雖然這是一本好書, 但還是有些缺點 (算是雞蛋裡挑骨頭吧), 且由於著作權的關係, 我們不直接轉載裡面的內容, 我們只概念性的來分析

首先這本書也導入了「網站優化」的概念, 而不是單純的討論「搜尋引擎優化」, 除了搜尋引擎之外還需要「以人為本」, 但是可惜的是網站優化的敘述比較分散, 不太容易讓新手完全瞭解內涵, 如我們在「SEO關鍵解碼」一書中提到的CLOUDS(內容優化、配置優化、目的優化、使用者界面優化、顯示優化、搜尋引擎優化), 是比較能夠體會網站優化的精神

另外這本書也提到了Outbound link的效果, 而不是一味的只注意Backlink, 但是敘述得太簡短, 可能讓讀者以為只是不要指向壞鄰居。並且也談到了長尾關鍵字(long tail keyword), 這個也是我們常說的不能只注意單一關鍵字, 而需分析延伸關鍵字, 但是書上只談到次級關鍵字, 可能讓讀者以為只需注意相關詞, 其實「贅詞」加上關鍵字及相關詞也應該一併注意, 例如: 「搜索引擎优化」、「什麼是搜索引擎优化」、「搜索引擎优化的定義」、「搜索引擎优化與网站优化的差異」、「搜索引擎优化與网站优化有何不同」... 等等

再來就是這本書也提到SEO 2.0, 也就是Web 2.0下的SEO, 強調Social Media的效果, 但是沒有提到我們書中的SEO 3.0及SEM 3.0, 也就是多樣的搜尋界面、語意相關的搜尋趨勢、及整體網路架構變化而引起搜尋行銷的變革, 我們在之前文章"SEO 與 Latent Semantic Analysis (LSA)", "搜尋引擎最佳化與隱性語意: SEO and Latent Semantic"也多所強調Latent Semantic Optimization (LSO)的重要

以上算是幾個雞蛋裡挑骨頭吧, 也可能還看得不夠仔細, 但是「SEO智慧:搜索引擎优化与网站营销革命」這本書的深度, 絕對算是非常值得大家閱讀的一本好書, 也歡迎大家閱讀後進行交流!

參考資料:
搜索引擎优化的定義
网站优化 - CLOUDS
搜索引擎优化的六大心法五大要素


標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月18日星期五

SEO 工具 : 讓Google搜尋更便利



Google搜尋引擎除了預設的搜尋之外, 你可以去選擇搜尋資料的時間範圍(如過去24小時內、一周內、一個月內、一年內), 這個貼心的設計可以取得時間範圍內最新的資料, 而不需要在舊資料中打滾, 但是 ... 如果你希望時間範圍是10分鐘內、12小時內、10天內 ... 那怎麼辦呢? 這篇文章告訴你如何任意設定你的時間範圍 ...

Google只提供如下的時間範圍


但是在某些情況下, 你需要的是30分鐘內、甚至5分鐘內的資料, 例如H1N1疫情, 我們可能需要知道最新的案例報告

在SEO的資料分析中, 我們也可能需要知道某個關鍵字在最近1個小時內是否有相關頁面, 這個資料量的頻率可能就是分析的重要參考, 例如某個關鍵字在30分鐘內一直增加, 大概這個關鍵字就是大家討論的焦點

這個Google搜尋工具就提供了「任意設定時間範圍的功能」, 如下圖:


上面出現了原本沒有的「10分鐘內」的範圍 ... 真是太神奇了吧!

你只需要選擇你所需要的minute/hour/day/week/month/year(如下圖), 再輸入你想搜尋的關鍵字, 就可以把Google Search變成分析資料的利器了!!



現在就開始使用這個更豐富的Google搜尋工具吧 ... 如果好用的話, 記得設成我的最愛喔! 並請大家多多使用這個SEO工具囉!!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月15日星期二

Bing Visual Search : 微軟推出視覺搜尋



在之前文章"資料視覺化 : Data Visualization", 我們曾經報導過一些視覺搜尋的範例, 現在微軟也在美國推出了Bing Visual Search Beta (如上圖) ... 這個視覺搜尋雖然資料只限於英文資料, 但在台灣也可以先睹為快 ...

(1)首先打開Bing.com後, 點選右上的"台灣"
(2)將"Select a country/region"設定為 - United States - English (美國 - 英文)
(3)然後連到 http://www.bing.com/visualsearch

你就可以看到如上圖的界面

但是要開始使用Bing Visual Search之前, 還需要安裝Microsoft Silverlight

這個視覺搜尋並不是要取代文字搜尋, 而是當文字搜尋難以找到資料時, 可以使用視覺化的界面來簡化搜尋

例如, 你可能很熟悉某個明星, 但是卻不知道他到底叫啥名字, 這時你就可以使用如下界面來瀏覽



這樣就可以由圖片來找到你要找的明星

但是如果你要找數位相機 .... 就可能不是那麼一回事 (如下圖)



每個相機就算是同一個品牌, 許多型號也是長得差不多, 如果你連品牌都不記得的話, 可能這個視覺搜尋也不能幫上忙

Bing的Director,Stefan Weitz說, 這個視覺搜尋的目的是希望使用者能夠像走到百貨公司去挑產品一樣, 可以一一瀏覽挑選, 對於沒有目的的消費者來說算是不錯的使用界面

ComputerWorld在"Microsoft fires shot at Google -- Bing's Visual Search"文章說, Bing開始對Google開槍了 ... 在昨天的TechCrunch50 conference發表後, 預計將很快的增加更多主題可以使用視覺搜尋

The Gabriel Consulting Group的分析師Dan Olds說:
"If the technology works as well as we're hearing so far, [Visual Search] should give Microsoft some formidable ammunition to use against Google in the search wars.
視覺搜尋可讓微軟擁有強大火力來與Google抗衡, 不知Google後續會推出什麼更新奇的武器? 還是只能乖乖就範? 就等著看啦!

2009/09/15後記:

果不出所料, Google馬上閃電推出了Fast Flip, 雖然跟視覺化不是那麼相關, 但是這個Google Labs裡的Project硬是推了出來, 應該是想沖淡Bing Visual Search的宣傳效果吧, 這個Fast Flip比較像是媒體網站的預覽, 可以快速的翻看各媒體網站的首頁, 但是對於電腦來說並不是太大意義, 反而有點像手機瀏覽網頁的形態

參考: Google Fast Flip

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月7日星期一

搜尋引擎最佳化與隱性語意: SEO and Latent Semantic



上篇文章談到Latent Semantic Analysis, 指出目前Latent Semantic尚未有大規模的影響, 但是影響已經逐步會顯示出來, 我們利用實際例子來看看到底可能有什麼影響?

有老外的文章舉了例子, 然後最後的結論是Google也沒有Latent Semantic的應用, 他的說法是:

在Google Search上, Results about 825,000,000 for car, Results about 99,600,000 for automobile, 因為automobile查詢中沒有包括car的資料, 所以Google沒有使用Latent Semantic技術

這個分析可以說根本不科學, 使用者使用CAR去查詢, 未必想連AUTOMOBILE也一起查, 同樣的以AUTOMOBILE去查詢, 也未必想以CAR也一起查詢

比較能夠說服的說法是: 如果使用者想查與CAR的所有相關資料, 是否有界面可以讓使用者來利用呢?

很遺憾的是目前的搜尋引擎Google,Bing, Yahoo等, 對於中文的隱性語意是比較弱的, 因為還沒有完整的關聯字庫與演算法, 所得到的結果沒有英文來得好

但是我們來看以下的例子:

我們用Google Wonder Wheel來看, 以「搜尋引擎優化」與「搜尋引擎最佳化」來看, 如下:


以上的「搜尋引擎優化」與「搜尋引擎最佳化」已經可以透過「SEO」這個詞來串起來, 當時"SEO關鍵解碼"出版時, Google Wonder Wheel還沒有中文資料, 才幾個月的時間, Google中文語意資料庫已經逐步備齊了

所以類似的情況下, 未來的SERP未必會以keyword為主要依據, 很可能根本沒有出現keyword也可能因具備Latent Semantic(隱性語意)而出現在SERP中

我們再來看看英文Google的例子, 使用Tilde(流水符號)來查詢Google, 以「~mp3」來查詢, 發現「music」也被當成keyword(如下圖)



所以你認為Latent Semantic(隱性語意)是否已經在Google開始運作了呢? 答案當然是肯定的, 只是一般使用者還沒有察覺出來, 而Bing/Yahoo的英文也已經俱備相關詞的查詢(如下圖)

Yahoo的MP3查詢


Bing的MP3查詢


這些搜尋引擎對於Latent Semantic的準備工作已經逐步就位, 就等適當時機推出更符合人性的使用者界面

如果你認為那麼我在網頁利用關鍵字充塞(Keyword stuffing)來把所有相關的keyword都包含起來, 不就可以應付Latent Semantic的趨勢了嗎? 相關詞只是隱性語意的一部分, 後面再來談這個問題了 ...


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年9月4日星期五

SEO 與 Latent Semantic Analysis (LSA)


(From Amazon)

什麼是Latent Semantic Analysis (LSA)? 什麼是Semantic? 經過LSA的Latent Semantic Indexing (LSI)與目前的Keyword Indexing有何不同? LSA與LSI的趨勢對於搜尋引擎優化有何影響?

首先來解釋一下Semantic(語意),Wikipedia說:
Semantics is the study of meaning. The word "semantics" itself denotes a range of ideas, from the popular to the highly technical. It is often used in ordinary language to denote a problem of understanding that comes down to word selection or connotation.

語意是研究文字的意義, 也就是文字本身之外所代表的內涵

例如有人問: 這次88水災, 你「捐」了沒?

當然不是問你「捐血」了沒, 更不是問你「捐軀」了沒 ... 而是問你「捐款」了沒, 也是問你「捐錢」了沒

這個語意的分析, 當然在目前的搜尋引擎是無法判斷的, 但是這個分析將會是未來搜尋引擎的目標

某個字詞有同義詞、類似詞...這個可以很簡單的透過類似WordNet的字典查詢, 去計算其間的semantic similarity, 但是某個字詞在一個文件中到底是跟哪個詞最接近, 就不是簡單的計算可以代表

Wikipedia解釋Latent Semantic Analysis (LSA):
Latent semantic analysis (LSA) is a technique in natural language processing, in particular in vectorial semantics, of analyzing relationships between a set of documents and the terms they contain by producing a set of concepts related to the documents and terms.

Latent Semantic Analysis (LSA, 隱含語意分析)就是以統計的方式去解析某個字詞在文件間的接近程度, 使用LSA來分析而成的索引就LSI(Latent Semantic Indexing)

LSA與LSI的趨勢對於搜尋引擎優化有何影響? 目前尚未有大規模的影響, 但是影響已經逐步會顯示出來, 我們後續再來持續分析LSA對於作弊的SEO會產生什麼影響, 以及關鍵字充塞(Keyword stuffing)如何在LSA下失效 ...


標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年8月13日星期四

SEM : Search Engine Performance Report 2009Q2



2009年第二季三大搜尋引擎(Google/Yahoo/Bing)的成績單揭曉了, eFrontier近日公佈了2008年Q2~2009年Q2的美國市場統計報告, 這個報告包括了市佔率、投資報酬率等多項指標分析

Google/Yahoo/Bing的Click Share於2009Q2各是: 71.6%, 24.3%, 4.1%
Google/Yahoo/Bing的Spend Share於2009Q2各是: 75%, 20.5%, 4.5%

整體美國2009年Q2的Spend比去年同期下跌21%, 但ROI(Return On Investment)上升29%, 也就是支出降低, 點擊成本亦降低

2009年Q2與去年同期相比, 就小廣告主來說, Spend降低幅度最大(-41%), 大型廣告主Spend降低22%, 但中型廣告主Spend卻上升5%, 小廣告主/中型廣告主/大型廣告主的ROI各是+20%/-12%/+35%

比較Google/Yahoo/Bing 2009Q2的ROI, 各是+43%/-8%/+24% (如下圖)


詳細資料請參考 eFrontier Search Engine Performance Report 2009Q2 (PDF檔案)

除了eFrontier的報告之外, Organic Inc.也公佈了Bing的ROI報告, 這個報告比較了Bing與先前的Microsoft Live Search, 發現在某些大型客戶的ROI提升了近23%

而在eFrontier的另外針對Bing的統計報告中, Bing的paid-click share在六月的兩週中提升13%, 到八月第一週則提升了44%

參考資料:
Organic Studies ROI of Paid Search for Bing Vs. Live Search
Study: Bing Shows Signs Of Positive ROI For Marketers
Study Shows ROI Improvements in Bing Over Live Search

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年8月11日星期二

Caffeine : Google 搜尋即將使用更新架構


面對Microsoft與Yahoo的合作案, 跟Microsoft Bing的來勢洶洶, Google到底怕不怕? Google這幾天推出了最新的搜尋架構 (代號Caffeine), 顯然Google已經出手要打小孩囉 ...

這個代號為Caffeine的新架構, 其測試的網址為

http://www2.sandbox.google.com/
(P.S. 美國時間2009/8/13下午左右以上網址將暫停使用者測試)

這個新的搜尋更新了資料抓取(Crawling)、資料索引(Indexing)、及網頁評等(Ranking)的架構

這個搜尋到底跟舊的有何差異呢? 資料筆數有增有減, SERP的順序略有變動, SERP中的描述(Description)略有變動

雖然只是稍有增減或略有變動, 但是某些網頁可能在某些Query中會不見, 或排序變化

例如: EZTravel在「機票」查詢中已經不在SERP前三頁, 康健雜誌已出現在「減肥」查詢中(以上刪除,因查詢結果又有變動)

看起來似乎更注重整體內容與關鍵字的相關度及權威度,但是很可惜的是部分黑帽SEO的網站似乎仍舊可以利用漏洞來取得優勢

但目前該架構尚在接受各方意見修正中, 尚未能看出最後結果, 保持持續觀察了, 最後的結果將會牽動整個搜尋市場及Google是否能夠保持領先的關鍵, 因此這個更新可以說是Google很重要的一步 ...

後記:

為什麼Google的搜尋更新代號是Caffeine(咖啡因)? 大概跟Matt Cutts說過的一句話有關, 他說Coffee是"the magic get-work-done powder" (咖啡是讓工作完成的神奇粉末)

多少工程師必須熬夜把工作完成, 大概都少不了咖啡, 如果把Google每年的咖啡用量統計一下, 可能會是很驚人的數字, 所以可能這個因素, 就把next-generation infrastructure叫做Caffeine (純粹猜測)

Matt在他的"More info on the Caffeine Update"文章中戲稱, 如果一個Google工程師寫了一支程式, 這個程式在六個月後可能一半的程式碼都已經改寫了, 也就是一支程式在Google的壽命只有一年的時間, 過了一年後他的演算法就被大翻新了

2009/8/12後記:

Matt Cutts在WebProNews有個影片說明Caffeine Update...
Breaking News: Matt Cutts Explains Caffeine Update

哈哈...怎麼Matt Cutts也理個大光頭了, 看影片兩個大光頭真滑稽, 難道要變SEO大師都要理光頭!?

2009/08/13後記:

昨天有讀者反應, 似乎新的Google Search (Caffeine)沒有差異, 這個Facesaerch Caffeine Compare可以直接比較新舊搜尋的差別

大致上差別會表現在: 資料量, 反應時間, 網站描述, 排名 ..., 有些查詢沒有太大差異, 有些查詢就可能看出差異

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年8月4日星期二

Microsoft 與 Yahoo 合體對 SEO SEM 的影響



前文"Microsoft 與Yahoo聯合打擊Google"所說的合作案終於在7/29進入下一階段, Microsoft與Yahoo的合體到底對誰有利? 到底對於SEO SEM會有何影響呢?

Microsoft與Yahoo的合作內容大致如下:

(1)兩者合作十年
(2)兩者的搜尋平台將會是Powered By Bing
(3)廣告平台將都會採用微軟的AdCenter平台
(4)前五年Yahoo將取得Yahoo sites的88%的廣告營收
(5)合作平台將在2010年啟用

這個合作代表的意思是: 原本在Yahoo表現出色的SEO將走入歷史, 將以Bing Search為主, 而原本只在Yahoo出現的Paid Search廣告, 將在兩者平台上出現

也就是說對於專注於Yahoo的SEO必須重新面對Bing (尤其是英文網站), 但對於PPC則是擴大了腹地

因為Bing在中文搜尋尚遠不如英文搜尋, 因此短期內Bing是否會收納Yahoo的中文搜尋結果? 目前還看不出來

Microsoft此舉一次消滅了次要敵人Yahoo, 專心面對Google, Yahoo則拿到了利潤, 雖然退出了搜尋, 但轉往其他網路服務....因此Microsoft算是這個合作的最大贏家, Yahoo Search則將在這十年中暫時消失

Yahoo Search消失後能夠再回來否? 大概只能專心其他的網路服務吧! 10年對於網路來說是天文數字了, 大概只能認命退出Search Market了....對於Google來說, 有沒有影響? 應該不能說沒有影響, 但是短期內則不會有太大的影響

其他參考資料
Is Google Really Threatened By This Yahoo Microsoft Deal?
What The Microsoft-Yahoo Deal means for Paid Search Advertisers
Yahoo! left looking for a role after 'Google-killer' tie-up
Microsoft, Yahoo! agree on Internet search partnership
Yahoo Gives In to Microsoft, Gives Up on Search
Microsoft/ Yahoo Deal Already Reshaping SEO

2009/8/5後記:

Microsoft與Yahoo的合作中, Yahoo Sites的廣告收益, 前五年Yahoo收到88%, 而後五年將收到90%, Yahoo將負責大型的廣告客戶, 如果五年後Microsoft想要回大型的廣告客戶, Yahoo將從90%收益增加為93%, 如果Yahoo不想交回大型的廣告客戶, Yahoo將從90%收益降低為83% (詳見: Microsoft deal will pay Yahoo more after 5 years), Microsoft也將雇用Yahoo的400位工程師, 並且Blekko也放出消息要挖角 (詳見: http://twitter.com/skrenta)....所以Yahoo放棄掉Search後, 旗下的搜尋技術工程師大多勢必分散各處, 因此十年後的Yahoo想重回搜尋市場可能是困難重重了, 而Yahoo在此deal中也將會揭開技術融合到Bing Search中, 所以似乎未來看到的Bing Search也許不只是現在看到的, 而是Bing+Yahoo

2009/08/11後記:

根據Global Times訊息 "Impact of Microsoft, Yahoo deal in China unclear"

由於Yahoo中國屬於阿里巴巴旗下網站, 因此似乎傾向與Microsoft/Yahoo合作切割, 也就是Yahoo中國會維持原貌運作

但是台灣的Yahoo!奇摩自2007年底由子公司成為Yahoo分公司, 屬於美國雅虎旗下的企業體, 因此可能沒有Yahoo中國幸運, 也就是說Yahoo!奇摩是否要走Yahoo中國的模式, 並非Yahoo說了算, 而需Microsoft也同意, 所以Yahoo!奇摩是否會維持不變呢? 後續持續觀察了

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年7月21日星期二

Microsoft 與 Yahoo 聯合打擊 Google



Yahoo與Microsoft之間的合作案已經談很久了, 可說高潮迭起而最後破局, 但是他們同時面對的Google始終佔據大部份市場, 可以說是雙方最大的痛, 如果不聯合次要敵人來打擊主要敵人, 可說一點勝算都沒有, 從今年六月Microsoft Bing的成功提升市佔率後, 讓Microsoft又重新掌握了一個重要籌碼 ...

原本Microsoft打算以四百多億美金買下Yahoo, 這個主意也曾經讓Yahoo一度動心, 但是最後還是沒能達成協議

PC Magazine在這篇新聞"Icahn Wants Yahoo-Microsoft Deal"透露, Microsoft與Yahoo已經很可能協議出合作的策略來對抗Google

從AllthingsD這篇文章"Yahoo Search Ad Deal With Microsoft “Down to the Short Strokes”–But Caution Also Advised", 以及Tomshardware這篇"Yahoo and Microsoft to Sign Search/Ad Deal", Microsoft與Yahoo確實已經蠻可能會在近期達成合作協議, 但是最後還需要Antitrust Division(美國司法部反托拉斯署)的同意

目前由各項資料得知, Microsoft有意接手Yahoo的Search Engine Results ADs(也就是關鍵字廣告), 而Yahoo則可以得到大筆的資金, 但是最後的協議內容尚未完全定案

這個合作案的結果是否會影響搜尋引擎的生態與網站的行銷策略? 值得密切觀察了 ...

其他參考資料
Microsoft wants to purchase Yahoo (2008/2/1)
Microsoft's big bid for Yahoo (2008/5~2008/9)

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年7月15日星期三

BingTweets : Bing 與 Twitter 的整合



Twitter的廣大用戶及即時訊息傳遞的功能已經讓搜尋引擎不得不開始重視了, Microsoft與Federated Media將Bing與Twitter整合在一起形成了....BingTweets

當進入BingTweets後, 就可以看到Twitter的各類熱門話題, 你也可以自己下關鍵字同時去查詢Bing跟Twitter

雖然Google也已經將Twitter的內容整合在Google Search上, 但是通常Twitter的資料都不會在前面的頁面, 因此Micrsoft的這個BingTweets確實可以滿足不少需要瞭解Twitter上的一些內容趨勢的使用者...

目前測試結果, BingTweets的表現算佳作, 雖然某些字詞還不能百分百的搜尋得到, 但是在Real-time上, 已屬不易 ...

除了整合Bing與Twitter外, BingTweets還有一個類似專欄的內容--http://bingTweets/ideas/, 如下圖



將各專欄作家對於Search相關的ideas整理出來, 從這邊也可以讀出他們對搜尋這個領域的趨勢概念!

延伸閱讀 : Bing 開始提供 Twitter 即時搜尋

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月25日星期四

Blekko 將在近期推出


本網在去年中報導過"Blekko:下一個Google?", 經過了這麼久, Blekko到底進度怎麼樣了? Belkko真能如大家所期待的樣子風光如期推出嗎? 我們聽聽創辦人Rich Skrenta怎麼說 ...

對於Startup來說, Blekko的創辦過程算是很順利了, 看看他們的辦公室還不算寒酸, 而且初期就有200部伺服器, 11個員工...雖然跟Google比起來差距還是很大, 以這樣的規模是否能夠跟Google匹敵呢? Rich Skrenta認為他們的初期當然無法跟Google比較, 但是會帶來新的視野

根據有些曾經看過Belkko的展示的人說, 只有一個字可以形容: COOL !

筆者在前陣子也接觸過Rich Skrenta, 詢問他對於Bing的表現及一些問題, 畢竟這些網路的先驅的看法自有其重要參考價值, 尤其是Rich Skrenta是DMOZ的創辦人之一, 也曾經創辦Topix線上新聞, Rich Skrenta在ComScore尚未公佈統計資料前, 就認為Bing在美國市場的表現應該相當優秀, 也對於Bing的後勁相當看好

目前根據Marcus Schuler的部落格來看, Blekko可望在2009年七八月間可以推出... 到時就可以看到到底什麼是COOL了!!

參考資料
Rich Skrenta: blekko.com will presumably launch in 3 months

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月22日星期一

SEO 書籍 - SEO 關鍵解碼




什麼是SEO的趨勢? 什麼才是長治久安的SEO技巧? 什麼是SEO必須具備的技術? Web 3.0的趨勢下, SEO 3.0會是什麼樣貌? 從搜尋引擎的專利資料, SEO可以獲得什麼樣的啟發? SEM(Search Engine Marketing)是否就只是SEO加上關鍵字廣告? 企業除了外包SEO/SEM之外, 應該如何更深刻的認識搜尋行銷? 你都可以由「SEO 關鍵解碼」書中獲得解答!

SEO 關鍵解碼一書即將出版,本書探討搜尋引擎的來龍去脈, 解釋SEO/SEM等相關的觀念, 由網站優化的六大項目(C內容優化/L配置優化/O目的優化/U使用者界面優化/D顯示優化/S搜尋引擎優化=CLOUDS)來談如何在網路上進行搜尋行銷, 利用SEO六大心法、五大要素、三大建議、及十大守則來加強搜尋引擎優化的概念, 並詳細說明常見的疑難問題, 透過搜尋引擎業者的發展與專利資料來說明搜尋引擎優化與行銷的趨勢及應該具備的知識 ...

是目前市面上SEOSEM的「入門工具書」及「進階研究」最佳參考書籍

本書「SEO 關鍵解碼:網站行銷與排名優化實戰」共分成十四章, 四百餘頁, 由PCuSER出版, 是繼「解密SEO:如何讓網站排名第一」後, 2009年最新力作, 為本網編輯群嘔心瀝血之作!

◎第一章 搜尋引擎 -- 讓讀者能夠瞭解搜尋引擎完整的來龍去脈。
◎第二章 搜尋引擎行銷 -- 一場看不見的網路行銷戰場
◎第三章 搜尋引擎優化 -- 剖析搜尋引擎優化的各項因素分析
◎第四章 內容優化 -- 內容為王, 如何以內容主導一切
◎第五章 配置優化 -- 網頁的配置如何影響搜尋引擎優化與行銷
◎第六章 目的優化 -- 如何讓搜尋引擎優化與行銷達成網站的目的
◎第七章 使用者界面優化 -- 使用者界面如何影響搜尋引擎優化與行銷
◎第八章 顯示優化 -- 哪些因素影響了網頁效能
◎第九章 連結策略 -- 如何進行正確的連結策略, 以達成行銷網站的目的
◎第十章 廠商與案例 -- 廠商訪談與分析
◎第十一章 工具篇 -- 如何善用工具以收事半功倍之效
◎第十二章 搜尋引擎的未來趨勢 -- 讓搜尋引擎優化與行銷長治久安
◎第十三章 搜尋行銷的問題與解答 -- 常見問題與解答
◎第十四章 搜尋引擎技術專利 -- 透過技術與專利資料分析來瞭解搜尋引擎

如何在Web 3.0時代應用「SEO 3.0」與「SEM 3.0」? 你如何因應搜尋引擎演算法的改變? 如何提高你的網站銷售率? 如何提高你對網站的投資報酬率? 你的導入網頁做對了嗎? 你抓對了熱門的關鍵字了嗎? 你是否只注意PageRank而忘了還有更重要的? 個人化搜尋時代,你還只重視SERP嗎? 如何由「Katamari Philosophy」找到你的網站利基? 你真的瞭解PageRank演算法嗎? 你的PR5頁面還需要幾個Link才能到達PR6?

作弊的黑帽SEO只能一時獲得成效, 但是終究會被識破, 以一時的SERP糟蹋了網站信譽, 不是聰明的作法, 以健全的SEO作法才是真正的解決問題, 瞭解搜尋引擎如何抓取資料、如何索引資料、如何評估資料、如何顯示資料 ... 讓你的網站真正讓搜尋引擎瞭解才是正道!

如果你需要SEO/SEM的參考書籍, 請再等幾天就可以在博客來及各大書店購買!!

「SEO 關鍵解碼:網站行銷與排名優化實戰」將會讓你獲得滿意的解答


並且若有任何問題, 也可以透過討論來獲得更詳細的解答及知識交流!!最新出版訊息將隨後更新!

後記: SEO 關鍵解碼一書可於7月中旬到以下網路書店及各大書店購買



可在以下網路書店購買:
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼
SEO 關鍵解碼

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月18日星期四

Google 氣炸了...推出Explore Google Search

近幾週Bing的後勢看漲, 被許多使用者讚賞, Google看在眼裡真的是吃味十足, 因為Bing被稱讚的功能都是Google早就提供的, 就好像放牛班的學生突然考上大學, 突然吸引許多關愛的眼神, 反而考上台大的被晾在一邊 ...


如上圖, 英文界面中的"Discovering the web:Explore the World of Google Search"...就在提醒大家......喂, 我這裡都有耶!!

由於ComScore的資料, Bing連兩週連續漲勢, 穿透率已經到16.7%(如下圖), 雖然還離Google有段距離, 但是已經讓Google頻頻往後頭瞧....這小子是否吃錯藥了? 還是打了類固醇? 不怕跑歪腰喔!?



在Google的Explore Google Search中, 其實不是新東西(如下)


當你打入Yankees, 就會顯示洋基最新的比數統計(如下)


如果你用中文搜尋, 也可以看到同樣的效果(如下)


Google到底在怕什麼? 因為常期以來, Google沒有對消費者市場做行銷, 很少敲鑼打鼓告訴使用者有哪些新功能, 通常都是用了以後, 才突然發現...嗯, 又不一樣了!

所以面對於微軟砸大錢來行銷Bing, 雖然不足以造成太大威脅, 但是還是怕...「曾參效應」

啥是「曾參效應」? 就是怕大家聽多了, 就認為是真的! 以為Bing比Google優秀

從教育部成語典故中:

春秋時魯國有一個學者,名叫曾參,他是孔子的得意門生。學養很深,品性端正,是個有名的孝子。他住在魯國費(音ㄅ|ˋ)邑時候,有一個和他同名的人殺了人,有人就跑去跟曾參的母親說:「曾參殺人了!」曾參的母親說:「我兒子不會殺人!」就照常織她的布,沒有理會。過了不久又有人又來說:「曾參殺人了!」曾子的母親還是泰然自若地繼續織布。過了一會,又有人跑來說:「曾參殺人了!」曾子的母親就害怕起來,丟下織布的梭子,跳過圍牆逃走了。像曾參那麼賢良的人,只要多幾個人來說他殺了人,那麼連對他最有信心的母親也會相信,可見流言的可畏。後來「曾參殺人」就被用來比喻流言可畏或稱誣枉的災禍。


(註: 為什麼曾參的母親要跳過圍牆逃走呢? 為什麼是跳而不是爬呢? 請問教育部吧!)

另外是怕「連鎖效應」, 就是Bing能! Yahoo也能! 如果沒有壓下Bing的漲勢, 到時可能Yahoo也依樣畫葫蘆

這些搜尋引擎的拼鬥, 對於使用者來說是最大的福音, 因為搜尋更精準了, 但是對於SEO來說更有不可預知的變化, 搜尋引擎優化與搜尋引擎行銷的作業更是會受到影響, 什麼變化什麼影響呢? 等我吃飽再說了...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月15日星期一

SEO SEM 的未來 : 3.0的到來



今年是搜尋引擎暗潮洶湧的一年, 我們在去年底的文章就披露許多內容, 近期從Google/Microsoft/Yahoo等業者的許多大小動作更可以看出 ... 要靠搜尋引擎進行行銷需要有新的思維了


搜尋引擎改變了什麼? 搜尋引擎優化/搜尋引擎最佳化應該如何進行? 搜尋引擎行銷的趨勢是什麼? 網站SEO的策略應該如何因應? 當然最重要的是演算法已經改變了, 從單純的連結分析到從使用者的觀點出發, 從單純的內容分析到內容關聯分析

這些改變以Google的變化最大, 其次為Bing, 再來是Yahoo

這些轉變將在今年下半年會有更明顯的變化

而SEO與SEM將不再只是企業在玩的遊戲, SEO與SEM必須是所有網路人應該具備的「常識」, 也就是簡單的SEO/SEM必須自己親自為之, 而複雜的作業則必須交給專業的SEO/SEM廠商

什麼是簡單的SEO/SEM作業? 就是你的內容跟結構必須符合搜尋引擎的需求

什麼是複雜的SEO/SEM作業? 就是如何透過分析來微調將投資報酬率極大化

你不能期待SEO/SEM業者去幫你增加有看頭的內容, SEO/SEM業者不可能瞭解每個行業的know-how, 因此這些作業必須親自為之, 但內容的產生不能沒有注意搜尋引擎的需求, 因此SEO與SEM就必須是所有行業的「常識」

當有這些可以吸引讀者的內容後, SEO/SEM廠商才能真正進行健全的分析作業, 你的SEO/SEM成果才能長治久安

如果還在靠作弊愚弄搜尋引擎, 將來不可能也愚弄讀者, 搜尋引擎將會一一把沒有品質的網站打回原形

所以SEO與SEM必備的「常識」, 不是只有SEO/SEM業者才需要具備, 所有具有網站的人或企業都應該積極瞭解, 一來可以補充SEO/SEM業者的不足, 二來可以跟SEO/SEM業者正常的溝通, 讓SEO/SEM業者順利的分析將投資報酬率極大化

SEO SEM的未來會是什麼? 就是以使用者為依歸, 讓使用者得到他們想要的內容, 而你必須對於搜尋引擎的作業弄清楚, 才能讓優秀的內容快速的讓使用者尋找得到!

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月10日星期三

Bing 是否能挽回 Microsoft 的劣勢?



Bing自六月初推出沒幾天, 反應有好有壞, 但是我們之前的文章"Microsoft Bing 雖然現身, 但是猶抱琵琶半遮面", 大抵還是保持正面的看法, 現在ComScore出來報告了....

才一週的時間, Bing的搜尋穿透深度(大抵可以說是Reach)已經增加1.7%而到15.5%, 經過proxy的資料密度已經增加2.0%到達11.1% (根據美國用戶的統計資料)

如果微軟繼續推到其他語文都完全上線的話, Google應該會受到點威脅, 因此我們也可以透過Google近日的動作頻頻, 知道確實Google有些想壓下Bing的氣勢

Bing的發展也讓Yahoo擔心受怕, 因為根據StatCounter的統計, Bing曾經在6/4追上Yahoo (參考: StatCounter:Bing搜尋一度超越Yahoo成全球第二名)



所以後續可以預期的是....原本雙雄爭霸的局面, 可能會變成了三國鼎立了, 2009年會是搜尋引擎很精彩的一年!!

2009/6/11 後記:

今天我問Rich Skrenta, 他認為Bing是非常好的產品, 微軟將會透過Bing來取得市場佔有率的大幅成長

跟我的想法有點類似, 只是目前的成長只限於英語系國家, 也許等微軟準備好中文的關聯, 台灣跟中國才會感受到Bing的威力

誰是Rich Skrenta? 其中最重要的是, 他就是ODP的創始人之一, 也是將推出的搜尋引擎Blekko的創辦人, 以他的背景會看好Bing, 大概Google會有點擔心了


標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

NoFollow 真的可以做到 PageRank Sculpting 嗎?



前文"PageRank Sculpting 與 PageRank Siloing"留下了一個疑問, nofollow真的是可以照我們的意思去分派PageRank嗎?? 我們現在來看看到底發生什麼事情了...

PageRank Sculpting 是許多SEO業者常用到的手法, 就是經過rel="nofollow"來限制某些link去分享PR, Google在"關於 rel="nofollow"這麼說:

Google 如何處理 nofollow 的連結?

...表示 Google 不會在這些連結之中傳輸 PageRank 或使用錨點文字。 基本上,使用 nofollow 會使我們將目標連結剔除在網頁整體圖表之外。 不過,如果其他網站在沒有使用 nofollow 的情況下連到目標網頁,或如果網址已經透過 Sitemap 提交給 Google,這些網頁可能還是會出現在索引中。 此外,請您特別注意,其他的搜尋引擎處理 nofollow 的方式可能稍有不同。


Google說他們不會傳遞PR及Anchor Text給具有nofollow的連結, OK...這個沒有問題, 但是根據以往的說法:

如果PR10的網頁有10個link, 其中有8個nofollow, 所以只有2個會接受PageRank分享, 而接受的PR值各是PR10/2

但是在2009 SMX接收到的訊息卻是:

如果PR10的網頁有10個link, 其中有8個nofollow, 所以只有2個會接受PageRank分享, 而接受的PR值各是PR10/10 (8個nofollow沒有收到PR, 但是仍舊除以10)

也就是說nofollow並不能真正達成PageRank Sculpting的目的, nofollow雖讓某些頁面沒有接收PR, 但是PR已經部分遺失, 目前Google尚未正式做出解釋

我們再回去Google的解釋看看: "Google 不會在這些連結之中傳輸 PageRank 或使用錨點文字"....他並沒有說其他沒有nofollow的頁面會接收多少PR

根據非正式管道得知, Google之所以沒照大家認知來處理nofollow是為了保持資料的完整性, 也就是網頁A有10個往外連結, 這個數字10會是其他網頁連入連結的數字來源, 如果要讓PR只除以非nofollow數目, 則必須每個網頁多出一個變數來記錄非nofollow, 也就是多出數十億個以上的counter變數儲存空間

所以Google很可能不會做出處理, 也不會正式回應, 因為有太多更重要的需要處理

那我們應該怎麼面對nofollow呢? 如同我們在outbound link effect說的, 就把nofollow當成關係串聯與否的開關, 不要去想PageRank Sculpting了

後續如何發展...再說囉!

後記 2009/06/16:

Matt Cutts終於在2009/06/15的文章"PageRank sculpting"證實了....

So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page). More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each.


PR=10分, 有10個outbound link, 其中5個是nofollow, 原本應該5個link可以分到2分, 但是Google已經在一年以前修改, 沒有nofollow的5個link只各以分到1分 .... 當然其他5個nofollow的link什麼都沒分到

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Google Search Options 將會是 SEO 的惡夢?



以上的圖是Google搜尋英文界面的Options(選項), 雖然中文界面尚未出來, 但是已經可以讓使用者更彈性的選擇資料顯示方式, 這個功能是否將是SEO廠商的惡夢呢??

搜尋引擎大多在英文的功能會比較快速推出, 因為中文的相關資料不若英文完整, 因此總是需等待更久的時間, 如之前所談微軟的Bing也是一樣

Google Search Options提供使用者更多的彈性來顯示資料, 當開啟Options後有如下的功能


你可以選擇只顯示評論文章, 也可以只選擇討論論壇, 也可以就時間來區分

如下就是選擇連同網頁包含的影像也一起顯示


如下就是選擇顯示更多的網頁描述


如下就是選擇相關搜尋


如下就是選擇以Wonder Wheel方式顯示 (因中文沒有可以顯示的資料, 所以用英文資料顯示)


如下就是選擇以Timeline(時間軸方式)來顯示


看完之後....有啥感想? 就是資料已經不是單一型態顯示了, 如果你在一般搜尋有不錯的SERP, 可能在其他類型就不一定啦, 所以如Google/Bing這些顯示資料的轉變, SEO廠商的努力結果可能會更加被........稀釋

這個就是我們在2008年底說個人化搜尋將全盤改變SEO的意思, 如果在加上SearchWiki.....SEO已經不是以往的SEO了, 也就是說....SEO 3.0已經宣佈來到

所以基本上已經沒有純粹的SEO, 而是必須真正的改善網站體質著手去進行我們所說的CLOUDS

如果還只是在進行Backlink的策略, 那肯定會被市場淘汰的! 必須真正進行完整的搜尋引擎行銷才能解決問題! 你準備好了嗎?

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月2日星期二

Microsoft Bing 雖然現身, 但是猶抱琵琶半遮面


Microsoft的Bing終於來了, 到底Bing有啥特殊功能呢? 目前看起來並沒有宣稱的強大, 只是界面越來越像Google, 微軟稱Bing是一個「決策搜尋引擎」, 目前看起來沒有什麼「決策搜尋引擎」的樣子, 到底功能強大在哪裡呢?

原本要在2009/6/3公開的Bing, 竟然在2009/6/1就公開了, 但是該beta版本與preview最大差別在於...左側具有語意功用的選項沒有出現(如下)



而最無聊的事...每次進入Bing都會顯示不同的圖片, 不知道Microsoft到底在想什麼???這些圖片只是浪費資源, 沒有任何意義

不過Bing在新聞以及圖片的搜尋倒是稍微值得探討一下...

在Bing搜尋新聞上, 雖然資料比Google News精簡, 但是精準度也頗高, 與Google News同樣有News RSS

而在Bing圖片搜尋上, 可以預覽圖的大小及選擇"同類"的圖檔, 例如找了MLB的標幟如下



另外Bing的圖片搜尋的左側功能已經跟Google有拼了...如下



再來就是Bing圖片搜尋最爽的功能...右手邊的資料顯示不是用"下一頁"的方式, 而是可以無止盡的拖拉...也就滑鼠往下scroll, 圖就一直顯示出來, 頻寬夠的話, 找圖很快的喔

所以Bing就只剩下宣稱的「決策搜尋引擎」還沒出現...是因為地區造成該功能沒有出現? 還是猶抱琵琶半遮面?? 就靜觀其變了...如果網頁搜尋的左側選項能夠出現的話, 整體來說對Google算是一個不小的威脅, 但是如果最後「決策搜尋引擎」真的只是preview, 那Microsoft玩笑真的開大了...

p.s. 但是根據SearchEngineWatch的文章"Bing's Best Features are the Ones You Didn't Know Existed on Live Search", 仍然有些功能在台灣的Bing看不到, 是否因為location而有差異, 尚待查證了!

---------------------------------------

2009/06/02 09:05 後記:

果然如所猜測, 經測試結果...各地使用Bing會出現不同的界面, 以大陸的搜尋結果...出現了左側的選項(但以英文為關鍵字才有, 所以表示Bing的中文字詞關聯還沒完成)


並且還有視訊搜尋, 把mouse移到視訊上面...每個還可以小螢幕預覽喔


還有地圖搜尋


所以可知Bing的使用非常的local search, 也就是當地的資料, 台灣的local資料可能還沒有弄妥當.....就拭目以待了

*** 如何啟動其他地區的Bing Local Search呢?
(1)進入Bing.com首頁
(2)點選右上角的「台灣」
(3)選擇你想使用的地區

目前當然選擇「美國(英文)」的功能是最齊全了...終於看到Bing的全貌了, 但是對於非英語系的國家來說, 或者非美國地區的使用者來說, Bing真的尚未能夠火力全開!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月27日星期三

什麼是 Link Farm ?



什麼是 Link Farm ? Link Farm 大多翻譯成鍊結農場或連結農場, 其實把Farm翻譯成「農場」有點奇怪, Link Farm 應該是「鍊結工廠」、「連結工廠」、「鍊結製造中心」或是「連結製造中心」, 也就是這些Link/backlink是被「刻意」、「大量」、「製造」出來的

Link Farm能夠產生效果嗎? Link Farm能夠讓你的網站產生更多的連結嗎? Link Farm能夠讓網站排名優化產生效果嗎?

通常Link Farm的手法有分成「間接」跟「直接」, 但是都需要一堆可以控制的URL, 這堆可以控制的URL來源可能是建立許多部落格, 可能是註冊許多域名來建站

「間接」就是不直接建立連結到目標URL, 「直接」就是直接建立連結到目標URL

但是不管如何, 最後都會碰到一個問題: 這堆可以控制的URL(也就是Link Farm)的內容、流量、連結

也就是你無法讓這些Link Farm內容精彩、大量流量、具備自然連結, 也就是中間會有斷點, 這些斷點就會被抓出來而降低Link Farm的效果, 甚至於沒有效果

所以花費在建立Link Farm的努力的投資報酬率會變得很低

也許有些人會開始反向思考, 那我建立Link Farm來指向競爭對手, 會不會讓他被search engine懲罰? 答案是更沒有效果....Why? 思考看看吧!

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月25日星期一

Microsoft的終極武器 : Kumo 還是 Bing ?



在上一篇"SEM 搜尋引擎行銷 : Microsoft 也想加入戰局了"報導中, 談到Microsoft已經無法忍受老是當老三的角色後, 近日更將推出據說是武力強大的搜尋引擎, 目前尚不知是Kumo(酷魔)還是Bing(兵)?

以目前ComScore於2009年四月所發表的搜尋引擎市場佔有率來看, Microsoft仍然在個位數盤旋, 如果不再搞點名堂, 真的是被兩大搜尋引擎壓在地上打...

在這篇"First screenshot of Microsoft's Kumo"可以看到新版的搜尋界面

據悉最後名稱可能是Kumo ( 原意為日文的「雲」或是「蜘蛛」), 也可能是Bing

由這個新的搜尋界面看起來, 有Semantic Search的味道, 美國專利與商標局(USPTO)文件顯示,微軟已將「Bing」註冊為商標, 微軟同時還註冊了Bing.com和Bing.net域名

最後不管是「兵」還是「魔」, 微軟的這一擊如果沒能驚天地泣鬼神, 可能會把Bill Gates氣炸

目前Kumo.com跟Bing.com都尚未開放, 可能在最近會轟動上場 ...



最新訊息: Microsoft Bing 雖然現身, 但是猶抱琵琶半遮面 - 探索Bing.com


標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月1日星期五

百度與搜尋引擎優化 : SEO and Baidu



很少談到百度搜尋引擎, 但是卻都密切觀察百度搜尋引擎的動向, 百度(Baidu)的演算法與Google/Yahoo並沒有太多差異, 但是由於有其他太多因素, 讓百度有别於其他搜尋引擎

百度搜尋引擎開始於2000年, 其名稱由來是辛棄疾的「青玉案」

東風夜放花千樹 更吹落 星如雨
寶馬雕車香滿路 鳳簫聲動
玉壺光轉 一夜魚龍舞
蛾兒雪柳黃金縷 笑語盈盈暗香去
眾裏尋他千百度 驀然迴首
那人卻在 燈火闌珊處


就在"眾裏尋他千百度"中, 「百度」搜尋引擎這個名字於焉產生

百度在早期資料量不大時, 本站許多關鍵字都名列前茅, 但是突然有一天.....所有index資料在百度搜尋引擎全部消失

由於並不是商業網站也沒有太在意, 但是又在某一天資料又全部回來, 中間隔了約半年的時間

以為就此應該不會再消失了吧! 沒想到在2009/04上旬, 又是在百度搜尋引擎全部消失, 於是這次就跟百度聯絡, 告知資料消失的問題, 並且希望能夠恢復索引

沒想到百度的處理速度相當快, 約不到幾天的時間就又全部恢復正常資料量, 但是好景不常...在幾個星期後又全部消失

想在百度搜尋引擎有不錯的表現, 基本上比Google、Yahoo!奇摩還困難, 因為百度還是以簡體資料為主, 並且中國大陸的網站數量驚人, 想要在百度上做SEO, 除了原本的SEO規則外, 可能必須注意以下事項:

(1)台灣與大陸的用詞差異, 例如:在百度上以"搜尋引擎"關鍵字有不錯的排名是沒有用的, 因為大陸使用"搜索引擎"
(2)是否能夠跟大陸的站台形成關連? 也就是跟大陸的站台互有link往來
(3)是否有使用百度Toolbar?

尤其台灣的網站還有跟中國網路連線的問題, 最近幾天(約在4/26~29左右)透過Hinet連往Baidu就常出現無法連線的問題, 但又不是所有Hinet連線都不通, 應該是中華電信某些海底電纜與中國有局部斷線, 又因為台灣使用百度的用戶不多, 所以沒有引發太多的抱怨

這個連線問題就會讓百度無法抓取台灣的某些網站資料, 你也永遠不知道到底你的網站與百度何時會無法連線, 除非你有辦法隨時偵測所有應該連線的訊號, 一旦斷線的話, 業者是不會主動告知的

如果搜尋引擎幾次抓取資料失敗, 很可能就將網頁資料除名了, 等於就死於非戰之罪而不自知了!

至於台灣用戶連往中國網站的速度問題, 基本上都會較慢, 但是從中國連到世界各地是否也會很慢呢? 曾經在中國實際測試結果, 發現由中國連往台灣或任何地方, 速度都相當快速, 所以問題不是單方面中國資料過濾管控的問題, 而是跟台灣連往的網站到底頻寬是否足夠及穩定性的問題了

百度相關資料
http://baike.baidu.com/view/1047.htm
http://baike.baidu.com/view/7147.htm
http://baike.baidu.com/view/157335.htm

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月30日星期四

SEO 搜尋引擎優化


SEO (Search Engine Optimization,搜尋引擎優化) 這個主題已經被談到快爛了, 但是還是有許多談到SEO就是著重在「密度」、「連結」,而沒有好好的搞「內容」跟「滿意度」。 什麼是SEO? 就只是在搜尋引擎的處理作文章嗎? 搜尋結果出現在最前面,然後呢?

常常使用網路搜尋,但是搜尋的結果能夠讓人滿意的常常不一定在前三頁,這牽涉到到兩件事情:關鍵字的選用跟搜尋引擎的缺點

關鍵字的選用跟使用者有關,這個需要經驗的累積,而搜尋引擎的缺點目前看起來已經逐漸在改善當中

當進行SEO著重在「密度」、「連結」,就算被點選了,讀者馬上跳開的話,等於白費力氣,本站也發現許多莫名其妙的來源,只因為在搜尋引擎查詢到而點入,但該文章根本不是在寫讀者心裡想要的內容...結果就是造成了高的bounce rate

因此本來不相關,但是卻透過搜尋引擎被使用者查到,其實也不是一件好事,對企業來講更是多了非目標客戶的負擔

非營利的網站可以只做SEO,但是營利的網站只做SEO只能收到流量,但是未必能收到營業額


因此企業就SEO來講,鎖定目標客戶,除了「密度」、「連結」之外,好好的搞「內容」跟「滿意度」才能發揮真正的功能,這個光做SEO是無法畢竟全功的,必須要當成整體行銷與企業流程改造才能收到實際的效益

參考資料
SEO不是網站優化 : 談C-L-O-U-D-S
網站優化 : 如何進行內容優化 (Content Optimization)?
SEM : 什麼是 Search Engine Marketing ?
Search Engine Marketing : 搜尋引擎行銷應該包含什麼?

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月29日星期三

Google Personalized Search : 個人化搜尋中文界面問世



我們在"Personal search is coming : 個人化搜尋將全盤改變SEO"說過, 黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌...在"SEO觀點 : SEO面對的是巨變的環境"也談過, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

之前已經在Google Search英文界面測試好一陣子的功能, 現在中文界面也出現了, 如下:



當你登入Google帳號後,Google Search增加了幾個功能:

(1)你可以將不希望看到的結果列表移除, 也可以將希望看到的結果重新排序
(2)你可以加入註解(comment)

當然你也可以回復原先的排序, 並且這些重新排序的結果都是個人化的, 別人並無法看到

What is the catch?

可以分成好跟壞兩方面, (a)好的是使用者可以把非相關訊息過濾掉, (b)壞的方面是SEO技法已經越來越多挑戰

從另一方面看也有好跟壞, (c)好的是正經的好文章可以更被彰顯, (d)壞的方面是黑帽SEO會不會大量利用過濾對手的方式來打擊

(a)跟(c)絕對是正面的好消息, (b)對正派SEO來說沒有困難, 但(d)就看Google如何利用這些個人化資料了

所以SEO的最終目的還是要針對人, 電腦或許可以被欺騙, 但是沒有相關的訊息, 就算出現優秀的SERP, 也會在不到一秒的時間就被使用者過濾了


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月28日星期二

搜尋行銷 : 最早的搜尋行銷是什麼?



現在國內外都把"搜尋行銷(Search Marketing)"跟"搜尋引擎行銷(Search Engine Marketing)"當成同樣的東西, 中間就差個Engine, 好像沒啥差異吧...但是你知道最早的搜尋行銷是什麼嗎?

What is the difference between search engine marketing and search marketing?

最早的搜尋行銷就是-----電話簿 (Yellow Page, Yellow Book)

根據About.com的"The History of the Yellow Pages", 電話簿出現在1886年, Wikipedia則說電話簿最早的概念出現在1883年

為什麼電話簿是最早的搜尋行銷??

搜尋引擎行銷是跟「搜尋引擎」有關的行銷活動, 搜尋行銷則是跟「搜尋」這個行為有關的行銷活動

電話簿是幹什麼用的? 就是讓你「搜尋」需要的商家訊息, 電話簿內就有一堆廣告插在商家聯絡訊息的頁面, 當你需要找搬家公司, 你會發現有搬家公司叫「一一搬家公司」、「一一一搬家公司」, 這些就是在搶SERP (電話簿內的排名), 如果你叫「龍在天搬家公司」, 那就排到很後面, 大概就等著關門

搜尋引擎行銷跟搜尋行銷就差在一個有Engine幫你Search, 一個你要遵守規則自己Search

所以說....電話簿是最早的搜尋行銷

也許有人會說: 那麼計較幹什麼? 這兩者的media(媒介)不完全相同, Search Marketing大於Search Engine Marketing, 其策略可能就會有差異, 如果你的東西主要在鄉下賣, 搜尋引擎行銷可能就完全不通, 但是也許搜尋行銷還可以施展效果(電話簿之類)

搜尋引擎行銷就是搜尋行銷嗎? 沒看過本文章的都說是! 看過本文章的就會跳出來說...兩個是不一樣的!

再來問你一個問題 : 全球最早揭櫫搜尋引擎行銷跟搜尋行銷不同的是誰? 就是「台灣搜尋引擎優化與行銷研究院」啦!

相關閱讀:
什麼是搜尋引擎行銷(Search Engine Marketing)?
搜尋引擎行銷應該包含什麼?

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月27日星期一

搜尋行銷, 推特行銷 : SEM and Twitter Marketing



當台灣還在童顏巨乳效應之熱潮時,Twitter已經變成美國的"殺很大",但是台灣還絲毫感覺不到推特的任何熱力,Twitter可以幹什麼? 大概多是認為僅止於"碎碎唸"...

搜尋行銷(Search Marketing, Search Engine Marketing)大概已經大家耳熟能詳了,但什麼是Twitter Marketing (推特行銷)??

關於Twitter, 前面已經有幾篇敘述:

為何twitter有140個字數限制?
Guy Kawasaki 為何使用Twitter ?
社交網路最後四強 : Social Media Final Four
Twitter Fail Whale : 推特當機時的可愛鯨魚
社交網路 : Twitter 的哲學 "Nobody and Everybody"
Google Buy Twitter ? 會是推特的最後命運嗎?
Flutter : 又來了個Nanoblogging ?
Google 該不該買下 Twitter?

以上文章以經說明Twitter的幾個重點:

(1)Twitter的威力在於無所不在 -- Web & Mobile
(2)當Twitter用戶大到一個量時....威力無比
(3)當Twitter的垃圾訊息越大,就可以掏出黃金
(4)當企業都使用Twitter做行銷時,還搞不清Twitter的....會很慘

誰在用Twitter? Google, PCWorld, Computer World, ReadWriteWeb, Wired, Intel..... 實在太多了

歐巴馬, Oprah(歐普拉)也都是Twitter的使用者...

這篇"25+ Celebrity Twitter Users"提供了更多的名人用戶, 但由於是2008/10寫的, 現在已經可能幾倍以上的數字...

也許該試看看使用Twitter,等台灣真的也開始Twittering或是出現"類Twitter"熱潮, 你已經熟悉怎麼操作Twitter Marketing (推特行銷)了

但什麼是Twitter Marketing (推特行銷)? 我們不把他鎖定在Twitter這個平台, 姑且把他通稱為 - 無所不在的訊息推播, 或稱為 Ubiquitous Pushing (UP), Ubiquitous Message Pushing (UMP)都可以

也許以後會有UP Marketing, UMP Marketing之類的Twitter Marketing

這個"無所不在的訊息推播"就是只要你Follow(跟隨), 訊息快遞可以推到你的電腦、手機, 老實說這也不是新東西, 十幾年前有一個東東也做類似的Push(1996年 PointCast), 只是當時網路還不夠普遍, 因此他死得很慘

除了Follow還可以Response(回覆), 因此除了是"訊息推播", 也可以當成是"客戶服務", 當有眾多訊息時, 這些資料就可以看出一些市場趨勢, 提供市場行銷時使用

Twitter Marketing (推特行銷)你都準備好了嗎?

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月22日星期三

SEO-SEM-搜尋引擎優化-搜尋引擎行銷部落格改名囉



這個"SEO-SEM-搜尋引擎優化-搜尋引擎行銷部落格"網站名稱必須改名字, 因為在網路上太多類似名稱了, 為了與眾多的SEO搜尋引擎優化、SEM搜尋引擎行銷等相關網站有所區隔, 並且由於本站並非商業網站, 而是研究型網站, 因此改為"台灣搜尋引擎優化與行銷研究院"

為什麼叫"研究院"? 而不是"部落格"、"研究網"、或是"研究室"? 為的只是識別度, 與其他網站有某種程度的區分, 並沒有其他意義

之前的名稱"SEO-SEM-搜尋引擎優化-搜尋引擎行銷部落格", 除了太長之外, 也幾乎沒有識別度, 只是一堆SEO技法下的關鍵字充塞, 雖然可以提高被搜尋到的機率, 但是讀者看完後可能已經不知道到底看過哪個網站了, 最早的"數位網路社群部落格"則是沒能從名稱知道網站的特性, 並且也同樣沒有識別度

這是筆者另外一個體悟, 就是常在網路上尋找一些資料, 但是很多有精彩內容的資料已經不知當時是下哪個關鍵字? 到底是在哪個網站看過? 網址更是沒印象了!

因此在進行SEO/SEM的同時也應該思考:網站的identity...身份識別度, 不要只是一堆關鍵字的堆砌

一般網路使用者未必會去注意"網址", 尤其本身不是網路或資訊相關的行業, 因此雖然本站網址很好記憶(dns.com.tw), 但是可能有三分之一以上的到訪者都記不住

雖然把原本的名稱改變, 可能會損失一些以SEO或SEM為關鍵字的搜尋機率, 但是為了建立網站識別度, 只好犧牲掉已經被用爛的SEO/SEM這兩個字詞

"台灣搜尋引擎優化與行銷研究院"....就是以後的名字啦, 希望不會再改了

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月21日星期二

搜尋引擎優化的成果是協助Search Engine的結果

search-engine

搜尋引擎Search Engine的存在目的是希望讓使用者得到想要找尋的內容, 只有達成這樣的目的, 搜尋引擎才能夠生存下去, 因此搜尋引擎演進各種技術, 無非是希望讓好的內容提升並淘汰劣質的內容, 因此只要把握『協助Search Engine』的重點, 搜尋引擎自然會讓你的內容呈現優秀的搜尋結果, 也就SERP會排到前面的頁面 ...

搜尋引擎再怎麼聰明, 還是沒有辦法真的去『閱讀』, 以往用站長之間的投票方式, 也就是link analysis、PageRank來評估頁面的等級, 但是已經慢慢演進到網友之間的投票方式, 也就是搜尋結果點選率、Bounce Rate、流量...等來評估頁面的價值

當讀者在閱讀眾多的頁面時, 就會在整個閱讀過程留下投票記錄, 這個記錄就會被瀏覽軟體、toolbar、網頁統計碼、流量統計業者、甚至於ISP業者所擷取, 這個過程想要作弊是很困難並且沒有效率的

因此搜尋引擎除了在link analysis、PageRank演算法改善外, 會頃傾向以讀者的力量來把網頁分出高下

link analysis、PageRank演算法改善主要就在抓link spam與semantic relevance分析, 所以連進的backlink與連外的outbound link, 都是SEO的重點, 我們在"Outbound Link Effect : 對外連結效應"也都提過

而想要讓讀者在閱讀過程投下正面的一票, 就必需做到我們說過的"CLOUDS"了

因此怎麼做SEO? 就是如何協助Search Engine把有用的資料整理完善, 如何幫Search Engine去閱讀了, 協助Search Engine呈現優秀的資料, 自然搜尋引擎自然會讓你的內容呈現優秀的搜尋結果


標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月17日星期五

Outbound Link Effect : 對外連結效應


許多SEO都很注意backlink, 也就是連進網頁的inlink, 但是大多數都不太注意outbound link, 也就是對外連結, outbound link對於SERP有何效果呢?

Outbound link的效應可以分為以下幾點:

(1)Outbound link 會分散外連的Pagerank值
(2)Outbound link 會與連往的頁面變成內容相關
(3)Outbound link 會讓讀者有更多的可參考資料
(4)Outbound link 會降低內容的重覆性

以上(1)(2)是大多人都知道的, (3)是與讀者有關的, (4)是搜尋引擎所care的

我們先談(3), 當讀者看你的網頁時, 能夠有一些不錯的參考資料, 滿意度會提高, 之後的回讀率會增加, 所以可以增加網頁的可信度(Credibility)

(4)是搜尋引擎希望相同內容可以不必贅言, 如果你有加值內容再另外寫上去, 可以減少必須索引的負擔, 因此(4)的因素會反應到(2)

Outbound link 會與連往的頁面變成內容相關, 所以當你的網頁連到spam頁面或sand box時, 就會影響你的排行, 但是反過來, 如果你連到高品質的相關頁面時, 你的頁面也同時會變成跟這個高品質頁面"內容相關"

那如果我外連的頁面是低PR值呢? 只要確定不是spam, 就不會有負面影響, 只要該內容好, 你的頁面就會跟著水漲船高

也許有人怕PR被分散, 所以不喜歡連到別人的網頁(尤其自己做SEO), 但是跟正面因素比起來, PR的分散是不太影響的, 而且你如果對Pagerank演算法有深入研究的話...其實整體來看反而是加分的(後續公式再證明了)

筆者做過實驗, 只要對外連往"真正相關"的頁面, 某些活動度不高的頁面也能夠出現優秀的SERP

因此建議:

(1)不要任意做link exchange, 因為你不知道哪些外連頁面會變成spam

(2)不要吝嗇連往優秀內容的頁面, 不要怕你的PR會分散給別人, 因為跟優秀的頁面形成關聯可以有加分效果

(3)從網路上得知的訊息, 經過你的整理後, 如果能把參考資料的link備齊, 可以增加回讀率


所以不是backlink才對你的網頁有效, 也要注意 Outbound Link Effect !

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

由 Link Spam, Link Velocity 談 Freshness

增加外部連結(backlink/inlink)是許多進行SEO常常做的事, 但是這些連結有沒有用處, 其實是值得商確的事情, 我們在"SEO策略 : 如何產生更多的backlink?", 已經提過真正有用的連結才能真正的發揮效果, 這個觀點可以用 Link Spam, Link Velocity 來探討, Link Spam指的是垃圾連結, 搜尋引擎花了很多力氣在解決垃圾連結的問題, Link Velocity指的是增加連結的速度, 這兩個問題我們可以用權威性與新鮮性來分析, 這些特性看起來都是互相衝突, 但是中間又有許多奧妙之處, 我們試著用比較簡單的方式來解釋 ...

我們在"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP", 說到搜尋引擎要的資料是權威性高的, 並且也要新鮮度夠的

而且希望搜尋排前的網頁是快速被重視的, 也就是Link Velocity大的, 但是又不能是Link Spam的

什麼是Link Velocity? 就是指網頁出現後, 其Backlink增加的速度, 我們說過:

現在假設有一篇熱呼呼的文章剛被Google抓取, 姑且稱網頁A其初始時間(INCEPTION DATE)為2008.09.05 12:00:00, 這篇文章會不會出現在SERP的第一頁, 就完全取決於query analysis後, 網頁A內容與keyword的相關性緊密度評分, 如果評分後有其他網頁更優勢, 當然網頁A就被排擠下來

如果相關性緊密度評分相等或相近, 並且這個SERP set中的其他頁面, 其他評分並不顯著優勢(如backlink), 這時網頁A就可能出現在SERP的第一頁, 但是這個優勢會隨著時間因素而遞減

網頁A如果在因時間因素遞減下, 但增加了自然的backlink, 就可能繼續存在SERP第一頁


搜尋引擎要的資料是權威性高的, 並且也要新鮮度夠的, Link Velocity大的, 但是又不能是Link Spam的....這些看起來都是衝突的, 但是重點在於link quality

也就是新鮮網頁具備link quality的Link Velocity夠大, 就能脫穎而出, 可能會取代權威資料

所以最終就是要快速更新有品質的內容, 並且透過有品質的內容快速產生有品質的backlink, 所以未來黑帽的方式會越來越沒有效果, 最後還是要取決於 --- 內容!

Link Velocity是如何被搜尋引擎決定的? 答案就在Trust Box, 就在Link Spam detection

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月13日星期一

Matt Cutts 回答 Canonicalization Tag 問題

我們在文章提過"Canonical link element : 標準鏈結元素", Matt也在日前針對這個問題再次說明






有人問:

Does the new canonicalization tag make it safe to add tracking arguments to some of my internal links without fear that Google will split the quality signals between the two addresses?

當我使用canonicalization tag後, Google是否會分別評估頁面品質?


以下是另外的訪談:


總之使用Canonicalization Tag可讓search engine不必去處理根本是相同內容的不同URL, 因此如果你有類似example.com與www.example.com的問題, 應該儘速使用Canonicalization Tag來宣告, 讓search engine更有效率

參考:Matt Cutts Answers Canonicalization Tag Question

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月10日星期五

Google新專利: Methods and systems for assisted network browsing


(圖片來源 www.todayandtomorrow.net)

Google於2009/4/7通過了新專利"Methods and systems for assisted network browsing", 可以在點選連結前顯示該頁面訊息, 這個專利早在2003年申請, 目前才剛熱騰騰出爐 ...


"Methods and systems for assisted network browsing"這個是在做什麼?

這個摘要說明如下:
Systems and methods for assisted network browsing are described. In one described method, a client device receives an interest signal indicating a user's interest in a hyperlink contained in a first document. The client device responds to the interest signal by generating a request signal comprising a request for third-party-provided information about a second document associated with the hyperlink. The client device receives the requested third-party-provided information and causes it to be output in association with the first document.

當使用者打開網頁, 可能會出現許多連結到其他頁面, 在網頁上會顯示出到下一個連結的額外訊息讓使用者參考, 這個專利到底有什麼目的?

(1)因為已經提供訊息給使用者, 可讓click更精準, 提高使用者滿意度
(2)因click精準了, 可以收集更多資料讓搜尋引擎參考

如果這個專利可以使用在各種browser, 那Yahoo跟Microsoft要傷腦筋了, 因為連IE上的使用者點選狀況都被Google搜集的話, 將使Google Search更如虎添翼

但是third-party-provided information是什麼呢? 可想而知Google是想推出Open API, 然後收集資料到datacenter, 而information不外連結網頁的PageRank、AlexaRank、摘要訊息...也可能是如部落格觀察的排名等....

這個專利推動的結果, 會讓link spam點選率降低, 讓Google掌握了BrowseRank訊息, 使用者傾向 .... 太多的資訊都集中到Google, 後續發展如何? 我們就等著看了!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月27日星期五

什麼是 Google Wonder Wheel ?



Wonder wheel就是摩天輪, Google要蓋遊樂場啦?

這個摩天輪跟遊樂場摩天輪不太一樣, Google winder wheel是為了要讓搜尋結果能夠更貼近使用者的需要而產生的, 因為結果的展現很像摩天輪, 所以稱為Google Wonder Wheel

以下的展現是否很像摩天輪?


(Source: http://blog.searchenginewatch.com/090325-134557)

以下是Google Wonder Wheel的demo:



Google Wonder Wheel跟Quintura類似, 也跟我們前面說的語意搜尋很像, 你可以說他是Universal Search加上Semantic Search, 或是我們說的Search 3.0

這種轉變跟SEO/SEM有什麼意義?

就是傳統的作法會逐漸失去效用, 是否真的內容相關? 是否與權威網站建立關聯? 我們前文也都說明過, 後續持續觀察Google Wonder Wheel是重要的事情

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月26日星期四

SEO趨勢 : Javascript 會影響搜尋引擎抓取?



Javascript會影響搜尋引擎抓取, 這是大多的SEO流傳的觀念, 這個問題跟"動態還是靜態的URL比較好?"一樣, 表示觀念還停留在三五年以前, 這個跟"SEO : 搜尋引擎無法索引Flash檔案?"問題也是類似, 就看你如何處理...

如果你在Flash中把文字轉成圖形物件, 搜尋引擎抓得到文字才有鬼, 所以問題不在"搜尋引擎是否可以索引Flash檔案", 問題在你的檔案呈現給搜尋引擎什麼樣子, 而你所針對的是Google?Yahoo?還是Baidu?

回到主題, Javascript 會影響搜尋引擎抓取?

Javascript是Client-Side的程式碼, 也就是執行在你的browser, 而且Javascript在不同的browser可能有不同的結果, 有些browser可以執行, 但某些語法不支援則會出現錯誤或沒有輸出

因此原則很簡單:
(1)你的Javascript是否在Windows/Linux的IE/FireFox/Chrome...等browser都可以執行?
(2)你的Javascript執行是否可能很久或timeout, 或浪費resource?

如果你的Javascript使用標準語法(各平台都正確), 並且不需等待太久.....那搜尋引擎會抓取執行結果

如果你的Javascript非使用標準語法(某些平台無法run), 或需waiting或使用大量array.....那搜尋引擎大多會bypass

多久算是waiting? 目前沒有可靠數字, Javascript去load flash時, Google就會bypass

因此Javascript 會影響搜尋引擎抓取? 答案是yes and no(針對Google/Yahoo), 完全看是否思考上面兩個問題

後記: 2009/03/27

Google是否會index flash? Google已經說明哪些情況會抓取flash的text, 看過這篇文章"Are The Search Engines Really Indexing Flash?"

這位作者是某SEO廠商的CEO, 她說:

Guess what? Most Flash is still highly invisible in Google.

To test this, I went directly to some Flash sites, and pasted exact words contained within their Flash into Google (using quotes) and most of the sites did not show up in the search results. Upon review of the source code of two sites that did show up I found that one was using the phrase I looked for within their Meta description (see… meta descriptions actually DO count for something with Google, despite what some will tell you). The other site had lots of text within the code beneath the Flash so that search engines and browsers without Flash would have some meaningful info. While that’s a good alternative, the info they had was very different from the info contained in their Flash. That’s a bit of a dangerous game to play with the search engines if you ask me. If that info is good enough for search engines and iPhones, why isn’t it good enough for your most important users?


她去測試一些有flash的網站, 發現許多在flash的文字都沒有被Google index, 所以她結論: 大多的flash還是沒被Google抓來index......

嗚呼哀哉........她大概沒做過flash, 在flash看到的文字不一定是真的text, 有些為了字形美觀或效果, 必須轉換成graphic圖形物件, 光是外部觀察是不容易看出哪些是真的text, 除非你自己電腦的font去變動, 看該flash是否會依你的變動而不同, 如果會的話就是真的text, 不過這個應該沒人這麼閒去做這個測試, 而且大同小異的font這麼多, 你也很難猜出他真正用的font, 而且以javascript去load flash, 就算是flash中是純text, Google也不會抓, 這位CEO的建議是對的, 但是判斷過程是錯誤的......

當然無意義的flash應該盡量減少, 使用flash還是要以HTML搭配, flash text是否可以被Google index也不是太大的問題, 但在這麼出名的網站, 這麼高階的SEO主管都會下這種判斷, 可見沒有追上技術實在很難搞SEO

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Matt Cutts 解釋 Google Backlink Check



當你在Google Search打入 link:www.my-domain-name.com, 出現的結果與Yahoo Search是不同的, 這是長久以來許多人的疑問, 我們曾經在一系列的"Search Engine Optimization 搜尋引擎最佳化的幾個問題"回答過, 現在透過Matt Cutts再來說明一下...

如果你想仔細複習, 可參考
Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)
Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)

我們之前說到"link:"這個功能... "只是列出代表性, 並非所有backlink...只有在Webmaster Tools中的資料才是完整資料"

Questions:

- How accurate is Google's backlink-check (link:...)? Are all nofollow backlinks filtered out or why does Yahoo/MSN show quite more backlink results?

- If you have inbound links from reputable sites, but those sites don't show up in a link:webname.com search, does this mean you aren't getting any "credit" in Google's eyes for having inbound links?


Matt Cutts解釋說, 只是列出代表性的目的是為了防止競爭對手瞭解你的網站互聯的狀況, 所有的backlink只在webmaster tool才提供, 並且不會因為"link:"沒有列出而沒有列入網頁評分計算

其實...關於這個問題...Matt Cutts並沒有說實話 (應該說他只說了抬面話吧....)

Google與Yahoo所取得的backlink數目都比實際數目少, 連Google Webmaster Tools中的數目都低估實際數目

原因為何? 不是有某個演算法濾掉不該算的, 就是演算法遺漏了抓取, 目前看起來是遺漏的可能性較高

但是不管如何, 如果大家的backlink都會一視同仁的遺漏計算, 反正也算公平就是了

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月25日星期三

SEO趨勢 : Google SERP Updates - 相關關鍵字與問句式查詢



Google在昨天(2009/03/24)公佈了兩個重要的SERP(Search Engine Results Page)的演算法更新, 一個是Google更瞭解你的關鍵字, 一個是較長的關鍵字會顯示較長的description...

這兩個更新有何重要性呢?

(1)Google更瞭解你的關鍵字

當你輸入一個關鍵字, Google不再只是單就這個關鍵字來搜尋, 而是還會顯示在頁尾跟這個關鍵字相關的建議詞
當你輸入: principles of physics, 除了正常的SERP之外, 還會顯示跟physics相關的

principles of physics serway
quantum mechanics physics
physics special relativity
physics angular momentum
big bang physics
physics for scientists and engineers
physics classical mechanics
equations of physics

並且當你使用英文界面來搜尋"taiwan", 發現建議詞是

taiwan news
history of taiwan
taiwan economy
taiwan google
hong kong
thailand
japan
singapore

已經不只是字面跟Taiwan相關, 而是有點semantic的味道了

這個告訴你什麼? 應該很清楚了吧

(2)較長的關鍵字會顯示較長的description

在SERP(Search Engine Results Page)頁面中, 除了Title外還有描述文字(description或稱為snippet)

在較長的關鍵字時, 這個snippet長度會拉長, 並且符合的詞都會以粗體顯示(台灣界面以紅字顯示)...

這個不是本來就這樣嗎? 是本來就這樣, 只是拉多長大家比較沒注意到

這個對於SEO有何關係?

當然有關係, 目前SEO大多以關鍵字在操作, 但是較沒有注意到"問句式"查詢 (詢問式查詢, 詢問式關鍵字)

也就是如果著眼在"SEO"這個字, 可能就無法在"到底什麼是SEO", "SEO是啥東西", "SEO有何重要", "SEO的縮寫到底是什麼東西", "SEO跟SEM有什麼關係", "SEO是否就是SEM", "SEO與網站排名有何重要", "SEO與PPC的關係"....等問句式查詢出現優秀的SERP

這個問句式查詢的趨勢, 如何破解? 操作方式的改變已經開始發酵...你準備好了嗎?

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月10日星期二

Search Engine Marketing : 搜尋引擎行銷應該包含什麼?


(圖片來源: nipic.com)

在前面文章"SEM : 什麼是 Search Engine Marketing ?"提到: 搜尋引擎行銷Search Engine Marketing (SEM)是指直接或間接利用搜尋引擎技術來進行的行銷稱為搜尋引擎行銷

這裡談到搜尋引擎行銷的重點就是: 直接/間接/搜尋引擎/行銷, 就這四個重點來說, 搜尋引擎行銷應該包含什麼?

前文也提到: 搜尋引擎行銷不是包括SEO與PPC, 搜尋引擎行銷不僅發生在使用者有搜尋行為時, 也發生在使用者沒有搜尋行為時

搜尋引擎行銷發生在使用者有搜尋行為時, 就是如『Google 搜尋聯播網』

搜尋引擎行銷發生在使用者沒有搜尋行為時, 就是如『Google 內容聯播網』

因此一般人都認為搜尋引擎行銷就是SEO(Search Engine Optimization), 加上關鍵字廣告

這樣有啥不對? 因為忘記了最重要的行銷精華 ... 行銷不只是把產品賣出去, 而是將產品創造出的價值(Value)提供給客戶, 藉由客戶獲得的價值來創造利益關係人(Stakeholder)的獲利

用白話一點的文字來說, 就是讓客戶與企業雙贏

因此行銷必須兼顧到顧客是否還會再回來, 怎樣才會再回來? 當顧客滿意整個流程, 滿意產品...他才會再回來!

所以說搜尋引擎行銷(Search Engine Marketing)只是包括"SEO與關鍵字廣告"嗎? 非也!

因此真正完整的搜尋引擎行銷(Search Engine Marketing)必須包括: 網站優化(我們前面提過內容了)、關鍵字廣告、產品分析、客戶分析、企業流程分析...,也就是所有包括搜尋引擎/客戶/企業這三個大範圍內都必須整體兼顧到

善用搜尋引擎、達成客戶滿意、達到企業獲利, 才能算是真正的搜尋引擎行銷(Search Engine Marketing)

相關文章
搜尋行銷 : 最早的搜尋行銷是什麼?
搜尋引擎行銷 : 說故事與Landing Page
SEM : 什麼是 Search Engine Marketing ?

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年3月6日星期五

SEM : 什麼是 Search Engine Marketing ?



什麼是 Search Engine Marketing (SEM)? 許多人常被網路上一堆名詞搞得很混亂, 有人說SEM就是包括SEO與PPC, 有人說關鍵字廣告就是PPC...許多觀念就在沒有進一步解釋下人云亦云

Search Engine Marketing (SEM)指的是與搜尋引擎相關的行銷行為, 凡是使用者利用搜尋會出現在使用者面前的都是『搜尋引擎行銷』的戰場, 甚至於使用者『沒有搜尋行為』, 但顯示內容的技術與搜尋引擎有密切相關的, 也算是『搜尋引擎行銷』的戰場。

使用者利用搜尋會出現在使用者面前的都是『搜尋引擎行銷』的戰場, 很清楚就是SEO(Search Engine Optimization)與關鍵字廣告(如Google 搜尋聯播網)

顯示內容的技術與搜尋引擎有密切相關的, 也算是『搜尋引擎行銷』的戰場, 指的就是如Google 內容聯播網(Google的AdSense)

Google的關鍵字廣告AdWords就包括了『Google 搜尋聯播網』與『Google 內容聯播網』

所以如果廣告主買了Google的關鍵字廣告, 他的廣告就可以出現在這兩種聯播網裡面

Google 搜尋聯播網不是只有出現在Google Search (http://www.google.com), 許多透過Google的搜尋技術的Google旗下公司(Youtube等)或與Google合作的廠商(Pchome、Hinet等), 當搜尋動作產生時, 都會出現Google 搜尋聯播網的廣告

而Google 內容聯播網就沒有實際『搜尋』動作, 例如你去看一些部落格, 頁面會出現與網頁內文有關的Google內容聯播網廣告(也就是Google Adsense), 這類廣告可稱為"contextual advertising", 與內文相關的廣告

所以Search Engine Marketing (SEM)是不是一定與使用者搜尋動作有關? 非也!

所以Search Engine Marketing (SEM)應該定義為:

搜尋引擎行銷Search Engine Marketing (SEM)是指直接或間接利用搜尋引擎技術來進行的行銷稱為搜尋引擎行銷



直接指的就是使用者有搜尋行為, 間接指的就是搜尋引擎利用抓取的網頁內文來比對廣告內容

那麼啥是PPC (Pay-Per-Click)? 指的是以使用者點選廣告次數為依據來收費的廣告機制

哪些廣告以PPC方式來計費? 可能是關鍵字廣告、可能是內容網站廣告、也可能是其他的類型廣告...

所以"SEM就是包括SEO與PPC"??? 當然不是啦, 只是關鍵字廣告都以競標費率的PPC為之, 所以許多人乾脆把關鍵字廣告與PPC劃上等號, 其實不是很好, 關鍵字廣告當然不等於PPC

因此如果搞SEM的業者, 這些都還說不清楚, 是會誤導許多人的 ...

相關文章
搜尋行銷 : 最早的搜尋行銷是什麼?
搜尋引擎行銷 : 說故事與Landing Page
Search Engine Marketing : 搜尋引擎行銷應該包含什麼?

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月26日星期四

Canonical link element : 標準鏈結元素


Google, Yahoo!, Microsoft Live在二月12宣佈支援標準鏈結元素(Canonical link element), 目的在解決內容重覆的問題, 啥是標準鏈結元素? 網頁內容重覆又會造成啥問題?

如上圖簡單解釋標準鏈結元素, 眾多不同的外部連結可能都進到一個相同的網頁

如:
http://www.domain.com/index.html
http://www.domain.com
http://domain.com
http://www.domain.com/index.html?sessionid=hfjsklahdf7678234681
...等等

以上Link對於搜尋引擎來說, 可能都視為不同的URL

造成這種情況, 可能是無意也可能是故意, 但是這樣會造成搜尋引擎浪費時間與空間在做同樣的事情

標準鏈結元素(Canonical link element)就是要解決這個問題

如果這些URL內有以下這個宣告, 也就是Canonical link element
< link rel="Canonical" href="http://www.domain.com/index.html" >

告訴所有由不同URL進入的搜尋引擎, "http://www.domain.com/index.html"是這個URL的統一標準進入點

如此一來搜尋引擎就只需index一份資料

但是這個標準鏈結元素(Canonical link element)宣告, 對於一般blogger來說, 並沒有太大意義, 因為blogger並無法自己去宣告, 這個完全控制在blogger framework或CMS(Content Management System)上, 所幸陸續這些系統會把標準鏈結元素加入他們的系統中

以下是Matt Cutts對於Canonical link element的解釋


相關訊息:
http://www.mattcutts.com/blog/canonical-link-tag/
http://www.webpronews.com/topnews/2009/02/25/googles-matt-cutts-on-canonical-again
http://www.bretteleben.de/lang-en/joomla/canonical-url-modul.html
http://seoblogspot.com/canonical-url-tag-most-important-advancement-seo-practices-sitemaps
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html
http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx
http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月25日星期三

Copy-Paste and Done?


最近受到IEEE的國際研討會之邀, 替他們review稿件, 看這些投稿的文章是否符合國際水準在研討會發表, 看了這些來自各國的所謂高級知識份子的文章後, 赫然發現了一般學生常發生的"COPY-PASTE"竟然也在這些教授學者間發生了...

當個審稿者(Reviewer)最頭痛的就是無法精通各種領域, 就算是在某個領域精通, 當你看到一篇應該是你精通領域的文章, 但你竟然看不太懂某篇看似很有條理的文章時...你會有點遲疑: 這篇文章到底是超乎水準, 所以才看不懂?...還是真的是狗屁不通才讓你看不懂?

有時真的會很怕誤人前途, 把別人嘔心瀝血之作退稿, 更怕的是把扯爛的文章讓他流傳出去, 讓後面可憐的博碩士生去K這些垃圾

話說看到一篇旁徵博引的文章, 裡面數學公式更是證明詳細, 但是看完之後總覺得數學式表示得怪怪的, 並且談的內容似乎應該是五六年前的東西, 但是因為論文的格式實在四平八穩...因此卡在退與不退之間徘徊, 就這樣遲疑了一個星期

後來實在難以決定, 因此使用了Docoloc(如上圖)

Docoloc主要是用來判斷文章是否為剽竊之作, 他可以跟網路上百萬多篇文章作比較, 計算出剽竊的比例

結果...BINGO, 果然是抄襲別人多年前的論文, 剽竊比例竟然高達50%以上, 而數學公式的上下標因為COPY-PASTE的關係, 沒有正確出現上下標的格式, 難怪總覺得怪

再來使用Docoloc來檢查其他各篇的論文, 雖然不算是完全剽竊, 但竟然也出現許多是整段文字的COPY-PASTE, 大概是引用別人觀點時, 懶得自己再敘述, 不敢置信的是一般學生常發生的"COPY-PASTE"竟然也在這些教授學者間發生

技術日新月異, 不管是學術論文還是網路上的創作, 不要以為抄得神不知鬼不覺, 現在的fuzzy search, similarity check...等技術, 已經讓抄襲不再像以前一樣那麼容易了, 應引以為戒...停止COPY-PASTE的習慣吧

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月20日星期五

Yahoo的新廣告利器 : Rich ADs in Search


Yahoo將在今天(2/20)宣佈推出整合影片及圖片的Rich ADs in Search, 讓使用者在搜尋時不再只是出現文字式的廣告聯結, 目前只在英文版的Yahoo進行測試 ...

在英文版Yahoo如果以Pedigree來查尋, 將會看到如上的畫面, 這樣的畫面希望能夠吸引使用者多注意到廣告並且點選

根據市調公司eMarketer的資料,Yahoo在搜尋廣告方面的市佔率已經從04年的13.8%下滑至今年的10.5%;而同時期,Google則從32.8%躍升至67.7%

Yahoo宣稱這個Rich ADs in Search將提高25%的點選率, 但據廣告代理商Razorfish則表示,他們協助客戶進行的測試效果並不是特別明顯,只比一般純文字廣告的點選率高出5%-10%

相關訊息:
ZDNet:Yahoo將推整合影片、圖形的關鍵字廣告
WebProNews:Yahoo Introduces Rich Ads In Search

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月10日星期二

Springer AuthorMapper告訴你什麼?



Springer是一個全球性的科學及商業學術出版商, 於今年二月初推出了AuthorMapper服務, 可以用不同於以往搜尋引擎的介面取得出版文章外, 還可以取得各種相關的統計資料, 目前已經有三百萬篇期刊學術論文, 未來將包含Springer以外更多的出版內容, 這個AuthorMapper除了提供了瀏覽模式的搜尋外, 亦可以用關鍵字來搜尋, 從這個服務我們看到了什麼呢...

從下面資料來看 (2007/1/1~2009年至今在Computer Science主題的出版文章)


中國大陸以1625篇佔第二名, 其他名次為Japan(439篇)居第八, South Korea(184篇)居15, Singapore(146篇)居18, 而台灣則有81篇領先香港的74篇

雖然這個只是Springer一個出版商的資料, 未必能夠代表全貌, 但就統計觀點來看, 台大13篇與新加坡南洋大學的52篇來比較...實在有些離譜了

而就institution來看, 中國以三個單位囊括了前三名(中國科學院,武漢大學,上海交大), 對照台大之前的口號"八十臺大,前進百大", 就又有些諷刺了, 進不進百大並不代表什麼, 但連這些數據都矮別人一大截, 還能搞啥名堂呢??

也許有人會說: 數量並不代表水準, OK, 那我們的品質表現數據拿得出去乎?

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年1月7日星期三

Search 3.0



上篇文章"SEO 3.0"提到, 因為搜尋引擎及網頁技術的改進, SEO應該邁向Web 3.0與Search 3.0的時代, 進行全面的網站優化策略, 那什麼是 Web 3.0與Search 3.0呢?

在"Search 3.0: The Blended & Vertical Search Revolution"說明了幾個重要特色, 但是還有一些值得補充

在1.0的時代, Web是由網站單方向提供資料, 以靜態資料居多, Web間沒有互相串連與互動, Search Engine也以關鍵字的出現頻率來評量相關性, 當然此時的SEO就只注重在on-page, 這些就是Web 1.0/Search 1.0/SEO 1.0

在2.0的時代, Web不再只是單向提供資訊, 而是可以由讀者產生內容, Web間的串聯開始頻繁, Search Engine也注重在串聯的緊密度上, SEO也轉而開始off-page, 這些就是Web 2.0/Search 2.0/SEO 2.0

從2007年開始已經出現3.0的雛形, Web間內容由各種不同型態發生更緊密的關係, Search Engine必須鋪天蓋地的挖出更符合需求的資料, 當然SEO不僅需on-page/off-page, 更需在內容上顧及Social Network、Multimedia、Semantic、User-Centric..., 到2009年開始邁入Web 3.0/Search 3.0/SEO 3.0的新紀元

我們在"搜尋引擎的下一步:語意搜尋", "語意搜尋的前哨站 : 垂直搜尋", "近期語意技術探討(一)", "Semantic Ranking : Search Engine 的另一扇窗", 也都已經敘述過相關趨勢

一些新興的技術也都陸續在挑戰Search Engine的可能性, 如NewsGatorHakiaSilobreakerSurfcanyonSearchMeViewziCuil...等等, 當然Google也陸續在Universal SearchPersonal Search上下功夫, Yahoo也推出Search BOSS來鞏固地位

到底Search 3.0的時代, 哪個搜尋引擎可以提供最合乎人性的服務? Google、Yahoo、Microsoft是否還能夠持續引領風騷? 今年是一個決定性的一年, 持續觀察變化才能知道答案了

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年1月5日星期一

SEO 3.0

什麼是SEO 3.0? 根據Danny Sullivan所說的, Search Engine Optimization源自於1997/7/26的UseNet, 此時開始了SEO 1.0的時代...

SEO 1.0的時代, Search Engine沒幾個, 而且功能很陽春, 如ALIWEB (Archie Like Indexing for the WEB), 這個時候完全依靠網頁HTML的meta tag(如Title,description,keyword等)來提供整個網站的類型描述, 當時台灣的GAIS算是較常被使用且功能不錯的Search Engine, 後來的Yahoo與Google也在這個時期陸續出現, SEO 1.0時期的SEO技術大多在做HTML結構的改善

到了約2000年起, Search Engine的功能逐漸強化後, SEO慢慢的步入了SEO 2.0時期, 又因為後來的Web 2.0興起, SEO 2.0注重的是backlink, pageRank..., 重心慢慢轉到off-page SEO

因為spam越來越多, 從2007年起Search Engine開始陸續修正演算法, 各種加入語意的search engine紛紛成熟, 從2009年起可以說將正式跨入SEO 3.0的時期

SEO 3.0是什麼? 簡單來說就是Web 3.0與Search 3.0時期下的SEO, 也就是注重網站間語意串聯的網站優化, 只有整體網站優化的實現, 才能達到SEO 3.0的目的

沒有SEO 3.0已經無法應付現今的網路行銷的需求, 後續將陸續提供資料...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月5日星期五

Bounce Rate與New Window的關係



我們於前面文章"BounceRate是否影響SERP?"談到Bounce rate是一個重要的根據, 可以讓你知道哪些頁面無法讓讀者停留或繼續閱讀, 雖然Bounce Rate並非影響SERP的前因, 但是降低Bounce rate或盡量讓Bounce Rate真正反映讀者的行為是重要的作為...

我們根據Wikipedia解釋Bounce Rate, 可以知道以下會造成Bounce Rate:

-Clicking on a link to a page on a different web site
-Closing an open window or tab
-Typing a new URL
-Clicking the "Back" button to leave the site
-Session timeout


現在如果有幾個情況 :

(1)點選到你的網頁, 沒有閱讀就離開 (可能關閉、另外輸入URL、或back到外部網站)
(2)點選到你的網頁, 點選link到同個網站的另外頁面(在本window)
(3)點選到你的網頁, 點選link到同個網站的另外頁面(在新開的window)
(4)點選到你的網頁, 點選link到外部網站(在本window)
(5)點選到你的網頁, 點選link到外部網站(在新開的window)
(6)點選到你的網頁, 到session timeout(default 30 min)都沒動作

哪幾個會造成Bounce?

(1)最沒有爭議, 絕對是造成Bounce, (6)就有些爭議, 因為有可能讀者在session timeout都還在閱讀該頁面, 但是還是會被算成Bounce, 所以根據(6)的推理, 每個頁面不應該太長, 否則就算有閱讀都會算成Bounce,(2)則沒有疑問的, 絕對不算Bounce

而(3)(4)(5)的狀況就比較複雜, 我們來探討Google Analytic的Bounce如何產生

我們先看(4)(5), Google Analytic code因為只是在自己的頁面執行, 當自己的頁面A點到一個外部link, Google Analytic code當然不知道, 因此若由自己的頁面A在本視窗連到外部link, 自己的頁面A就算關閉, 如果由自己的頁面A在新視窗連到外部link, 頁面A的視窗須等session timeout才算bounce

因此如果自己頁面連到外部link最好以開新視窗的方式

再來看(3), 當一個視窗開啟就形成一個新的session, 因此如果自己頁面連到內部link最好以開本視窗的方式

也許你會問: Bounce Rate並非影響SERP的前因, 那注意Bounce Rate作啥?

讓Bounce Rate盡量正確可以讓Bounce Rate成為修正網頁的根據

如果你以本視窗方式連到外部link, 讀者有繼續閱讀但是同樣會形成bounce, 如果你以新視窗方式連到內部link, 讀者有繼續閱讀但是同樣會形成較高的bounce, 因此修正這些做法可以讓Bounce rate更精準

也許你又會問 : 啊! 我有一堆違反上面所說的怎麼辦 ? 豈不是改到歪腰? 其實只需從現在起注意修正或盡量修正即可, 不需刻意把所有網站的開視窗方式都全部修改

所以記住 :

-- 單一頁面不要太長, 以免因session timeout造成bounce
-- 如果自己頁面連到外部link最好以開新視窗的方式
-- 如果自己頁面連到內部link最好以開本視窗的方式


並不是說如此就可以有好的SERP, 而是就機率來說, 以上3個做法可以讓bounce rate盡量符合實況, 可以讓Bounce Rate成為修正網頁的根據

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)



延續之前文章

"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

我們繼續來談其他問題...

Q: I have a website in 5 languages (and I cannot buy 5 different localized domains), which option is the best? To have different subdirectories (domain.com/en) or to have different subdomains? (en.domain.com)
如果網站有五種不同語言的內容, 網址應該如何取捨? 子目錄或子網域?

A: both versions are fine. I personally generally recommend using a subdomain when the sites are completely different and using subdirectories when it's more or less a shared site, but it's up to you.
當網站是完全獨立的可以用子網域, 若共用則使用子目錄


以上回答如果有聽沒有懂, 請參考:

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory

Q: If my sub domain got high Page Rank, how far it will contribute to the main domain?
次頁的PR是否會貢獻給主頁?

A: PageRank is on a page-by-page basis. The PageRank of a page (on a subdomain or not) is based on the links to it.
不會


雖然PageRank是以頁面來計算, 不會貢獻給上層網頁, 但是如果適當調整link, 可將link的PR貢獻給上層或其他網頁, 因此監看各頁的PR還是必須進行的

Q: Recently you posted on the webmaster central blog that you would suggest to not rewrite dynamic urls to static. Is there penalties for sites that rewrite? Would you suggest changing if a site has 5+ years history? Can you discuss further? Thanks.
將動態URL改寫成靜態URL影響如何?

A: great question. If your site is already doing well and you have rewrites, then you're probably doing them properly so please don't worry about it.
Feel free to spend time on your content and business! Yay! :)
In our blog post, we wanted to discourage new sites, or less experienced webmasters, from feeling they HAD to use rewrites. We've improved our processing of dynamic URLS, so there's no need for newer webmasters to be afraid of them any longer.
沒有必要


在以往靜態URL的SERP比動態URL要好, 但是目前已經沒有差異

Q: Sub-Domains are considered as a new site for Search Engines, if a 5 years old site which uses forums.domain.com, www.domain.com now plans to add shop.domain.com and download.domain.com will this take another few years for both new domains to get rank?
舊站的PR是否能夠貢獻給新的子網域站台

A: PageRank is purely at a page level, so if you forums.domain.com has a high PageRank and links to new urls such as download.domain.com, that PageRank will flow immediately.
如果舊站有高PR, 並且指向新站, 新站很快就會有影響


不管子網域或次目錄等, 應該善用高PR的頁面, 逐步培養新的頁面

Q: Will it make any difference between a shared IP and a dedicated IP on SEO or search results, as opinions are divided on this aspect?
共用IP與獨立IP對於SEO有何影響?

A: most of the web is on shared IP addresses, so it doesn't make much sense for us to give those on dedicated IP addresses any advantages. That said, if your server is struggling with the load of your website, it might make sense to move to a dedicated server that helps to make sure that your users are happy when visiting your website.
沒有


PageRank與SERP並不會以IP來ranking, 只會以IP來判斷區域

Q: If I 301 redirect a well-ranked page to a new domain with the exact same content, will all of the rankings be replaced with the new domain once it has been indexed? How long after indexing can we expect the swap? And is the same thing true for 302s?
301 redirect是否會轉移PR, 那302呢?

A: If you're moving from one URL to another (even if it's on a different domain), ranking signals can be passed via a 301. A 302 is used for temporary redirects, so this is less likely to transfer ranking signals.
301 redirect可用於網站轉移, 302只是暫時


詳見 : SEO策略: PR5+PR4=PR6?

Q: Google takes 200 signals for ranking a query and PR is one among those. If that is the case, why is it still showed prominently on toolbar. Any possibility of seeing PR info dropped from Google toolbar?
之前說過Google使用200個因素來判斷SERP, 為何toolbar要顯示PR...

A: PageRank is just one signal that we use, but it's also one of the easiest metrics to show to users and an easy one to understand where the metrics come from. So I think it's something that still provides value to users and still makes sense to show to them in the Google Toolbar.
因為是一個最早也最簡單說明的因素...


本站文章已經就各種不同因素說明, 200個因素要說好久...慢慢再說明啦

Q: How often does your search algorithm change?
Google多常修正演算法?

A: We change the algorithms all the time - last year we had over 450 changes.
經常, 去年修正了超過450次


參考前文"SEO觀點 : SEO面對的是巨變的環境"

Q: Should I be using hyphens instead of underscores in my URLs to improve a page's rank?
我應該在URL使用底線還是中線?

A: For the time being, I would recommend still using hyphens instead of underscores. If you're already using underscores and that's working fine for you and your rankings, it's not worth switching. But if you're doing a new site, then I would go with hyphens.
中線較好


參考: SEO策略 : 如何產生更多的backlink?

Q: Does link: gives exactly the number of back links to a site?
link:這個指令是否列出所有backlink資料?

A: The link: operator only shows a sampling of links to a site, so it may not show all of the links that Google knows about. To find more information about backlinks to your own site, we give verified site owners more information about backlinks in Webmaster Tools:
http://www.google.com/support/webmasters/bin/answer.py?answer=55281
非也, 只是列出代表性, 並非所有backlink, 可以參考上述連結


只有在Webmaster Tools中的資料才是完整資料

Q: If my website "A", linking to website "B", and "B" linking back to "A" - am I going to be penalized? Does linking strategies still work?
如果A頁連到B, 然後B又連回A, 是否會被懲罰?

A: Participating in linking schemes to impact ranking is not advised it's against the webmaster guidelines.
http://google.com/support/webmasters/bin/answer.py?answer=66356
The best linking strategy is to create a site with unique content or services that people want to link to. Then publicize it.
想要影響ranking的話...是的


link schemes需要好好想想, 並非都不行, 但某些狀況不行, 請詳讀上述link

Q: Are you going to focus more on personalised search? If so, these results we currently look at won't really matter, as different sites will be at #1 for different people, right? - thank you :)
是否某人看到的SERP會異於他人看到的?

A: that's right -- with personalized search it's possible that each user sees slightly different search results. We try to make those search results unique and compelling enough to make the user go visit and stay on the sites listed -- so if your site is really awesome, chances are high that we'd be recommending it to users as well :-).
是的


參考 : "Personal search is coming : 個人化搜尋將全盤改變SEO"

(全文完)

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)



延續"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", "Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)", 我們繼續來談其他問題...

Q: In addition to a XML sitemap, does it make any sense to have also an HTML sitemap on the same website? Does HTML sitemap helps improve the rating?
除了XML的sitemap外, 有HTML的sitemap對於rating有幫助嗎?

A: A HTML sitemap file can help search engines, especially those that don't use XML Sitemap files. Also, the 404 widget in Webmaster Tools (which you can place on your 404 pages) will use "/sitemap.htm" and similar files to help users to find the content they're looking for. So yes, I would recommend making HTML sitemap files, however I'd focus on the user and not the search engines.
是的, 但是是指對使用者有幫助


HTML sitemap可與Webmaster Tools 404 pages結合(也就是當找不到網頁時), 可以指向HTML sitemap, 此舉可以讓讀者繼續停留在網頁上

Q: Recently went through a rebranding of our company name. The old domain name was successful in page ranking, however the new domain name has terrible page ranking. Do 301 redirects transfer the site equity from the old domain to new domain?
當移動網站時, 301 redirect可否轉移ranking?

A: This is a pretty common question, so we actually did a blog post about it recently. In short, 301's are the best way to retain users and search engine traffic when moving domains. You can find the full post here: http://googlewebmastercentral.blogspot.com/2008/04/best-practices-when-moving-your-site.html
移動網站時可參考上述連結


這個問題我們在"SEO策略: PR5+PR4=PR6?"也已經談過

Q: Is the bounce rate and speed taken into account when ranking a page? i.e. if you see a searcher click on a result then return very quickly and choose another result, is the first page ranked lower?
Bounce Rate是否會影響SERP?

A: assuming that users will be jumping out of a site like that, there's a high probability that they won't be willing to recommend it to others (or come back themselves). So yes, indirectly at least, if a site is made in a way that users run away right away, then chances are that we might not be recommending it as much as other sites that users like (and recommend to others).
間接來說, 是的


我們在"BounceRate是否影響SERP?"也談過啦

Q: Many believe that to rank well, you simply need "quality" backlinks. But how important is having your keywords in the , and throughout your site? Is keyword density of any importance to show what the page is about? What % is suggested?
有人認為高品質的backlink是重要因素, 並且關鍵字密度比例應如何?

A: Links are just one factor involved in Google's ranking of pages. We look at both on-page and off-page content, so what you have on your page can be an essential part of ranking. However, there is no recommended "keyword density." Your content should be high quality and written for users. If you try writing for search engines, the language can become very unnatural, which may end up hurting you more than it helps.
on-page與off-page都是重要因素, 沒什麼關鍵字密度比例問題, 只需產生高品質的內容...


請參考之前"SEO策略 : OnPage & OffPage SEO"

Q: Does inconsistent capitalization of URLs cause duplicate content issues and dilution of page rank? For example www.site.com/abc vs www.site.com/Abc. On Windows hosts, these are the same page, but are different pages on Unix hosts.
URL上的大小寫是否造成不同的URL?

A: based on the existing standards, URLs are case-sensitive, so yes, these would be seen as separate URLs. Since the content on the URLs is the same, we'll generally recognize that and only keep one of them. However, we'd recommend that you try to keep all links going to one version of the URL. Keep in mind that this also applies to robots.txt files.
是的, 如果出現大小寫不同的URL指向同一內容, 我們只留其一


在使用英文大小寫需注意, 在UNIX類的機器是大小寫不同, 而windows是大小寫視為相同, 最好在網址與robots.txt上都保持一慣性

Q: Does appearing high in image searches help improve the host sites PR and appearance on standard searches?
影像可被搜尋是否對PR有幫助?

A: Thanks for the question Andy. Well-optimized, relevant images could definitely help increase traffic to your site, especially with the introduction of Universal Search, where we mix images, videos, and more into the web search results.
是的, 影像可被搜尋可以增加流量


在網站的影像影音檔應注意檔案名稱與alt的內容, 以便能夠被搜尋

Q: Is there a META tag we can use to tell Google the geotarget (country) of a particular webpage?
在meta可否標示地區?

A: we don't have META geotargeting capability at this time.
沒有


要讓網頁能夠有地區或語文區分, 可參考
http://googlewebmastercentral.blogspot.com/2008/08/how-to-start-multilingual-site.html
http://googlewebmastercentral.blogspot.com/2007/10/better-geographic-choices-for.html
http://googlewebmastercentral.blogspot.com/2008/04/where-in-world-is-your-site.html

繼續閱讀"Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)



延續上一篇"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", 我們繼續來談其他問題...

Q: Do inbound links from other sites owned by the same company help or hurt rank? 自己公司的自我連結是否有益或有害於ranking?

A: I've see SEOs have 1000 or 2000 different domains and cross-link them. I definitely would not recommend that... if you run a sporting goods site, and you link to your sister companies for camping and tailgating equipment, that's good for the user...Put yourself in the user's seat, and do what makes sense for these links. Good luck! SEO式的胡亂連結並不推薦, 但合理的連結可以接受, 只要站在讀者的角度有意義的連結都算OK


最後那句Good luck...有點毛骨悚然吧, 有些好自為之的意涵, Google並非全然沒發現non-sense link, 只是要不要處理的問題, 如果被處理到...就全盤皆輸了...還是Good luck...保重吧, 合理的連結可以接受, 但是如果是無意義的大量連結就盡量避免吧

Q: Will Webmaster Tools ever give us an option to "disassociate" from sites that link to us? This feature exists in Yahoo's Site Explorer, but not Webmaster Tools. 是否在Webmaster Tools提供拒絕對方連結的功能?

A: So far because we work really hard to make it so that one site can't hurt another site, we haven't really offered this...So that's a challenge, and since we haven't seen a need for it yet, that's why we haven't offered it yet. 對方的連結並不會影響, 目前沒看出有這個需求


Google的演算法中, 他站的連結並無法去搞亂另外站台的ranking, 真的如此嗎?

Google的假設是壞站可能會連到好站, 但好站不會連到壞站, 但是如果你有透過交換連結, 你如何知道對方何時會變成壞站? 更多詳細內容, 我們後續再討論

Q: Does Google plan to let us see rankings/positions of keywords in the webmaster tool? 是否會在webmaster tool工具中, 可以查詢關鍵字的ranking?

A: We already do, for a limited number of keywords, in the "Top search queries" section of Webmaster Tools. While we generally don't comment on future features or plans, expanding this functionality is certainly an idea that's been suggested to us. 已經如此做了, 增強的功能也進行中


Google Webmaster Tool中的查詢關鍵字ranking, 目前功能並不完善, 顯示的排名也似乎與實際資料有落差

Q: Until recentley (the last six months or so) a high ranking was achievable by submitting articles to article directories (providing they were 40%-60% unique), it no longer seems to be the case. Have links from article sites been de-valued at all?
目前一些文章目錄網站的效果是否降低?

A: In my experience, not every article directory site is high-quality. Sometimes you see a ton of articles copied all over the place, and it's hard to even find original content on the site. The user experience for a lot of those article directory sites can be pretty bad too. So you'd see users landing on those sorts of pages have a bad experience.
If you're thinking of boosting your reputation and getting to be well-known, I might not start as the very first thing with an article directory. Sometimes it's nice to get to be known a little better before jumping in and submitting a ton of articles as the first thing.
有些文章目錄網站品質並不高, 並不建議利用文章目錄網站來提高曝光度


文章目錄網站品質不一, 所以在把文章丟到文章目錄網站前, 應先好好審視品質, 否則只是白費功夫, 但是優秀的文章目錄網站還是具有一定的效果

Q: For SEO, I'd like to improve my rankings by removing technical obstacles (starting with dynamic URL parameters), what are the most important site fixes to make and how can I document before and after success metrics using the Google Webmaster Tool?
如何有效找出網站技術缺失並修改?

A: To check the crawlability of your site, I would recommend crawling your site with a crawler like Xenu's Link Sleuth (freeware, for Windows). Doing that gives you a rough look at how search engines view your site and can point you towards areas where crawlers get stuck in a loop or start crawling duplicates based on the URL parameters.
應先了解搜尋機器如何抓取你的站台


以搜尋引擎的角度來審始自己的網站是很重要的, 可以利用Google工具或一些免費工具來看哪些抓取會有困難, 然後修正

Q: Are .gov and .edu back links still considered more "link juice" than the common back link?
如果有被政府或教育單位連接, 是否比一般連結有效?

A: This is a common misconception--you don't get any PageRank boost from having an .edu link or .gov link automatically.
沒有分別


常常有人認為被政府或教育單位連接, 其PageRank/SERP表現會更好, 其實不是, 只是可能因為能導入流量而引起效果, 與gov/edu並沒有直接關係

後續問題分析還有很多內容, 容後再續...繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月4日星期四

Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)



Google搜尋引擎真正的運作機制一直是一個黑盒子, 但在Live Chat Q&A當中, 可以透過一些對話來了解大家關心的重點及解答, 我們來研究這些對話並且解析出到底哪些才是搜尋引擎最佳化的真正核心問題...

Questions and answers from the third online Webmaster Chat from October 22, 2008記載了所有詳細的對話, 但是光是看這些對話只是一些公式化的官方回答, 我們一一來解析中間的奧妙
Q: What weight does the age of a site and the amount of time a domain is registered for have on it's search placement? 網域名稱的註冊時間與長短是否影響搜尋排名?

A: In the majority of cases, it actually doesn't matter ... I try never to rule a signal out completely, but I wouldn't obsess about it. 大部分情形, 這個因素並不太重要 ... 我認為沒有單一因素

從這個回答中, 我們可以知道網域名稱的註冊時間與長短是"其中"一個因素, 只是Matt Cutts認為還有許多因素互相影響...這有點廢話, 不過Matt Cutts並未否認網域名稱的註冊時間與長短的重要性就是了

網域名稱的註冊時間與長短是搜尋引擎最佳化的一個因素
Q: Recently, you removed this suggestion: "Submit your site to relevant directories such as the Open Directory Project and Yahoo!" from your guidelines. Is there any chance that you will be discounting these kinds of links for ranking value in future? 是否將網址送到開放目錄已經不再重要了?

A: There's always the chance that we'll discount directory links in the future...Right now we haven't changed how we're weighting directory links--we've only removed the directory suggestion from the webmaster guidelines. 以後一定會減低這些目錄的重要性, 但目前並未如此做

也就是將網址送到DMOZ等較有公信力的開放目錄還是有效果的
Q: Can you explain how the use of sub-domains helps / hurts a sites ranking? 次網域是否會減損或加強ranking?

A: Good question--do mean in terms of subdomains vs. subdirectories? Maybe we can talk through this one after the official presentations? 沒有正面回答

這個問題被評為好問題, 表示已經觸及了一些重點了, 到底是次網域好?還是子目錄好?哪個可以對於ranking有正面效果呢? 這篇文章"Advice on Subdomains vs. Subdirectories for SEO"可以參考, 以往sub-domain也許可以得到一些效果, 但現在sub-domain與sub-directory似乎已經具備相同效果, 但是有一點值得研究的是site-1.example.com與site-2.example.com到底算同一個site嗎?其ranking的分配與sub-directory如何取捨? 你可以參考以下文章

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory
Q: Since Google is against using ranking software (ie:WebCeO) to monitor SERP rankings, is there any plans on Google creating an approved, in-house rank check application that webmasters can use? Google是否會提供rank check軟體?

A: It's something that we've talked about. My concern is that sometimes people get too worried with paying attention to their "trophy phrase" and want to rank for that even if that's not the best phrase for them, or concentrating on one phrase to the exclusion of all the other stuff they rank for isn't the best idea. I think paying attention to server logs or analytics data gets you a really nice array of keywords that are practical to work on. But this is feedback that we've heard, and personally I think it would be nice if we offered this for some reasonable size of keywords. 回答得好長, 希望不要把重點放在ranking (廢話, 沒Google大家就不會計較ranking啦), 但是重點是可能會提供...以後吧

Google對於PageRank Checker大抵是不鼓勵、不反對, 當然最好的方式是使用Google Toolbar上的PageRank Display, 但因為還要安裝軟體, 所以並不是很方便, 我們提供的PageRank貼紙是一個不錯的選擇

而Google對於SERP的Ranking則是反對的態度, 不過有一些免費工具可以尋找SERP Ranking, 我們整理完後再陸續提供, 其他問題的解析, 我們後續也會繼續探討...

繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月3日星期三

搜尋引擎最佳化 : subdomain OR subdirectory



昨天談到"搜尋引擎最佳化 : subdomain 與 subdirectory", 認為在搜尋引擎最佳化(Search Engine Optimization)的考量下可以使用subdomain / subdirectory, 但是如果只在subdomain / subdirectory下功夫, 而未能整體提升內容等品質的話, 效果可能就不如預期, 許多人會想知道: subdomain / subdirectory其間哪個比較有SEO的效用呢?

如前文所說:

sub-domain(次網域)主要來分別各個不同主機的用途
sub-directory(子目錄)主要來清楚分別各個不同主題的一群內容


對於search engine來說, server1.example.com與server2.example.com是不同主機、完全不同的URL; 而www.example.com/dir1與www.example.com/dir2是同一台主機、同一個URL下的分支

因此在選擇到底應該使用subdomain還是subdirectory時, 應該考量的是: 你可以花多少時間去照顧這個分出去的subdomain或subdirectory?

這是什麼意思呢?

(1)在pagerank不等於零的情況下, 別站連結到你的頁面效果高於自我頁面的連結
(2)在與別站聯結的狀況下, 如果有去有回可能會被判定為reciprocal link
(3)reciprocal link指的是互聯, (Google對於互聯的說法)
(4)某些網站參數的計算下,subdirectory會累積到同個URL, 而subdomain則獨立計算

因此subdomain或subdirectory? 其實是優缺互見的, 完全看你可以花多少時間去照顧這個分出去的subdomain或subdirectory

如果你可以讓某個分支也具有好的pageRank或網頁品質, 並且可以避免成為reciprocal link, 當然subdomain比subdirectory好

但如果你無法花很多時間照顧某個分支, 其實根本不需使用subdomain, subdomain與subdirectory其實是差不多的

就如同許多人曾經討論pixnet把部落格的subdirectory結構改成subdomain, 好像許多部落格站台的SERP表現更好了, 但是你也可能發現並非全面性的, 有些pixnet部落格站台還是沒有起色, 原因就是上面說的, 答案不是yes or no而已, 而是完全看整體的品質

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月2日星期二

搜尋引擎最佳化 : subdomain 與 subdirectory



正常來說sub-domain(次網域)與sub-directory(子目錄)在網站結構裡應該有非常清楚的用法, 但是問題一牽涉到搜尋引擎最佳化(Search Engine Optimization)問題就變得很複雜了, 為什麼呢? 我們來研究看看...

sub-domain(次網域)主要來分別各個不同主機的用途, 例如

www.example.com 當成網頁伺服器
mail.example.com 當成郵件伺服器
tw.example.com 可當成台灣的網頁伺服器
dns.example.com 當成網域名稱伺服器

但在網際網路廣為運用後, 內容增多了, 伺服器的負荷增加了, 開始了有以下的狀況

product.example.com 當成產品資訊網頁伺服器
question.example.com 當成問題整理資訊網頁伺服器
blog.example.com 當成部落格網頁伺服器
corp.example.com 當成企業郵件伺服器
tw.mail.example.com 可當成台灣的郵件伺服器
tw.dns.example.com 當成台灣的網域名稱伺服器

但是如果再加上為了搜尋引擎最佳化, 可能又變成

search-engine-optimization.example.com 為了取得search engine optimization較好的ranking
marketing.example.com 為了取得marketing較好的ranking

另外更有可能為了盜取他人的廣告效益, 如google.example.com, yahoo.example.com ... 等等, 這些雞鳴狗盜的事情都發生了...

而沒有辦法控制DNS(Domain Name Service Server)的人或快捷的作法也開始在sub-directory下功夫, 如www.example.com/search-engine-optimization/, www.example.com/seo/ ...

sub-directory(子目錄)主要來清楚分別各個不同主題的一群內容, 也就是有一大票的網頁希望可以清楚的區分類別, 但現在有些只有一兩頁的內容也都開始建立子目錄, 為的就是"搜尋引擎最佳化"

甚至更離譜的是許多SEO業者使用sub-domain與sub-directory, 卻都指向內容雷同或完全相同的頁面

這樣的作法有無效果? 答案是目前有效, 但是...指向內容雷同或完全相同的頁面已經可能遭遇悲慘的命運, 而使用sub-domain與sub-directory的效果已經逐漸遞減

sub-domain與sub-directory合理使用是符合簡化網站結構的好方式, 也可以順便進行搜尋引擎最佳化, 但是如果做得太不自然的話, 下場可能會不太妙

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月28日星期五

BounceRate是否影響SERP?



在前文"What is bounce rate? 什麼是跳離率?"解釋了什麼是Bounce rate, 有些人翻譯成"彈跳率", 字面沒錯但是似乎不太傳神; 這個跳離率可以讓你知道某頁面無法引起讀者的閱讀慾望, 因此有人就用各種方式證明, Bounce Rate是影響Google SERP(Search Engine Results Page)的重要因素, 到底是否真的如此呢? 我們來研究看看...

許多SEO討論跟黑帽SEO網站都在探討Bounce Rate與SERP的關聯, 並且許多文章也都引用資料證明Bounce Rate影響SERP(由於文章直接或間接連到黑帽SEO網站, 我就不link啦), 雖然資料都對, 但是卻也有些倒果為因的狀況

這些文章舉例, 當頁面的Bounce Rate低時, SERP的表現就好, 因此認為有直接關聯, 這個說法有兩個問題:

1. 如果網頁沒有使用Google Analytics, Google如何知道Bounce Rate? 有Bounce Rate資料的網頁與沒有Bounce Rate資料的網頁, Google如何比較?

2. Bounce Rate低的網頁, 表示對於讀者來講有閱讀誘因, 也就是質量好, 質量好的網頁具有好的SERP, 並不能代表Bounce Rate就是Google Ranking的因素, 也就是Bounce rate是果而非因


Google SERP的演算法確實已經從網站間的評分(PageRank,Backlink...)慢慢加入讀者間的評分(traffic,click,bounce rate...), 但是想用人為的因素來影響讀者間的評分是很難的, 除非你有無數的IP與無數的人力

BounceRate是否影響SERP? 答案是Yes and No

Yes是說讀者對某網頁的喜好會造成各種Bounce rate數據, Bounce rate低的就會有較好的SERP

No是說Bounce rate不是左右SERP的前因, 影響Bounce rate之前的因素才是重要因素

Bounce Rate是改善網頁的重要指標, 讓你可以知道哪些頁面無法誘使讀者繼續閱讀, 進而修改內容與配置, 但那不是為了獲得更好的SERP, 而是為了加強網頁的品質

也許哪一天Google完全掌握了Client端, 也就是Google Chrome佔領瀏覽軟體市場, 可能Bounce Rate就可以當成決定SERP的重要因素, 但至少現在還不是, Bounce rate只是眾多因素導致的結果, 而這個結果與SERP表現剛好一致而已

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月21日星期五

Matt Cutts在2009年看到什麼?



Webpronews在這篇文章"What Google’s Matt Cutts Sees In 2009"中談到明年的SEO趨勢, 也就如同我們在昨天文章提過的"Personal search is coming : 個人化搜尋將全盤改變SEO", 由於Matt Cutts是大卡, 所以我們來看看他到底怎麼說的...

首先Matt被問到是否Ranking已經宣告死亡, Matt表示確實Ranking將不再如以往重要, 由真正經營內容來獲得流量與轉換率才是真正的重點, 以後將不能把Google SERP抓圖下來告訴別人說, 你看我的SERP表現如此突出了

還有一句話很值得分析, Matt說: "...in 2009 you can't just think of yourself as an SEO", 沒有人能夠說他是SEO, 廣義來說大家都是SEO, 專注在自己Content的SEO, 也就是本網一直在宣導的"內容為王", "SEO : Honesty is the best policy (誠實是SEO最佳策略)"

沒有優良內容的空洞網站將面臨SEO空前浩劫

Matt表示 "SEOs are starting to embrace the fact that they are marketers. It's a broader spectrum. You have to think about how you build buzz, how do you get loyal customers, how do you optimize your ROI. All those different things and that can include how do I make good videos, do I have a book, things like that."


2009年以後, SEO已經不是以往的SEO, 應該變化成行銷者而非單純的技術工匠, 只靠黑帽式的網路技術已經無法生存, 必須整體思考如何建置一個吸引人的網站, 並且經營客戶的向心力, 將投資變成營收, Matt亦表示, 往後Google將可以處理所有的多媒體檔案, 如Flash、Video, 檔案中的文字內容將都可以搜尋得到

總之回歸網站的最初起點: 內容, 是往後應該專注的目標, 正正當當的組織自己的網站, 搜尋引擎自然會把最好的內容呈現給所有讀者...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月19日星期三

Personal search is coming : 個人化搜尋將全盤改變SEO



各位不知是否在近期的Google Search上發現SERP有異於往常的結果? 第一個是Google Dance的頻率較為頻繁, 第二個是在不同的電腦搜尋可能出現不同的SERP, 這就是我們在之前文章"Search Engine Optimization 六大心法", "SEO觀點 : SEO面對的是巨變的環境"都提過的, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

Bruce ClayPubCon上提出了他的看法, 認為明年第一季Google的搜尋技術將有重大的改變, 這個改變就是個人化的搜尋, 而此改變將連帶影響SEO的技術

語意搜尋(Semantic Search)尚未完全成熟前, 個人化搜尋 (Personalized Search)是改善搜尋的一個方式, 也就是您的IP, Cookie以及搜尋歷史資料來決定SERP, 當使用"java"來搜尋時, 有可能是要尋找程式資源, 可能是要尋找渡假資料, 也可能是要尋找咖啡資料, 若使用目前的ranking方式, 並無法讓使用者快速找到訊息, 因此讓不同的SERP出現在使用者面前, 是Google明年即將進行的大工程

這個變革將改變了什麼? Pagerank不再只以backlink為主要依據, 因此黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌

除了個人化搜尋之外, Google在明年還將有其他重大技術改革, 因此持續觀察並調整策略是SEO的重要課題, 在明年結束前應該就會有確定的答案, 如果無法隨時跟上Google或其他搜尋業者的腳步, 可能就會在這波趨勢上滅頂...

參考: System and method for providing preferred language ordering of search results

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月10日星期一

Search Engine Optimization : 搜尋引擎優化六大心法


本站自從2001年建立, 直到2008年四月建立部落格才陸續把網站優化(Website Optimization)及搜尋引擎優化/搜尋引擎最佳化(Search Engine Optimization)的一些資料整理分享出來, 深知這場看不見的網路行銷戰場是奠定網路世代的一項重要戰役, 因此不斷希望用更淺顯的敘述來讓更多企業與個人了解其中奧秘, 這裡整理了搜尋引擎優化/搜尋引擎最佳化六大心法讓更多人了解如何進行SEO...

搜尋引擎優化/搜尋引擎最佳化(Search Engine Optimization)六大心法是啥?

(1)由內而外 - 指的是由網站內部的健全, 然後才能由外眾星拱月
(2)建立關聯 - 搜尋引擎最重要任務就是把全球網頁組織起來, 所以內外關聯的建立是重要任務
(3)自然成長 - 跟搜尋引擎作朋友重在自然, 任何不自然的關連不能打動搜尋引擎
(4)經常更新 - 搜尋引擎喜歡活著的網站, 經常更新就是活著的証明
(5)知己知彼 - 搜尋引擎優化之戰不是亂槍打鳥, 必須鎖定關鍵字, 鎖定競爭對手
(6)善用工具 - 必須使用科學化的工具來解決煩人的問題

只要把以上的搜尋引擎優化/搜尋引擎最佳化(Search Engine Optimization)六大心法牢記在心, 相信您也能夠體驗出別於旁人的獨門武功

其實我們之前的文章也都把以上心法說過很多次, 只是這次把他歸納出來, 讓更多人容易瞭解

搜尋引擎優化/搜尋引擎最佳化(Search Engine Optimization)六大心法:由內而外、建立關聯、自然成長、經常更新、知己知彼、善用工具
, 可以讓SEO不再是入門容易、出師難的一門學問, 默唸在心可常保網站平安...呵呵

後續我們會再整理出更多資料, 不過您可以先看看以前的資料:

善用PageRank指標提升企業競爭力
搜尋引擎的運作背後
網路行銷 : SEO 五大要素
網路行銷 : SEO十大守則
網路行銷/網路營銷 -- 內容為王
SEO : 搜尋引擎無法索引Flash檔案?
網路行銷/網路營銷 : SEO 三大建議
Pagerank 演算法研究
PageRank, BrowseRank, AlexaRank
SERP : Search Engine Results Page
SERP : 搜尋排前對消費者的影響
SERP v.s. PageRank : PR值與搜尋排前的關係
SEO : Honesty is the best policy (誠實是SEO最佳策略)
There's No Secret Recipe to SEO : SEO沒有秘訣
Query Deserves Freshness (QDF) : 由內容新鮮度談SERP
SEO for Dummies : SEO白癡手冊
SEO : SERP的影響公式探討
SEO : inception date的意義
SEO的簡單數學問題
SEO與Google網誌搜尋
SEO與Google網誌搜尋 (續)
SEO不是網站優化 : 談C-L-O-U-D-S
SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗
SEO : 從搜尋排前、搜詢排前、搜查排前、搜索排前、查找排前談TYPO SERP
SEO : How Google Handle Duplicate Content? (Google如何處理重複內容)
什麼是PageRank Hijack?
SEO策略: PR5+PR4=PR6?
SEO策略 : Myth of Link Building
SEO觀點 : 進行SEO前需要知道的事
SEO實例 : Aspire One與EEEPC
SEO策略 : OnPage & OffPage SEO
SEO觀點 : Google Analytics & PageRank
SEO策略 : 404 Error狀況的處理
SEO策略 : 如何產生更多的baclink?

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

什麼是Google Dance?


Google也會跳舞? Google Dance指的是當Google進行更新各個資料中心的資料時, 在不同的資料中心所搜尋到的SERP(Search Engine Results Page)會上下跳動, 所以稱之為Google Dance...

我們在"Google資料中心的秘密"已經提過Google在全球各地的資料中心架構, 也在"SEO笑話 : 買相機請到阿呆照相機器材行"說到SERP的在地化問題

Google在每年會進行數次的Google Dance, 有人說一年約十次, 但其實是不太確定的說法, 到底有幾次也並不是太重要, 在這些更新行動中, indexing/backlink/pagerank會做最新的更新到各個資料中心, 其結果就是影響了SERP, SEOCHAT Google Dance Tool可以觀察這個更新

如果某個關鍵字的SERP在各不同的資料中心排名不同時, 就顯示Google正在Dance當中, 這個動作會持續數天的時間, 不過據觀察Google Dance的頻繁度越來越高, 可能與整個效能增加有關, 已經不太像一年只有十次

除了效能增加的因素外, 整個網路的資料量變大, 更新更頻繁也有關係, 如果Google不更頻繁的更新, 也不會有我們之前在文章提到的"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP", 所以也許Google Dance的大跳舞是一年數次(global update), 但是小跳舞(local update)卻是每個時間點都在劇烈的進行著, 等小跳舞到一個地步就來個真正的Google Dance...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月7日星期五

SEO觀點 : SEO面對的是巨變的環境



如果您看過美式足球, 一定曾經被足球比賽的多變所震憾過, 一場比賽沒有到結束前, 沒人知道哪個隊伍是最後贏家, 因為任何時刻都是關鍵, 差之毫釐沒有抓到球或是沒有攔到對手, 都可能翻轉整場的勝負

教練必須在各種瞬息萬變的狀況下隨時調整策略, 以應付當時的情勢, 而所有現場的反射動作都是平常多年累積下來的經驗結晶, SEO(Search Engine Optimization)也是如此, 沒有絕對不變的真理, 只有隨著整個網路生態與技術的推移逐步調整出最好的步伐...

決定SEO巨變的環境有幾個因素: 搜尋業者的生態、搜尋技術的演進、整體網站的生態、網站技術的演進

以上生態與技術的觀察就是維持SEO策略精準的重要因素

因此如果對於整個生態與技術的錯誤評估, 就會造成錯誤SEO策略的開始, 所以SEO並沒有不能公開的秘密, 因為我在"網站優化是一個既科技又藝術的大工程"提到過-各種時空背景的因素讓網站優化變成一門很容易入門, 但是很難出師的課程

技術公開不代表就能被全盤取走, 沒有公開的技術在沒多久就可能變成一文不值的技倆

這裡說的"網站優化"當然包括了SEO(Search Engine Optimization), 所以SEO也是容易入門但很難出師

如果SEO專家一疏於研究, 沒多久就會被淘汰, 所以真不是人幹的行業

什麼是"搜尋業者的生態"? 就是Google、Yahoo、Microsoft等業者的分分合合、起起落落, 前陣子Google確定不跟Yahoo廣告合作後, Yahoo開始對Microsoft拋媚眼, 如果真的某一家被併購, 以前針對某個search engine的優化就可能付諸流水或降低成效, 但如果不針對某個search engine, 優化效果又可能不盡人意, 故需隨時注意各種生態風向而機動調整

什麼是"搜尋技術的演進"? 就是PageRank、BrowseRank...等等演算法的修正, 會直接影響優化的成果, 要看緊搜尋技術的演進是最累人的, 因為這些演進不會公開, 只能由各種學術論文去預測走向, 由各大外國網站瞭解蛛絲馬跡, 並且透過實際作業來驗證, 目前就有許多研究顯示: 對於backlink的分析已經有許多不同以往的成果, 只是不知何時會被正式納入

而整體網站的生態、網站技術的演進就比較容易觀察, 我們的文章也一直在談這些範圍

因此SEO專家必須如球場上的教練一樣, 所有判斷的反射動作都必須靠多年累積下來的經驗結晶來產生, 容易入門但很難出師的情況, 讓許多對於SEO有興趣的人常常覺得似乎學了很多, 但又好像沒真的學到什麼, 只能逐步慢慢培養, 好在SEO的場子上面對巨變的環境...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月21日星期二

SEO實例 : 請大家都去撞牆

現在談一個讓大家都想去撞牆的實例, 您猜猜如下面這樣頁面的網站他的PageRank到底有多少? 您沒有看錯...頁面就是只有一個畫面加上一個唸經式的音樂, 完全沒有內容或者連結...




以上這個垃圾網站的PageRank竟然高達6...

經過PageRank Hijack的觀察, 其PageRank也是真的...

再來透過Google與Yahoo的backlink資料, 其Google的backlink有812個, Yahoo的backlink有18,779個

再經過這些link的連結往下看...

原來就是透過SEO業者最喜歡使用的, 在各網站張貼垃圾link或簽名檔, 只是這個站長時間應該是多得早晚都在數螞蟻, 堅忍不拔的把垃圾link拱到了上萬個...這個網站是目前看過垃圾聯結玩得最過火的

由這個例子可以瞭解, Google的PageRank演算法已經出現了很大的漏洞, 因為他分不出來推薦聯結與垃圾聯結 (但不表示未來不會修補)

但是雖然他把PageRank推到了6, 但是因為網頁幾乎沒有內容, 因此幾乎沒有SERP的表現

這種垃圾link的方式, 在目前屬於有效的黑帽式SEO, 但是卻破壞了該網站的creditability(可信度)

這個可笑的網站在DMOZ ODP的網站目錄中將之分類為 Top: Recreation: Humor: Useless_Pages, 也就是"Basically, pages with no purpose other than to be funny, odd, strange or stupid."

原來笨到極點的網站還可以被收錄來當笑話...哈哈, 只是Google沒注意到這點, 忘了調整PR, 還是它是屬於笑話第六級? 不得而知...

相信該網站如此作法, 應該是想高價賣出網域, 但是如果知道內情, 應該不會有正常的企業會想購買

而且只需簡單幾個步驟就可以知道這個PR6是怎麼來的, 因此雖然目前尚屬有效提高PR的作法, 但是卻很可能鬧得太出名而被搜尋引擎除名

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月15日星期三

資料視覺化 : Data Visualization



各種資料越來越多, 對於人類而言很難在一大堆資料中快速找出端倪, 例如把一堆銷售資料轉換成圖表後, 可以一目瞭然的知道到底銷售狀況如何, 如NameVoyager(上圖)就把英文名字圖表化(需安裝Java plug-in), 看出各年代哪些名字是菜市場名, 我們來看看國外還有哪些研究結果 ...

這個網站2008美國總統大選候選人評比就用問卷的方式讓您來找出到底應該支持哪個候選人(如下圖), 不像台灣的選舉就簡單多了, 反正就看顏色選就對啦 ...



這個網站Visuword透過圖形化把英文的WordNet表示出來, 如下圖把"Taiwan"這個字的關聯顯示成圖形化, 不過可能由於WordNet詞庫的關係, 只有看到Taipei與Taichung兩個城市



看了這些例子, 是否覺得看圖比看文字簡單多了? 資料視覺化正是在大量資料的年代的一個趨勢, 如果您有興趣, 更多資料視覺化可參考這裡:
175+ DATA AND INFORMATION VISUALIZATION EXAMPLES AND RESOURCES

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO亂像 : 垃圾內容就是這麼來的

前文"網路是一個大糞坑? Internet is a Cesspool?"說到: search engine的演算法讓網路變成是一個大糞坑, 近日在某個SEO論壇看到一些製造垃圾內容的文章, 還被版主標為精華, 差點眼珠都快掉下來...

摘錄部分內容翻譯如下 (看用詞大概就知道是從何而來了)

採集技巧

(1)可採集論壇,論壇被采的比較少,原創程度高
(2)採集被封站,這招是最狠的,我指的是採一些台灣的網站,只要不涉敏感內容就沒事,采回來的內容全部是原創。
(3)採集翻譯,利用google的翻譯功能把英文內容翻譯中文,做成垃圾站,這招可以說是俺原創的,後來被好多朋友抄了。
(4)關於原創原創的排名是特別高的,大家不管怎麼做站肯定要有一些原創的內容,具體可找篇文章按自已的話說一遍,這是一種。 嫌累就寫個詞庫,把一些詞批量換過來如“計算機”這個詞變成“電腦”這樣很快原創內容就做成了。


難怪常在搜詢結果找到網站後, 發現內容每個字都懂, 但怎麼就是不知道他在說啥, 不然就是許多不同網站但內容卻都雷同, 就是因為這些網站製造了"垃圾內容"

下圖就是本站文章被"採集"的狀況, 其中略掉了某些連回本站的link, 因此內容讀起來會一頭霧水



您只要在Google以"SEO 五大要素"去搜詢, 就可以找到一堆跟本站文章幾乎一樣的內容, 什麼時候我講的SEO五大要素變聖經了, 每個要素還都一字不差 ...

這些垃圾內容不但浪費了讀者的時間, 也糟蹋了自己網站的品牌, 實在是一件不可取的作法, 如果稍具權威的網站還將標示為精華, 實在有些無言了!

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月13日星期一

網路是一個大糞坑? Internet is a Cesspool?

"網路是一個大糞坑 - Internet is a Cesspool", 這句話說得真...坦白, 說這話的人不是別人, 他正是Google的CEO Eric Schmidt, 他為何會這麼說呢? 這句話的背後代表了什麼意義呢 ...

如果其他人說網路是一個大糞坑, 可能還不太算數, 但是如果Google的CEO說的, 這就有點值得來探討一下了

Cesspool是啥?
cesspool [美] [ˈsɛsˌpul] [英] [ˈsesˌpuːl]
污水坑;糞坑;污穢場所

Eric SchmidtEric Schmidt在上週二與雜誌負責人見面時說: "The internet is fast becoming a "cesspool" where false information thrives"...

因為太多的爛資訊讓網際網路已經快速變成一個大糞坑...


說這句話的意思跟我之前文章的意思很類似, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

如果真的如Eric說的, 那Google的Data Center真是"大便處理中心"了....

想像一下這個場景:

在Google的辦公室, 剛喝完下午茶, 兩位工程師正閒聊著 ...

"你猜, 昨天那個傢伙又用程式產生了幾篇完全無意義的內容?"

"哦, 又來啦 ... 大不了幾千篇吧?"

"你猜錯了...這回這傢伙可能很下心來幹了, 竟然產生了十幾萬頁的內容..."


這種類似的對話, 可能在Google是一些茶餘飯後的笑話, 如果您對SEO稍有瞭解, 應該也常會發現種種另人噴飯的作法, 我就常看到本站文章常被竄改成為別站的文章, 更好笑的是刪除某些相關聯結會讓讀者滿頭霧水

這些胡扯產生的內容或連結就是Eric所說的cesspool ...

Google的CEO Eric Schmidt說這句話當然有某些程度上有其背後的目的, 因為他講話的對象是雜誌的重要人士

他認為這些實體內容與Google是天生的夥伴, Google讓實體內容在網路上可以搜尋得到, 並且由於這些實體企業的品牌讓讀者信賴...但是他沒說因為網路上的內容讓實體雜誌失去利潤, 是否會讓有品質的內容逐漸減少?

不產生內容的Google大賺其錢, 卻讓產生內容的雜誌報紙苦撐, search engine的演算法讓網路變成是一個大糞坑, 讀者必須在大糞坑中撈有價值的鑽石, 其實是很無奈的一件事

內容產生者如何產生利潤? search engine如何避免讓internet變成cesspool? 讀者如何在cesspool中辨識鑽石? 這些問題實在很難有一個簡單的答案

這些問題的現象其實就是"你在看誰的部落格?"的作者Andrew的憂心, 要在這些網路亂像中生存只有兩個方向: 內容產生者要著重經營品牌, 而透過Google的機置應該回饋利潤給內容產生者

Eric Schmidt提到了品牌的經營, 但沒有說到如何回饋利潤 .... 高招

在回饋利潤尚未有定論前, 內容產生者只能努力的先經營品牌, 靠著各種廣告機置來貼補成本, 不過話說回來廣告機置又被search engine的關鍵字與Google Adsense瓜分了大半, 內容產生者就只能走一步算一步了

網路是一個大糞坑? Internet is a Cesspool? 確實是如此, 產生有品質內容的業者被淹沒在糞坑中, 讀者每天在糞坑中打滾, 而利潤都跑到處理糞便的大型糞便處理中心了

參考資料 : http://adage.com/mediaworks/article?article_id=131569

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月9日星期四

SEO實例 : Aspire One與EEEPC

現在不管是計畫旅遊或是購買產品, 在網路上查詢訊息已經是許多使用者的必備功課, 網路上可以看到的訊息對於您的產品是正面評價或是負面評價, 很有可能會左右消費者選擇產品的意向

一般中小企業沒有龐大的預算來進行傳統媒體廣告, 網路上尋找得到的訊息對於消費者的影響更是深遠, 而且就算是大型企業也不應該認為SEO是一項可有可無的作業, 我們來看看以下的例子 ...

如果我們現在想要瞭解宏碁(Acer)的Aspire One與華碩(ASUS)的EEEPC, 到底哪個產品會比較好用?

於Google輸入"Aspire One", 看到以下畫面:



以上的查詢, Acer的網站確實出現在第一項, 但是 ... 竟然沒有一個中文字

我們前文提到過, 搜詢結果的title與description會影響網友的點選意願, 如果您不擅長英文, 當然就更不可能點選

就算您看得懂英文, 出現如上的畫面, 也很可能會先選擇點選第二項

但是第二項目的內容, 就已經非Acer所能掌握, 如果第二項的內容是嚴重的負面評價, 消費者的意向就可想而知

於Google輸入"eeepc", 看到以下畫面:



以上的查詢, ASUS的網站確實出現在第一項, 雖然title是英文, 但是至少description是中文字

但是 ... 第三項也是別的網站的內容

再來, 也許您希望比較Aspire One與EEEPC而在Google輸入"aspire one eeepc" 或是 "eeepc aspire one 比較" ... 等等, 搜尋的結果就都不是Acer或ASUS的網站

這個例子說明了, 大型企業除了有官方網站之外, 其SEO作業的加強是必要的, 並且應該另外建立或培養非官方網站的技術網站或是部落格, 或是培養技術作家在非官方網站發表相關分析文章

因此SEO作業對於中小企業或是大型企業都是必須正視的議題, 才能滴水不漏的促銷您的產品

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月8日星期三

SEO觀點 : 進行SEO前需要知道的事

也許是受到關鍵字廣告的影響, 許多企業認為想要進行SEO只要錢花下去, 就能夠馬上看到效果, 其實SEO絕對不是錢的問題, SEO的成效牽涉太多因素, 如果企業不能對於SEO即刻採取瞭解, 對於長期的企業競爭力絕對會大打折扣

Search Engine Watch的一篇文章"What You Need to Know Before Committing to SEO", 中肯的說明了企業要進行SEO前需要知道的事, 我把它摘要如下 ...

作者Mark Jackson認為, 如果企業想要進行SEO來推廣網站, 本身必須要做足功課, 不能把所有的計畫交由SEO公司, 如果企業本身對SEO不了解, 很可能注定這是一個失敗的專案

進行SEO前需要先了解幾個問題:

What Are You Doing?

首先企業必須知道SEO能做什麼? SEO到底在做什麼? 企業如果能夠了解整個狀況, 比較有可能得到預期的效果

如果企業對於SEO不清楚, 而碰到品質不好的SEO公司, 當然只是浪費時間與金錢, 但是如果有幸碰到負責的SEO公司, 也可能因為企業對於SEO作業的不清楚而產生溝通困難, 當然整個作業的效能也會不如預期

因此在著手SEO前必須對於SEO有初步的認識

Where Do You Want to Go?

SEO的手法百百種, 可以得到的效果也很分歧, 希望的目標不同當然也會影響整個作業的方式

您只是想把網頁的品質提高? 您希望讓使用者很快搜尋到? 您希望能夠透過網路增加銷售量?

當然最後的一項是所有企業希望的 : 透過網路增加銷售量

但是"Don't rely on Google for Web sales", 這篇文章潑了一些冷水 ...

不是在search engine被搜尋到就能增加銷售量, 也不是被點選就能夠增加銷售量, 甚至您可以看到許多小店在網路上被口碑行銷炒得火熱, 但是卻完全沒有自己的網站

SEO只是達成增加銷售量環節中的一環, 其他許多因素必須環環相扣才能達成目的, 光是SEO是無法增加銷售量

因此您必須要瞭解透過SEO, 您想到什麼樣的境地? 達到這個境地會有什麼樣的結果?

What Will It Take to Get There?

瞭解了SEO可以做到什麼, 再來就必須知道需要訴諸哪些行動才能達成

您的企業內部是否都知道SEO? 是否所有的配合單位都已經知道該如何配合? 如果您想要的關鍵字已經被競爭者霸佔, 您應該有哪些作為才能夠逐步挽回? 成立部落格來提升網站內容的品質? 僱用專家來撰寫文章還是讓員工自行發揮?

要達成設定的目標, 勢必需要企業整體動起來, 而非全權讓SEO業者主導, 因為不同行業有不同的know-how, SEO業者未必都瞭解產業生態

How Much Will It Cost? Expected ROI?

再來就是要把目標數據化, 要達到您所設定的目標, 哪些作業是必須投入額外的費用, 要達成的目的其成果數據如何清楚呈現?

如前面提到, SEO只是達成增加銷售量環節中的一環, 因此SEO的費用也只是投入費用的一部分, 如果企業想要透過網路來增加銷售量, 必須是總體戰, 把社交網路/SEO/關鍵字廣告/口碑行銷 ... 搭配既有的廣告作業, 才能真正發揮戰力, 達成增加銷售量的目的

SEO只是達成增加銷售量環節中的一環, 並且必須長期抗戰, 如果只想透過SEO來增加銷售量, 可能會讓您失望的, 但是如果捨SEO而把廣告經費投入其他作業, 當您的競爭對手已經遙遙領先時, 可能您必須花更多的精力才能追得回來 ...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月1日星期三

SEO策略: PR5+PR4=PR6?

許多網站會碰到一個類似的網址問題, 就是網址前面有無WWW都可以連到同樣的站台, 更有些網站使用多個網址指向同一個站台, 當這樣的狀況產生時對於網頁的評分,backlink的計算及SERP的結果到底有哪些影響呢?

有些專家指出, 若您有兩個網址(如www.dns.com.tw與dns.com.tw)都指向同一個網站, 而其PR各為5與4的話, 如果您把這兩個整合為一, 將可獲得一個PR6的站台...真的假的?

我們實際測試的結果, 答案是否定的, 但是 ... 裡面還有許多值得思考的地方

不同網址指向同一個網站, 有幾種情況:

(1)使用DNS Server的A Record或CNAME來指向同一個Server(IP), 並在Apache或IIS設定允許該URL(或沒設定禁止, 當然太開放會引發另外問題, 他文再談)

如果該Server有www.dns.com.tw/blog, 則也有dns.com.tw/blog, 或有www.another-domain-name.com/blog

(2)使用DNS Cloaking Redirect來轉址

當使用虛擬主機與third party DNS Service時, 可能就無法使用DNS Server的A Record或CNAME來指向同一個Server(IP), 這時候DNS Cloaking Redirect就可能被使用

(3)使用302 Redirect與301 Redirect, 及meta refresh

302 Redirect又有on-domain/off-domain之分

所謂on-domain 302 Redirect例如將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.dns.com.tw/prog1, 或反向轉

off-domain 302 Redirect則是將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.another-domain-name.com, 或反向轉

301 Redirect與302 Redirect的分別是: 301 Redirect為"永久轉址", 302 Redirect為"暫時轉址", 兩者對使用者沒有差別, 但是對於search engine的差別是, 被301 Redirect的page就不被index

如http://athletics.mlb.com被302 Redirect到http://oakland.athletics.mlb.com/index.jsp?c_id=oak, 如果您使用"oakland a’s"當關鍵字在Google Search, 會看到athletics.mlb.com

根據Yahoo與Google的文件, 說明基本原則如下

Yahoo在處理301,302,meta refresh上, 其處理方式為:

- 使用301, 302由domain A->domain B, 則index domain B
- 使用302由domain A URL->domain A其他URL, 則index前者
- 使用301由domain A URL->domain A其他URL, 則index較上層的URL
- Yahoo處理meta refresh為301 redirect

Google在處理301,302,meta refresh上, 其處理方式為:

- Google處理meta refresh為302 redirect
- 使用302 redirect, 則index source, 也就是index來源頁
- 使用301 redirect, 則index destination, 也就是index目的頁

但實際上, Google可能會處理off-domain 302 Redirect與301 Redirect為相同, 也就是URL A->URL B的話, URL A就不index, 而以URL B為目標

因此這麼多的狀況下, PR與backlink的轉移就不是redirect就會轉嫁, 不同的search engine在處理這些問題上也有不同的作法, 所以PR5+PR4=PR6? 答案是Yes and NO, 必須以長期與短期效益來仔細分析才能獲得最佳狀態

參考工具: Redirect Checker

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月26日星期五

什麼是PageRank Hijack?

顧名思義"PageRank Hijack"就是PageRank綁架, 也就是所謂的Fake PageRank

再說清楚一些就是利用黑帽方式來欺騙search engine, 在PageRank的評分上創造出假的數值

例如您手上有一個網域your-domain-name.com, 原本站台www.your-domain-name.com其PageRank為零, 但利用search engine的演算法漏洞, 把www.your-domain-name.com快速提升到零以上

這樣的手法有何目的? 我們如何辨別Hijacked PageRank或Fake PageRank?

在說明整個內容之前, 我先舉一個發生在今年七八月間的實例 (詳細人名等資料就不公開)

話說有一個可能缺錢缺到發慌的人, 他去註冊一個過期的網域名稱 (Domain Name), 這個網域名稱在2002年到2005年被使用, 2005年三月之後就不再營運, 後來就被這位仁兄在2008年七月註冊起來, 他利用URL Redirect的方式把該URL的PageRank造假到PR=7, 剛好因為Google PR Update在2008年七月底左右進行全面更新, 所以這位仁兄很快就讓該URL達到PR7, 在短短幾天就讓他幸運的把PR0->PR7, 還在網路引起許多不熟悉search engine的人稱羨

透過URL Redirect到別人的網站後, 等待Google PR Update後, 再把URL Redirect回自己的網站, 此時就看似擁有一個高PR的網站, 目的就是要高價銷售網域名稱

這位仁兄得逞之後, 在DNForum就張貼廣告開始大吹特吹, 說他有一個特好的網域名稱要割愛, 結果被DNForum的專業級人士吐槽

為什麼會被吐槽? 因為手法太兩光了, 兩光在哪裡?

(1)對search engine有點了解的人都知道, PR0->PR7在不到一個月的時間完成是不可能的
(2)Google在2005年以後已經修改演算法在處理PageRank Hijack的問題
(3)Wayback Machine可以把網站歷程記錄, 該網站中間兩年斷掉, 不可能快速恢復PR
(4)使用Google搜尋技巧就可以破解Fake PageRank

雖然網路上有一些PageRank Validation Tool, 但大多不好用, 其實Google本身就可以確認(如下)

在輸入欄打入 info:URL-to-Check

URL-to-Check就是指要查詢的URL



如果經上面方式查不到資料或上圖中的(1)(2)的URL不是同一個, 就是經過URL Redirect, 而URL 2的PageRank就會被URL 1所綁架

但是因為Google演算法的改版後, 已經對Fake PageRank做篩選, 因此URL Redirect並不保證能夠綁架PageRank

也就是說, URL Redirect不一定能綁架PageRank, 就算你綁架了別人的PageRank, 也會輕易的被辨識出來

況且當綁架別人網站的PageRank後, 等於向search engine說你的網站是不存在的, 因此所有內容就不會被index

最後一句話

好好做人, 不要使用詐欺的手段來造假, 魔高一尺 ... 道高一丈

後續再找時間來聊Fake PageRank Detecting Algorithm ...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月25日星期四

網站優化是一個既科技又藝術的大工程

在前文"SEO不是網站優化 : 談C-L-O-U-D-S"已經談過, 千萬不要把SEO與網站優化混為一談, 因為網站優化所需要的技能與知識包括了:視覺設計、人機界面、企業知識、軟硬體知識、網頁結構、網路技術、搜尋技術、寫作知識、語意技術 ... 等等太多東西, 網站優化的對象不僅是搜尋引擎, 還包括了消費者與企業, 因此能夠稱得上是網站優化的專家或專業團隊, 絕對是少之又少 ...

而所有這些所需的知識, 又隨著時間的推移有不斷變化的趨勢, 更讓網站優化是一個既科技又藝術的大工程

三、五年前覺得好看的網站, 現在看起來可能會感覺很瞎

以前覺得很好用的界面, 現在可能沒有AJAX的話會覺得很冏

一、兩年前搜尋引擎的演算法, 到現在可能60%都不一樣了

各種時空背景的因素讓網站優化變成一門很容易入門, 但是很難出師的課程

在微軟的官網上有這麼一篇文章 - "Optimize your Web site for better ranking in search engine results"

您也許認為微軟講的應該是專家了吧, 他的內容提到關於SEO的方法, 我們來看看他怎麼說:

"The more sites that link to you, the more popular your site will appear to search engines, and the higher you may appear in search rankings."

他提到link越多越好, 但沒有告訴您這些link有品質之分

"Place your keywords in order of importance; only use keywords that actually appear in the text on that page."

"Include common misspellings that people might mistakenly type in a search..."

他告訴您在meta中的keyword最好是出現在網頁內容中的, 但是又告訴您也把typo keyword也加在meta中, 兩者明顯矛盾

總而言之, 微軟的建議都是大方向正確 ... 但是不太有用的作法

連微軟都是這樣, 就更別提一般在網路文章上看到的內容了("你在看誰的部落格? 是誤解還是事實?"), 如果是幾年前的SEO文章, 其正確性與效益就更值得懷疑了

也許您會問:那怎麼辦?

最好的方式就是先吸收各家說法, 訂定一個測試計畫, 一項項不互相影響的實際測試, 當然一年內能夠測試完成就算不錯了

如果您沒有那麼多時間, 我會替您將各種說法, 以Search Engine的專利資料為主, 以各種技術為輔, 告訴您目前實際的測試結果

因此能夠稱得上是網站優化的專家或專業團隊, 絕對是少之又少 ... 而小編只是一個小測試員, 一個小小的學術研究者, 不是大師, 也不是專家 ...

讓我們來研究真正的網站優化, 而不只是掛上網站優化外皮的SEO ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月24日星期三

SEO : How Google Handle Duplicate Content? (Google如何處理重複內容)

在網路上尋找資料時, 經常發現重複或近似內容, 有些是splog造成, 有些是惡意的SEO動作, 有些則是有其必要的原因, 在Google關於重複內容的說明文件中, 指出:

非惡意的重複內容可能包括:
-可針對行動裝置產生的一般網頁和精簡網頁的討論區
-透過不同的URL儲存顯示或連結的項目
-列印用網頁

但在某些情況下,有心人士會故意在整個網域中重複內容,試圖操控搜尋引擎的排名或贏得更多的流量。 這種欺騙的做法會帶來不好的使用經驗,因為訪客會在搜尋結果中看到大量相同的內容。

Search engine到底如何處理重複內容? 如何才能避免因重複內容而導致處罰?

我們先來看看幾個檢查重複內容的網路服務:

http://www.webconfs.com/similar-page-checker.php
http://tool.motoricerca.info/similarity-analyzer.phtml

當然以上只是初淺的查詢, 並非search engine所依靠的方式, 到底Google如何確定兩個網頁是重複的呢?

根據Google的專利資料"Methods and apparatus for estimating similarity", "Detecting duplicate and near-duplicate files" :

A similarity engine generates compact representations of objects called sketches. Sketches of different objects can be compared to determine the similarity between the two objects. The sketch for an object may be generated by creating a vector corresponding to the object, where each coordinate of the vector is associated with a corresponding weight. The weight associated with each coordinate in the vector is multiplied by a predetermined hashing vector to generate a product vector, and the product vectors are summed. The similarity engine may then generate a compact representation of the object based on the summed product vector.

就是透過由文件形成vector, 再由hashing function產生的值, 與vector相乘後總合, 由這些總合後就變成sketch, 來比較這些sketch求得重複程度

在這篇研究文章中"Detecting Near Duplicates for Web Crawling(PDF)", 使用Charikar's simhash將高維的向量轉成f-bit fingerprint

這篇論文也指出, 辨識重複資料的目的:

(1)減少search engine在處理重複資料的空間浪費與計算浪費
(2)可以比對找出散佈在各地的類似新聞, 形成相關連的叢集(cluster)
(3)利用檢查結構類似, 可以用來淬取資料
(4)用來檢查文章的盜用(plagiarism)及垃圾網站(spam)
(5)用來檢查文章的改版

如Google所說的, 重複資料不是都屬於黑帽SEO, 有其必要性, 但是還是必須小心參考Google關於重複內容的說明文件, 好好審視您的網頁的重複狀況, 因為判斷重複內容的技術越來越精準, 事先避免才能保持與search engine的友好關係

以下是影片的說明:
Getting Serious, Series 1: Avoiding Duplicate Content


Do You Have Duplicate Content and Not Even Know It?


其他參考資料:
http://www.seobythesea.com/?p=999
http://www.vizioninteractive.com/search-engine-optimization-tip-14-fix-duplicate-content/
http://www.searchenginejournal.com/duplicate-content-penalty-how-to-lose-google-ranking-fast/1886/

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

正妹與SEO


上圖是兩個網站的Alexa Reach比較圖, 至於是哪兩個網站並不是重點, 就不說明了, 紅色線是某個人氣頗盛的部落格, 藍色線是專門貼正妹照片的網站, 前者寫了半天卻在流量上輸給掠人之美的養眼網站, 就投資報酬率來說, 真是氣死人吧 ...

正妹現象是一個全球的狀況, 拜數位相機普及之賜又讓正妹自拍多了一個展露自信的好工具, 也讓男性動物滿足了偷窺的欲望

在去年的新聞裡"網路自拍研究"引起不少的轟動, 因為論文中轉載多到不行的女性自拍照片, 其中甚至還有不少三點全露的畫面, 蠻好奇當教授在審查這篇論文時候, 不知有無任何生理反應? 還是心中充滿道德淪喪的悲哀?

在YouTube中一個影片"What you Learn from Porn", 更是把色情網站詮釋得令人噴飯


另外一篇"Facts about Internet Porn", 更是舉了一些數據 (數據來源,正確性僅供參考)

(1)San Fernando Valley is the porn capital of the world.
(2)12% of all websites are pornographic
(3)25% of all search engine requests are pornographic
(4)35% of all Internet downloads are pornographic in nature
(5)Every second 28258 Internet users are viewing pornography
(6)Every second $ 89.00 are spent on Internet porn
(7)Every day 266 new porn sites appear on the Internet
(8)Sex is the most searched word on the Internet
(9)U.S. Revenue from Internet porn in 2006 $ 2.84 Billion
(10)72% of Internet porn users are men
(11)28% of Internet porn users are women
(12)70% of Internet porn traffic occurs during the 9-5 workday
(13)There are an estimated 372 Million porn web pages
--- 3% produced by the UK
--- 4% produced by Germany
--- 89% produced by the US
(14)Most trafficked adult website: Adultfriendfinder.com
(15)Countries that ban pornography: Saudi Arabia, Iran, Bahrain, Egypt, UAE, Kuwait, Malaysia, Indonesia, Singapore, Kenya, India, Cuba, China (China好像不該入列吧...)
(16)Most visited websites daily:
--- 1. MSN.com: 220 Million visits
--- 4. Youtube.com: 196 Million visits
--- 49. Adultfriendfinder.com: 7.2 Million visits
--- 145. Nytimes.com: 4.1 Million visits
(17)3,412 people visit Kellemarie.com daily

以上這些資料顯示了一個重點: 美女經濟的可怕

所以...有些台灣大型入口網站是以網路情色媒體起家, 許多大站更是把美女自拍當成金雞母

更有人想用美女照片要來賺Adsense的錢 ... 不過大都無功而返, 因為一些porn keyword (如正妹/自拍...)一搜尋下去, 顯示的是上億的資料頁, 因此這些網站在網路行銷上大多費盡心思, 不過倒是有人拒絕為這類網站進行SEO ...

我們從這些正妹現象裡可以觀察到這些網站的一些特性:照片美、內容豐、更新快、找得到, 更重要的是...就是提供您想看的

這些特性對照一般網站, 以SEO的觀點來看:

(1)您的網站提供網友真正需要的內容嗎?
(2)您的網站提供的內容真的高品質嗎?
(3)您的網站提供的內容量夠嗎?
(4)您的網站提供的內容更新夠快嗎?
(5)您的網站能讓網友快速找到或快速散播嗎?

雖然一般網站很難有太多令人難以抗拒的內容, 以上的幾點也是應該努力的目標

本篇文章瞎扯半天, 把正妹與SEO扯在一起, 其實也是在進行一項實驗 .... 等實驗結果出爐再公告結果

[後記:實驗結果]

沒有想到剛貼文出去, 以"正妹"當keyword, Google Blog Search顯示共有一百四十幾萬筆資料:


但是以Google Search, 當然沒有出現 ...

當然以上結果會很快被後續文章刷新, 但是這個結果顯示了:

(1)新鮮度與主題主宰了Google Blog Search的結果
(2)TrustRank影響是否被Google Blog Search快速抓取
(3)其他影響SERP的因素在Google Blog Search並不明顯

其他後續Google Blog Search的觀察, 再擇期說明了 ... 看正妹照片去了! 呵呵!!


[補記:實驗結果 2008.09.25]

後來發現剛刊登的文章, 在數秒之隔就出現在Google Blog Search ... 怎麼可能呢? 後來觀察後終於明白 ...

因為本部落格使用Blogger For Domain, 原來Google並非來抓取資料到Google Blog Search, 而是我自投羅網, 我送出資料時其實已把資料丟到Google (Blogger就是Google的啊!)

所以如果使用Blogger的服務, 不管是Blogger For Domain或是刊在Blogspot, 都有快速被抓取查詢的優勢, 而其他部落格就只能等Google定期的抓取了

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月23日星期二

SEO : 從搜尋排前、搜詢排前、搜查排前、搜索排前、查找排前談TYPO SERP

通常在進行SEO(Search Engine Optimization), 都需要先進行Keyword的分析, 根據選定的關鍵字來進行後續動作, 但這中間有一個很難克服的問題就是- Typo

什麼是Typo? 英文原義是: 印刷工,排字工, 或是typographical error, 這裡指的是 "輸入錯誤" 或 "打字錯誤"

因為Typo產生的問題, 可以分成兩方面: 一個是真的打錯字, 另一個是同義或是近義

Typo在網路上引發的問題可分成兩大類: domain typo與keyword typo

domain typo上如果是類似辭比較沒有意義, 使用者會弄錯的機率較低, 如car.com與automobile.com

但是如果是打錯字或形似的話, 就可能會損失原網站的流量, 也可能被當成網路釣魚的工具

amazon.com 與 amaz0n.com (利用字母O與數字0的形似)
adobe.com 與 abobe.com (利用字母d與b的形似)
disneyChannell.com 與 disneyChannel1.com (利用字母l與數字1的形似)
www.microsoft.com 與 www.microsoft.com.your-domain-name.com (利用子網域的特性)

如google.com也早把g00gle.com註冊起來, 以防止使用者誤入錯誤網站

查詢g00gle.com的註冊資料如下:

Registrant:
DNS Admin
Google Inc.
1600 Amphitheatre Parkway
Mountain View CA 94043
US
dns-admin@google.com +1.6506234000 Fax: +1.6506188571

這篇文章"Strider Typo-Patrol: Discovery and Analysis of Systematic Typo-Squatting"就在研究domain typo的問題

domain typo會被SEO利用在什麼地方? 大多利用子網域的特性建立與投入大量廣告的domain類似的子網域

如www.hsbcdirect.com.bank-high-interest.typo-domain-name.com

把一些類似他人網域的字串加在自己網域前面, 這樣的手法屬於穿梭法律邊緣...但是不入流的作法, 如果被search engine認定為惡意的話, 就會被降級

但是如果僅把可能當keyword的字串放在自己網域前面, 如 seo-research.your-domain-name.com, 則屬於正常SEO的手法

在keyword typo方面就更麻煩了

以information與infomation兩個字來看, 屬於第一種, infomation純粹是打錯字, 但是如果您以"infomation"這個字去網路查詢, 發現還真的很多網頁都出現這個錯字

以搜尋排前、搜詢排前、搜查排前、搜索排前、查找排前, 這幾個組合來看, 是屬於近義或是類似辭

如果您的網站以"搜尋排前"名列SERP第一頁, 但如果使用其他近義或類似辭, 很可能根本找不到, 這時候就真的虧大了

因此進行SEO, 設定keyword時, 需要進行typo分析, 看其他近義或是類似辭在搜尋時可能被使用的狀況

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月22日星期一

SEO與Google網誌搜尋 (續)

經上個星期的文章"SEO與Google網誌搜尋"與本週的資料比對顯示, Google的blog search更新速度實在快速, 可以搜尋到最新的部落格文章, 如果更新速度不夠快, 會很快的被他頁面排擠下去, 剛剛的文章"SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗"幾乎剛刊登就同步被Google抓取 ...

剛剛才寫完的文章就被Google抓在第一名, 但會因時間被更新的文章往後推(如下)


而更重要的是, 頁面title的文字就是被抓取當keyword的重要依據, 如此被顯示在blog search第一位置, 就能夠快速增加被搜尋的可能與點選率, 這也就是網頁的更新度為何會影響SERP結果的重要因素之一

也許有些人會質疑, 為何我的部落格也是更新很快, 也都注意使用清楚的title, 為何都不出現在blog search中呢? 這些問題容後慢慢再告訴您, 其實答案已經都在本部落格中了, 只是我尚未清楚整理出來, 如果您等不及想要找出答案, 就請先看看本部落個的SEO系列文章吧 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月19日星期五

SEO的簡單數學問題

前幾天與朋友吃飯, 因為他經營鋼板生意, 閒聊中不免抱怨現在的景氣蕭條, 做生意越來越難賺錢, 因為跟他已經是多年的朋友, 因此大膽的問他現在營收如何? 利潤好不好? 他給了我ㄧ個出乎意料的答案 ...

他說雖然營業額已經上億, 但是利潤只有5%, 並且最近希望能夠請電腦公司變更網頁設計, 以及尋找更好用的ERP軟體

我不免計算了起來 ... 以最保守的估算

100,000,000 X 0.05 = 5,000,000

也就是扣除成本, 每年的收益有五百萬, 這樣的收益還不好, 大概很多人都要撞牆了, 但是這樣的營收與收益, 竟然沒有任何網路策略, 竟然還在找ERP軟體

我問他公司網頁有無進行SEO? 他回答 : 什麼是SEO?

所以可想而知, 他的生意都是一步一腳印用腿跑出來的, 網頁只是一個型錄, 沒有任何行銷的作用, 這也是一般中小企業的狀況, 因此我就簡單的介紹一下

以該公司經營類別來說, 他的關鍵字組合可能是:

stainless (Google每月平均搜尋量 8,100)
steel (Google每月平均搜尋量 33,100)
stainless steel (Google每月平均搜尋量 6,600)
不銹鋼 (Google每月平均搜尋量 22,200)
不鏽鋼 (Google每月平均搜尋量 27,100)
鋼板 (Google每月平均搜尋量 8,100)

所以如果以上的組合都能在SERP第一頁, 以上依照關鍵字不同其點擊成本在NT$6 ~ NT$45不等, 我們以NT$5來計算的話

8,100+33,100+6,600+22,200+27,100+8,100=105,200 平均每月曝光數目

以最保守估計1%會click進入, 105,200 X 5 X 0.01 = 526,000 X 0.01 = 5,260 (NT$)

也就是如果進行SEO達到效果的話, 每個月至少節省 NT$5,260 (每年至少節省NT$63,120), 當然都是以最保守估計, 如果再精算的話, 就可以知道SEO到底值多少錢了

如果點擊成本在NT$10, 5%會click進入, 每年就節省了NT$631,200, 如果點擊成本在NT$20, 10%會click進入, 每年就節省了上百萬的廣告開銷, 如果把Yahoo的效益也算進去, 您覺得該不該進行SEO?

其他更精確的討論, 來確認以上的數據來源, 後續再談了 ...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO與Google網誌搜尋

我們在之前文章談及"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP", 現在我們來驗證看看新鮮度與更新率對SERP的影響結果, 到底目前這個部落格的文章搜尋曝光度如何呢? 以下是一些結果, 並且當成資料, 以供後續對照 ...

我們進到Google的網誌搜尋, 打入"seo"得到以下結果, 並且我們後續來觀察SERP變化:

在三千多萬筆的搜尋結果下, seo這個關鍵字目前結果:


在二十多萬筆的搜尋結果下, serp這個關鍵字目前結果:


在一萬多筆的搜尋結果下, 網路行銷這個關鍵字目前結果:


(本站的資料都在第一個位置, 但以上資料可能因時間會有變動, 並且在Google Chrome browser無法顯示圖檔)

這個結果代表了幾個事實, 內容新鮮度影響SERP甚鉅, 以及在Google認定的blog範圍內, 談論SEO,SERP,網路行銷的繁體資料實在少得可憐

為何會有如此現象? 大概都把自己知道的內容暗幹起來, 不願意公開討論吧, 如果能夠把這個主題當成學術議題來看待, 如前文"SEO : Honesty is the best policy (誠實是SEO最佳策略)"所談的, 也許可以教育更多的企業主, 讓SEO成為大家重視的問題, 也能讓網路使用者真正搜尋到想要的資料 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月17日星期三

SEO : inception date的意義

所謂inception的意思是初始, inception date就是初始日期, 一個網頁文件的初始日期對SERP(Search Engine Results Page)的影響在前文已經討論過, 我們現在來看看Google如何決定網頁文件的inception date ...

根據Google的專利文件US 7,346,839 B2的說明, inception date由好幾個方式來決定

(1)由搜尋引擎抓到該網頁文件的日期
(2)由該網頁文件所在domain之註冊日期
(3)該網頁文件被其他網頁文件關聯的日期
(4)由儲存該網頁文件的伺服器time stamp

找出以上日期後, 依最早的日期或經演算法判定該網頁文件之初始日期, 這個日期就會影響該網頁文件的評分, 新網頁文件有10個backlink, 會比十年前的網頁文件具有100個backlink來得好 ... 但是也有可能會有例外

什麼時候會出現例外? 當演算法由初始日期與backlink的計算中, 發現異常數字時, 會將之歸類為spam, 這個時候就會降低原本的評分

而什麼是異常數字? search engine會由正常的網頁文件中的inception date與backlink, 算出一個參考值, 如果某網頁文件的backlink成長率超出一個範圍, 就是異常, 至於正常成長率是多少? 超出的範圍是多少? 這個資料並沒有揭露, 但是我們可以由幾個方式了解

(1)一些PR同等級而且值得信賴的網頁的backlink平均成長率
(2)自己網頁的成長率曲線 (參考)

由他站的成長曲線可以知道曲度(slope), 由自己網頁的成長曲線可以知道是否平滑, 如果往上成長的曲度合理並且平滑, 大致就沒麼問題, 但是一定會有被誤判的情況, 不過如果時間拉長, 以上的計算不失為蠻精準的演算法


標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月16日星期二

SEO : SERP的影響公式探討

在之前文章"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"談到時間因素會對SERP (Search Engine Results Page)有所影響, 到底是怎麼個影響法呢? 我們由Google的專利資料中來研究一下 ...

第一個公式:


其中
H: History-adjusted link score
L: Link score given to the document (也就是PageRank U.S. Pat.No. 6285999)
F: elapsed time measured from the inception date associated with the document
(詳細關於inception date, 後續再來談)

由以上的公式可以知道, 剛開始link score會放大, 然後慢慢以平滑曲線遞減
L=5, F=1, H=10.47
L=5, F=2, H=8.30
L=5, F=3, H=7.15
L=5, F=4, H=6.42
...
L=5, F=59, H=2.80
L=5, F=60, H=2.79

但是某些SERP data set的average date並無太大差異的情況下, 新產生的網頁就未必有優秀的SERP,所以你會看到某些查詢結果幾乎不太變動, 但某些查詢結果卻一日數變, 就是這個因素

第二個公式:


其中
U: Update score
f: a function, such as a sum or weighted sum
UF: Update frequency score
UA: Update amount score

也就是網頁的更新頻率與更新量會來決定U, 同樣的如果SERP data set的average date-of-change並無太大差異的情況下, 以上公式就不會去影響SERP

至於search engine如何知道哪個網頁有更新呢? 更新量如何呢? 基本上search engine不可能把所有頁面都全部cache, 某些頁面就以signature來判斷(例如在頁頭抓一個字,頁中抓一個字,頁尾抓一個字,如此就能產生該頁面的signature), 當signature變動時, 就知道本頁已經update

至於update amount就可以用多個signature來判斷, 例如一個頁面中的10個signature有3個已經變動, 就比10個signature中有2個變動有較多的update amount, 當然不一定精準, 但平均而言差異不大

所以根據你下的關鍵字所產生的SERP, 其特性到底是哪個種類?

是否會因時間而影響? 如果不會的話, 新網頁就很難打破這個SERP

是否會因更新頻率與更新量而影響? 如果不會的話, 你再如何時常更新也於事無補

因此瞭解了以上的公式, 對您網頁的SEO多少有些助益

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月5日星期五

SEO for Dummies : SEO白癡手冊

許多經營部落格的人, 常常剛開始充滿熱情, 但寫到最後因為幾乎沒有人看而退出江湖, 其中不乏有許多精彩內容的部落格, 為何沒有人看? 因為經營部落格的方式錯誤, 並且沒有做到基本的SEO (Search Engine Optimization)

這篇文章來談談以非技術觀點下, 您可以輕易運用的SEO方式, 因為連白癡都看得懂, 故名為"SEO for Dummies : SEO白癡手冊", 所以沒有任何特別誣蔑的意涵 ...

由於本篇文章定位為入門, 所以必須把SEO先做最簡單的解釋

SEO(Search Engine Optimization)就是指運用一些方式, 把您的網頁調整成搜尋引擎喜歡的方式, 一但被搜尋引擎喜歡以後, 就比較容易被網友找到, 當然流量就會增加

談到流量, 我們先談談網友到訪您的部落格的三種方式 :

(1)在瀏覽軟體打入您部落格的網址, 或由他們的"我的最愛"進入您的部落格
(2)透過別人的網頁上的連結, 點選後進入您的部落格
(3)透過搜尋引擎打入您部落格的名稱或關鍵字, 由搜尋引擎連到您的部落格

另外一種是搜尋引擎或網路機器人, 透過指令式方式進入您的部落格, 這點與本文無關, 我們就不談

因此以上三種方式就決定了您的部落格的流量

所以建議剛剛成立部落格的人, 最好先使用大型入口網站的部落格服務, 等流量到達一個程度後, 再另外擁有自己網址(註一)的部落格 (如本站 : http://www.dns.com.tw/blog), 這樣才能累積自己網址的信用度(註二)

(註一:以上姑且以網址代替網域名稱, 以方便入門者瞭解)
(註二:所謂信用度就是搜尋引擎信任您的部落格網址的程度, 當擁有自己網址, 這個信用度才屬於您的)

為何要先使用大型入口網站的部落格服務? 因為您的部落格文章至少會出現在他們網頁(如最新部落格文章...), 也就藉由上面三種流量來源的(2), 會漸漸增加您的流量, 而您的內容如果不錯, 被別人收入他的"我的最愛", 就有了(1)的流量

所以內容不錯以後, (1)(2)的流量就會自然產生

但是上面三種流量來源的(3), 就必須靠自己的調整了, 這個調整的動作就是在做SEO

哪些動作要做呢? 整理如下:

(1)談大家可能有興趣, 但是經過網路搜尋後, 大家比較少談的主題
這點困難度稍高, 但如果能就自己專業範圍內, 盡量比別人早一步談這個主題, 可以建立權威性, 並且內容新鮮度高, 可以容易被搜尋到, 如果有興趣看細節, 詳細內容在: "Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"

(2)最重要的關鍵字一定要出現在"主題(title)"上, 並且如果長度允許, 最好中英文都有, 如本篇的主題:"SEO for Dummies : SEO白癡手冊"

(3)在內文中, 認為有可能可當關鍵字的字串, 以<h1>...</h1>, <h2>...</h2>等tag夾起來, 會顯示如下

SEO for Dummies : SEO白癡手冊

... 但是不要用得太離譜

(4)使用Social bookmark (如funP, Hemidemi ...), 把您的文章自我推薦上去

(5)將您的部落格網址推薦到DMOZ, Google Directory, Yahoo Directory

(6)與朋友較優質的部落格互相交換連結
與其他網站交換連結時必須慎重, 因為根據Google的判定, Bad page會連到Good page, 但是Good page不會連到Bad page, 因此如果您連到一個被Google判定為Bad page的話, 您也會被受到牽連

(7)使用其他的社交網路工具 (如部落格觀察...)

(8)使用PageRank checker貼紙, 可以隨時觀察自己部落格的頁面PR值變化, 當有不錯PR值時, 可以適度在該頁面增加連到自己其他相關內容 (但是如果內容是八竿子打不著的就不必了)

關於PageRank (PR) 如果有興趣可以參考 : Pagerank 演算法研究

(9)使用Counter (如http://www.shinystat.com/), 可以觀察詳細的流量狀況, 或稍微進階者可以使用Google Webmaster管理員工具

(10)Anchor link策略
不管建立Forward link(往別人頁面的連結)或Backlink(連回自己頁面的連結), 在建立連結時最忌諱使用以下的樣子:

<A Href="http://www.dns.com.tw">這一篇可以參考</A>

因為以上"這一篇可以參考"這個字串, 與連往的站台一點都不相關, 這個字串就好像向搜尋引擎介紹一樣, 這個介紹詞就成了此互連網頁的關聯, 不管是Forward link或Backlink都要仔細編輯這個字串

(11)使用NoFollow
在一個頁面中雖然可以有無數的Forward link(往別人頁面的連結), Google也都可以抓到, 但是一個頁面的Forward link最好在數目100以下, 並且如果您不希望Google把某些Forward link也算下去, 您可以使用如下的語法

<A Href="http://www.yahoo.com" rel="NoFollow">Yahoo</A>

減少一個頁面中的Forward link數目, 可以防止被不必要的頁面去瓜分評分

當然以上的方式如果要效果明顯, 前提是您的部落格或網站必須要有好的內容, 如果沒有好的內容, 神仙都沒辦法 (之前文章有提到過 : "網路行銷/網路營銷 -- 內容為王"), 但是除了有好的內容外, 如果能夠依照上述方式好好調整, 相信對於流量會有不錯的改善

以上盡量以比較淺顯的方式, 來說明如何讓不懂技術的人來進行SEO, 如果有任何意見或建議, 歡迎多多指教啦 ...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Query Deserves Freshness (QDF) : 由內容新鮮度談SERP

什麼是Query Deserves Freshness?

就是在搜尋時SERP會因為內容的age而出現不同的結果, 也就是說, 新的頁面在某一段時間內, 其SERP會比舊資料更有優勢, 那到底這段時間多長? 這種現象是否合理? 與其他SERP規則有無牴觸?

我們先撇開所有既有的想法, 純粹由使用者觀點來看的話, 使用者當然希望找到最新的資料, 並且要找到最正確的資料

如果所有的網路文章撰寫者都是很負責任的話, 當然最新的資料等於最正確的資料是可以成立的, 但是 ... 網路文章撰寫者都是很負責任的嗎? 所以很有可能新資料有可能是不成熟的

如果您看過之前文章, 應該會同意我的看法, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

話說回來, 另外有些資訊是不會變的, 這時反而舊資料是可能比較權威的, 例如許多wikipedia上的資料初始日期是很早的, 並且後續還有許多更新

到底Google在處理這些資料時, 如何判斷哪個頁面是fresh(新鮮)? 哪個頁面是stale(陳舊)?

在Google的專利資料顯示了許多影響SERP的因素: "Information retrieval based on historical data", 對於想要研究SEO的人應該好好閱讀, 這裡面就隱含了所有影響SERP與PageRank的因素

如果能夠把Google近期的專利都讀完, 大概您對search engine就能有更深一層的瞭解了, 以下是相關資料(html與pdf), 如果您沒有時間讀那麼多密密麻麻的資料, 我在後續文章會再說明這些內容

DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE
Publication number: US 2007/0094254 A1
Filing date: Nov 20, 2006

DOCUMENT SCORING BASED ON DOCUMENT CONTENT
Publication number: US 2007/0100817 A1
Filing date: Nov 21, 2006

DOCUMENT SCORING BASED ON QUERY ANALYSIS
Publication number: US 2007/0088692 A1
Filing date: Nov 22, 2006

DOCUMENT SCORING BASED ON LINK-BASED CRITERIA
Publication number: US 2007/0094255 A1
Filing date: Nov 30, 2006

DOCUMENT SCORING BASED ON TRAFFIC ASSOCIATED WITH A DOCUMENT
Publication number: US 2007/0088693 A1
Filing date: Nov 30, 2006

Personalizing anchor text scores in a search engine
Patent number: 7260573
Filing date: May 17, 2004
Issue date: Aug 21, 2007

Information retrieval based on historical data
Patent number: 7346839
Filing date: Dec 31, 2003
Issue date: Mar 18, 2008

光從上面的專利標題, INCEPTION DATE, DOCUMENT CONTENT, QUERY ANALYSIS, LINK-BASED CRITERIA, TRAFFIC ASSOCIATED WITH A DOCUMENT, anchor text, 您大概就可以知道Google在對網頁評分的標準了, 這些因素在之前一系列SEO文章也都提過

話題扯遠了 ... 我們回到主題, 本篇只談文章的新鮮度

現在假設有一篇熱呼呼的文章剛被Google抓取, 姑且稱網頁A其初始時間(INCEPTION DATE)為2008.09.05 12:00:00, 這篇文章會不會出現在SERP的第一頁, 就完全取決於query analysis後, 網頁A內容與keyword的相關性緊密度評分, 如果評分後有其他網頁更優勢, 當然網頁A就被排擠下來

如果相關性緊密度評分相等或相近, 並且這個SERP set中的其他頁面, 其他評分並不顯著優勢(如backlink), 這時網頁A就可能出現在SERP的第一頁, 但是這個優勢會隨著時間因素而遞減(公式後續再談)

網頁A如果在因時間因素遞減下, 但增加了自然的backlink, 就可能繼續存在SERP第一頁

網頁A如果在因時間因素遞減下, 沒有增加自然的backlink, 若其他頁面也同樣沒有增加自然的backlink, 網頁A也可能繼續存在SERP第一頁

對於Google而言, 網頁A如果在一週內有10個自然的backlink, 其link analysis評分當然比存在一年的網頁B具有30個backlink要優秀, 但是這裡強調的是"自然的backlink", 非自然的backlink就可能會被演算法抓出, 以人為的方式降級或列入sandbox中

這也就是為什麼一些很新的網頁會出現在SERP第一頁的原因, 但是別太高興, 如果內容不好, 就會被其他相關文章擠下去

有興趣的話, 請期待後續文章啦 ...

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月1日星期一

我不在你心裡, 我在你家樓下 : 談廣告行銷

台灣大哥大昨天公布「myfone」行動創意獎, 「我不在你心裡,我在你家樓下。」得到「給情人的簡訊」首獎, 獲得了七萬元的大獎, 平均一個字要五千多元 (詳細新聞看這裡),「我不在你心裡,我在你家樓下。」這句話在男女交友上有何背後的意涵? 這句話在廣告行銷上又有何意境呢?

我不在你心裡表示對方尚未把您當一回事, 或是雖然不討厭您, 但尚未接納成男女朋友

如果是第一種情況, 也許對方會說 : 既然你不在我心裡, 就也甭出現在我家樓下, 或更狠的是 : 別出現在我的眼前任何地方!

如果是第二種情況, 也許出現在樓下久了之後, 會慢慢佔領心頭一片空間 ...

其實最好的情況應該是 : 「我不只在你心裡,我還在你家樓下。」

許多條件比較好的靚女型男應該都有被「纏」上的經驗, 要麻老是接到一堆令人做嘔的情書, 要不就是被緊迫盯人, 大概此時的心聲都是 : 幹!麥閣吵啦!

如果聽到「我在你家樓下」, 反應大概不外兩種 : 甜跟嘔

如果還蠻喜歡對方, 可能會甜意漸上心頭, 如果壓根沒任何意思, 嘔吐的感覺就會油然而生 ...

因此如果沒把握能夠讓對方有吃「甜在心」饅頭 (哈...出自周星馳的少林足球)的話, 最好別自做主張隨便出現在樓下, 不然一盆花砸下去, 沒死也要半條命 ...

「我在你家樓下。」大概除了可能有嘔的感覺之外, 還可能會有怕的感覺, 除了被債主"登"在樓下會怕之外, 被討厭的人等在樓下, 也是一樣會怕低

話說回來, 幹什麼這裡討論「我不在你心裡,我在你家樓下。」? 還談得這麼爽? 難道要暗示你也有被等在樓下的經驗? Oh...No....本文的主要內容還在後面 ...

一些廣告行銷也就是想抓著 : 「我不在你心裡,但我隨時在你四週」, 因此筆者對於這類逃不出被轟炸的廣告, 所抱持的態度就是 : 廣告打得越大的, 就越不消費

Why? 因為打廣告不用錢啊? 這筆錢誰付? 還不是羊毛出在羊身上, 最後還是消費者買單!

猛打你的東西最便宜? 你的費率最低? 省省吧! 真的便宜自然大家會知道啦, 不需這麼敲鑼打鼓!

廣告其實就是一種合法的騙術, 房屋廣告說一分鐘到捷運? 食品標榜有機? 基金標榜穩賺? 所有的內容都是謊言, 他們就是能夠有一套說法來掩飾謊言

前陣子去"足感心"的那家店買了音響, 結果後來發現其他賣場, 同樣的東西還便宜$500, 趕緊看看這家"足感心"的店家如何退款? 上面標的很清楚: 買貴主動退差價活動辦法...云云, 一個月過去了, 也沒接到任何"主動"退差價的訊息

因此廣告商如果想「我不在你心裡,但我隨時在你四週」, 最好的方式就是讓消費者感覺不到廣告的味道, 但這個廣告隨時出現在消費者的身邊, 也就不刻意的方式, 讓消費者隨時看得到

啥方式呢? 答案就是網路, 就是SEO, 就是前面文章所說的"看不見的網路行銷戰場"

讓對方感覺以自然的方式出現, 而且很自然的隨時都會出現, 不僅適用在男女交友上, 也適用在廣告上

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

There's No Secret Recipe to SEO : SEO沒有秘訣

本站的一系列關於SEO的文章, 提出了許多實務的看法, 不約而同的在William Flaiz的"There's No Secret Recipe to SEO", 也談到了跟本站一樣的觀點

我把"There's No Secret Recipe to SEO"這篇的重點整理了一下, 看看跟我們之前的內容有哪些不同?

William Flaiz提出的四個方向:

(1)研究對手, 找出適合的關鍵字

跟我們之前文章"網路行銷 : SEO 五大要素"說的一樣, SEO沒有絕對的, 只有相對的, 我們提到: 瞭解您的競爭對手, 用上述的五個元素來解析競爭對手的網站, 並選擇您要的關鍵字, 鎖定了對手才不會像無頭蒼蠅一樣

(2)讓您的網站SEO-friendly

啥是SEO-Friendly? 就是網頁結構讓search engine瞭解, 我們在"網路行銷/網路營銷 : SEO 三大建議"中提到 : 有價值的網站需要讓search engine瞭解, 並讓讀者可以搜尋到您的內容, 這也是所有搜尋引擎希望所有webmaster能夠協助的地方: 在search engine還不夠智慧的情況下, 讓search eninge能夠真正反應讀者想要尋找的內容

(3)增加backlink, 善用SMO (Social Media Optimization)

要增加backlink, 最好的方式就好的內容與善用工具, 就是我們在"網路行銷/網路營銷 : SEO 三大建議"中提到的 : 善用網路社交工具, 網路書籤就是一個例子, 好的內容不怕沒有backlink, 但也要行銷得宜

(4)隨時回顧您之前的步驟

最後就是定期的回顧之前的作法, 可能search engine改變了演算法, 可能之前的作法有缺失, 因此沒有一次SEO就可以一勞永逸的 ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月29日星期五

Semantic Ranking : Search Engine 的另一扇窗

由前文"Pagerank 演算法研究"與"SERP v.s. PageRank : PR值與搜尋排前的關係", 我們瞭解了影響網路搜尋結果的幾個因素

但是網頁的互相連結並無法表示支持的程度, 目前PageRank計算一概以均分的方式, 而網頁互相連結也無法表示網頁間的關聯, 如科技類的網頁A連接到科技類的網頁B, 對於網頁的重要度評比, 當然應該比生活類的網頁C連接到科技類的網頁B要來的重要

而使用網頁結構與keyword的關聯性來產生SERP的結果, 也有可能出現錯誤的狀況, 比如keyword為"SERP PageRank" 與 "PageRank SERP", 就可能產生不同的SERP結果, 同義與相近詞也無法透過搜尋有效率的尋找

這些都是由於PageRank與SERP目前都尚未真正融入Semantic語意技術, 沒有語意技術實在很難以分析這麼多看似不相關的資料 ...

"Context-Aware Semantic Association Ranking", "Ranking Complex Relationships on the Semantic Web", "Ontology-Driven Semantic Ranking for Natural Language Disambiguation in the OntoNL Framework" ... 等等文章就提出了Semantic Ranking的概念, 希望以語意的關聯來建立網頁間的關係, 如果您希望看更多訊息, 可以用"semantic ranking"去進行搜尋

什麼是Semantic Ranking? 就是用語意技術去評比網頁, 當您下一個關鍵字, 網頁就可以用semantic ranking的大小來依序顯示, 不像現在只是純粹比對字串

當網頁間存在Semantic Connectivity (語意連接性) 或Semantic Similarity (語意相似性), 就是存在Semantic Association (語意關聯性)

例如: 當網頁A的內容討論車子的性能, 網頁B的內容討論重型機車的性能, 網頁C的內容討論BMW汽車的性能, 網頁D的內容討論寶馬汽車的性能, 則網頁A-C,A-D互相具有Semantic Connectivity, 網頁C,D互相具有Semantic Similarity, 而網頁B則可透過另外網頁與網頁A產生另外一個Semantic Connectivity

不過可惜的是以舊有的網頁語法, 如果沒有使用RDF (Resource Description Framework), 比較困難建立這些關係, 如何在既有的HTML語法下, 或簡化使用RDF的方式來改善PageRank與SERP是Search engine的一個困難的難題

如果這個問題可以解決的話, Search engine的市場就可能重新洗牌, SEO的方式可能就全面改觀了, 拭目以待吧 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO : Honesty is the best policy (誠實是SEO最佳策略)

如果您去搜尋引擎尋找SEO (Search Engine Optimization) 的資料, 大概讓您一個月不吃不喝也看不完, 但是大多內容都把SEO弄得很複雜, 我在如本站一系列的SEO探討文章中, 盡量以淺顯的說明來讓您瞭解

也許您會問 : 為啥你把別人拿來吃飯的傢伙都抖出來了? 其實主要的目的是導正一些不正常的現象, 相信大家都不希望找到一堆垃圾, 我每天都需要找資料研究, 如果找到的資料都不是需要的, 浪費的時間是很可觀的, 本身就會變成受害者

除此之外, 還有更重要的原因 ... 一個真正的原因 ...

各Search engine持續的在修正演算法, 現在的SEO理論當然過一陣子就會失效, 因此目前把一些SEO不能說的秘密說出來, 並不會影響正派經營SEO或持續研究探討SEO的業者, 而且讓更多人瞭解SEO, 還能讓大家重視SEO, 因此披露SEO的正確知識, 一來可以讓search engine抓到該抓的資料, 二來還可以擴大SEO業者的大餅

所以並沒有抖出別人吃飯傢伙的問題

前面文章一直在談 -- 內容與結構, 如果大家都能稟承"誠實是SEO最佳策略", 針對內容與結構好好審視的話, 那結果對所有網路使用者都是好事一樁

因此不要再把SEO當成很神秘的話題, 讓SEO成為一個研究網站正確的結構提升網站品質的一個議題, 將是網路發展的一個正確方向

也許某一天本站PR/SERP會變很差, 也許這些文章都沒人看, 反正已經在網路上盡力貢獻一己之力了, 結果就讓他自然產生了, Honesty is the best policy ... 共勉之

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SERP v.s. PageRank : PR值與搜尋排前的關係

許多搞SEO (Search Engine Optimization) 的人一定都有一個困惑:為什麼許多搜尋結果, 反而PR值低的會排在前面?

在前文"SERP : Search Engine Results Page"已經提到, PR值與SERP不一定成正比, 也許您會問 : 那花那麼多功夫把PR值提高, 不是白費功夫了嗎? 有那麼多的backlink不也是如夢一場了嗎?

大家真的都被Google耍弄了嗎? 事實真像如何呢? 繼續往下看就能解開您的疑惑了 ...

首先解釋一下, 我們由前文"Pagerank 演算法研究"知道, PR值完全看有多少網頁投票給您, 這些投票給您的網頁其本身的質量與該頁的連結數目決定了您的PR值, 這個值跟keyword無關 (真的無關嗎?我們後續會來研究)

而SERP主要由哪些因素決定呢?

(1)keyword在您頁面的密度相關性
(2)您頁面被Google index的時間
(3)PR值

在說明以上因素之前, 我先用近日文章的SERP來說明:

"WREL : Wireless Resonant Energy Link 未來的無線電力傳輸"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Wireless Resonant Energy Link"為keyword, SERP=第一頁位置5, 中文SERP=第一頁位置1

"DPR : Dynamic Physical Rendering 未來的變形金剛"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Dynamic Physical Rendering"為keyword, SERP=第一頁位置7, 中文SERP=第一頁位置1

"PageRank, BrowseRank, AlexaRank"
2008.08.26刊登, 於2008.08.26被Google index
在Google search以"BrowseRank"為keyword, SERP=第一頁位置2, 中文SERP=第一頁位置1

"使用手機或PDA離線瀏覽Google Map"
2008.08.12刊登, 於2008.08.12被Google index
在Google search以"mgmaps"為keyword, SERP=第一頁位置4, 中文SERP=第一頁位置2

(以上資料可能會因時間等因素而顯示不同結果)

由以上例子看, 為什麼這麼新的網頁能夠有優秀的SERP? 因為該文就是以keyword為title或tag, 談的內容就是keyword完全相關的

在以上提的SERP三個主要決定因素中, (1)是最重要的, 其次是(2), 最後是(3)

除此之外, 據觀察結果, 還可能與TrustRank有關係, 不過這點尚無法詳細證明, 但根據一份PageRank/SERP統計資料顯示結論: SERP與PR有關, 但隨著時間PR會逐漸減少對SERP的影響

因此如果您看到某些頁面的PR比較低, 但SERP比您的頁面好, 原因就是: keyword比較有關連或被index的時間比您早

Google處理SERP的方式, 以上面的觀察來看, 其實是很符合使用者需求的, 因為網路上不斷出現新的優秀內容, 如果光是以PR順序來顯示資料, 也許根本找不到要的資料, 況且目前一堆黑帽SEO, 不符合網頁的PR值也很多, 因此Google把PR的影響遞減, 其方向大致沒什麼問題

另外由以上的觀察, 也覺得台灣在新科技相關的研究內容實在少得可憐, 提到DPR(Dynamic Physical Rendering)的中文內容竟然屈指可數, 不過就因為如此, 只要您能夠在內容與結構上好好耕耘 (如本站一系列的SEO探討文章所說的), 您的高品質內容也會有出頭的一天, 其他亂七八糟的黑帽SEO就忘了他吧 ...

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月27日星期三

SERP : 搜尋排前對消費者的影響

不管公司的大小, 許多產品都希望能夠讓消費者於網路搜尋時可以排列在最前面, 到底搜尋排前對消費者的影響是如何呢? 3位武漢大學的學者在2007年WiCom研討會上有一篇論文: "Does It Pay to Get to the Top? Contextual Factors of Branding in Search Engine Marketing", 做了一個SERP的研究 ...

他們把使用者分成兩大類, 一部分是具備搜尋技能的人, 一部分是不具備搜尋技能的人, 進行四項實驗, 然後去評估他們對產品的認知

這個研究得到幾個結論:

(1)具備搜尋技能的人較不易被SERP結果影響, 但不具備搜尋技能的人易被SERP結果影響對產品的認知

(2)當他們瞭解許多產品有進行SEO(Search Engine Optimization)來影響SERP時, 沒有顯著影響他們原有的產品認知

(3)不知名產品在搜尋排前時, 產品認知的影響比知名產品來得顯著

以上結果代表什麼意義呢? 就是沒有名氣的產品如果能夠搜尋排前是非常重要的, 可以快速建立產品的Branding, 相對的知名產品就沒必要花太大心力在SERP上, 並且對於廣大的不具備搜尋技能的人影響較大, 就算他們知道SERP可能是被操作的, 也不太會對於搜尋排前產生太大疑問

所以如果您的產品越沒有名氣, 把精力放在SEO來改善SERP, 是決對能夠逐步建立品牌的一個快速方式, 並且能夠獲得消費者對於您的產品的正面認知!

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月26日星期二

SERP : Search Engine Results Page

前幾篇文章談了一堆關於Ranking的技術, 最後也就是最重要的就是SERP (Search Engine Results Page), 不管您的PageRank, TrustRank ... 等等指標多好, 如果使用者在搜尋時無法出現在前幾頁, 也就是有較好的SERP的話, 所有的指標都只是白費功夫, 空有好的內容, 但搜尋引擎並不認識你, 可說是非常可惜的事情, 如何才能夠讓您的網頁有優秀的SERP表現呢?

SERP與keyword及網頁結構關係最密切, 而高的PageRank不能保證有好的SERP, 高的流量也不能保證有好的SERP, 如果能夠有好的內容再加上優秀的SERP, 那才是網站成功的保證

當使用者下了一個keyword, 哪些重要因素影響SERP的結果呢?

(1)網頁title

例如本文章的重點在談SERP, 而title就是"SERP : Search Engine Results Page"
如果您的內容無法表現在title tag上, 當然SERP就無法有好的表現, 這也就是上次談到: SEO 三大建議, 希望能夠使用blog結構的原因, 因為可以不需額外功夫就讓內容的title顯示出來

(2)網頁meta data

meta data中的keyword, 與內容中的heading處理, 也可以讓search engine特別注意, 這個在上文Semantic HTML也提到過, 使用正確的tag, 可以讓search engine瞭解您的內容

(3)網址與目錄

如果您的網址或目錄中含有keyword, 如http://www.serp.com/serp-pagerank/serp.html, 如此也可以讓您針對SERP這個keyword有較好的結果, 並且就網址後綴來說, 一般org/net/com 也比ccTLD (Country Code Top Level Domain, 如org.tw/net.tw/com.tw)要好

(4)網頁內容

當然在您文章的內容一定要出現該keyword, 並且真的就是關於該keyword的文章, 否則使用者找到您的網頁也就沒啥意思了

(5)Refresh rate

什麼是Refresh rate? 就是您網站的更新頻繁度, 如果您的網站內容時常更新, 除了能夠讓search engine加快抓取頻率外, 也能夠讓SERP有更好的結果

也許有人會問:到底search engine會多久來抓我的資料? 除了使用http://www.google.com/webmasters/可以讓您上傳sitemap來告知之外, search engine也會自動根據您更新頻繁度來修正抓資料的頻率, 也就是如果每次search engine來抓資料都發現您已經更新, 他會修正縮短抓資料的區間, 如果來抓資料時發現您的網站沒有更新, 則放慢抓資料的區間

因此當您的網頁如果已經被indexing後, 並且您的網站屬於Trust那個區塊, 其實search engine抓資料的頻率有很大因素決定在您手上

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

TrustRank, PageRank, SERP

許多站長常常問一個問題 : 為何我的網頁已經建置很久了, 但一直沒被Google index? 另外一個問題也常常被問到 : 為何許多PageRank值比我低的網頁, 搜尋時出現在我的網頁前面?

第一個問題的答案是 : TrustRank, 而第二個問題的答案是 : SERP (Search Engine Result Page)與PageRank不一定成正比

本部落格的網頁最快約10~30分鐘就會被Google抓走, 最慢也在一天內就被Google抓走, 原因是TrustRank

什麼是TrustRank? 詳細資料請看 : Combating Web Spam with TrustRank

由於全球的網頁數目太龐大, 因此Google的Sandbox, TrustBox技術會將網頁區分為兩大區塊-被排除的區塊(Sandbox)與信任的區塊(TrustBox)

哪些網站會被信任? 被Dmoz list的網站, 被Social bookmark熱門推薦的網站, 被TrustRank/PageRank高的網站所連結的網站 ... 這篇文章也提到一些成為TrustBox區塊的方式

另兩篇文章 : What is Google TrustRank (TR)?, The Social Side Of Trustrank 也提出許多提高TrustRank的方式, 本站之前的文章也都提到過

當TrustRank較好時才會快速被抓取, 被抓取後才可能有好的SERP, SERP就與網頁結構有很大的關係, 但是真正決定SERP的因素, 現在還是只能由結果來猜測, 尚無真正能夠證明哪些因素來決定SERP (SERP的研究倒是不錯的研究題目)

不過不管如何, 研究了一堆PageRank, TrustRank, SERP ... 之後, 其實最重要的還是老話一句 - 內容與結構! 就把一些指標暫時放一邊, 好好研究如何產生好的內容與正確使用Semantic HTML比較實在吧!

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

PageRank, BrowseRank, AlexaRank

在八月初的SIGIR (Special Interest Group on Information Retrieval)研討會上, 出現了BrowseRank: Letting Web Users Vote for Page Importance

這個微軟研究中心的BrowseRank演算法, 大抵是想跟Google的PageRank一別苗頭, 到底這個BrowseRank是否能夠比PageRank來得好呢? 我們來研究一下

大略瀏覽了上述的論文, 發現BrowseRank只是Page-level的AlexaRank, 他的data set來自於瀏覽軟體的使用者資料, AlexaRank由Alexa toolbar所得到的資料來分析, 而BrowseRank由微軟的IE所得到的資料來分析

AlexaRank只是Domain-level ranking, BrowseRank比較仔細一些, 進到Page-level Ranking, Website-level Ranking, 而PageRank是透過link-analysis來取得頁面的重要度

論文題目說: Letting Web Users Vote for Page Importance, 其實是值得商確的, 網友到訪了一個網頁, 未必就認為該頁是重要的, 可能看完後幹聲連連 ...

因此我們可以粗略的說AlexaRank標示了網域的熱門度, BrowseRank標示了網頁/網站的熱門度, PageRank標示了網頁的重要度

到底哪個比較精準, 就牽涉到幾個問題:

(1)比較熱門的網站是否就比較重要?
(2)link數目多就代表比較重要?
(3)不同階層的使用者, 熱門度如何參考?
(4)廣度網站與深度網站, 熱門度如何參考?

當然上面問題沒有正確答案, 學術研究的網站一般不能跟入口網站比熱門度(AlexaRank與BrowseRank), 而新興網站一般不能與歷史悠久的網站比重要度(PageRank), 但是也可能會有例外 (而且例外還不少)

所以也很難去比較AlexaRank,PageRank,BrowseRank到底哪個好, 後續有更多資料再來分享啦...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月25日星期一

Pagerank 演算法研究

Larry Page在1996年間發明了Pagerank的演算法, 爾後又與Sergey Brin在Stanford發表了"The Anatomy of a Large-Scale Hypertextual Web Search Engine", 這個Web Search Engine就是現在使用的Google, Pagerank詳細內容到1998年才發表, 並且直到2001年才取得專利

Page Rank公式如下



(以上公式圖形由http://www.sitmo.com/latex/產生)

以上d指damping factor, 其值在0~1, 一般設為0.85
PR(Vi)為Vi這個頁面的PR值
In(Vi)為連進Vi這個頁面的link數目
Out(Vj)為Vj這個頁面連出去的link數目

也就是說如果有3個頁面A,B,C

A如果連到B,C
B如果連到C

如果A的PR=4
則PR(B)=(1-0.85) + 0.85 * 4/2 = 1.85

而PR(C)=(1-0.85) + 0.85 * (4/2 + 1.85) = 3.4225

B,C會平均繼承A的PR值, 但C會單獨繼承B的PR值

Pagerank是一種link-analysis algorithm, 是根據citation analysis而來, 原本使用在學術期刊論文被引用次數的技術

在Pagerank之後, 1999年Kleinberg發表了HITS algorithm(Hyperlink-Induced Topic Search), HITS決定兩個值: authority value & hub value, 並且是在query time計算, 而不是像Pagerank是在indexing time計算, Teoma就是使用HITS (目前被Ask.com收購)

相對於link-analysis algorithm的content-analysis algorithm, 於另外文章再討論

不管是Pagerank或是HITS, 都是iterative ranking algorithm, 非常耗費演算時間及資源, 因此許多研究者提出了不同的方式來加速計算時間:

1999年 Efficient Computation of PageRank(Haveliwala and et al.)

2002年 Pagerank Computation and the Structure of the Web:Experiments and Algorithms(Arasu and et al.)

2002年 I/O Efficient Techniques for Computing PageRank(Chen and et al.)

2003年 Scaling Personalized Web Search(Jeh and et al.)

2003年 Exploiting the Block Structure of the Web for Computing PageRank (Kamvar and et al.)

2003年 Extrapolation Methods for Accelerating PageRank Computations (Kamvar and et al.)

2004年 Parallel PageRank computation on a gigabit PC cluster (Manaskasemsak and et al.)

2006年 Parallel adaptive technique for computing PageRank (Rungsawang and et al.)

2007年 Improvement of Pagerank for Focused Crawler (Yuan and et al.)

但是不管怎麼加速演算法, 其iterative ranking algorithm的特性不會改變, 但可能會加入content-analysis algorithm的一些特性來走向semantic web

而Pagerank公式內的Out(Vj), 使得一些做SEO的人注意到HTML中的nofollow特性, 來進行一些link quality的改善

深入探討:
PageRank Algorithm : 別說你懂PR演算法

相關訊息:
什麼是PageRank Hijack?
善用PageRank指標提升企業競爭力
Google Analytics & PageRank
SERP vs PageRank : PR值與搜尋排前的關係

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月20日星期三

網路行銷/網路營銷 : SEO 三大建議

在許多網站上可以看到諸如: "如何快速提升Pagerank", "Pagerank 7的快速捷徑" ...等等的文章或影片, 但是仔細去看這些網站的Pagerank竟然都是低於3或甚至降到0, 他們教您購買軟體, 他們教您快速增加backlink, 他們教您如何以短短幾分鐘的作業去提升PR值, 但是經事實證明, 不但無法達成目的, 還可能造成反效果, 在本篇文章中, 我們很誠實的告訴您真正被Google認可的方式 ...


在前幾篇文章已經提出許多觀念, 您可以去回顧一下:

Internet大破譯(五): 看不見的網路行銷戰場
善用PageRank指標提升企業競爭力
搜尋引擎的運作背後
網路行銷 : SEO 五大要素
網路行銷 : SEO 十大守則
網路行銷/網路營銷 -- 內容為王

除了以上一些觀點之外, 我們再提供三項實務的建議, 當然這些不管是五大要素, 十大守則, 或是三大建議, 最後回歸的都是 Content (內容), 沒有價值的內容創造不出有價值的網站

但是有價值的網站需要讓search engine瞭解, 並讓讀者可以搜尋到您的內容, 這也是所有搜尋引擎希望所有webmaster能夠協助的地方: 在search engine還不夠智慧的情況下, 讓search eninge能夠真正反應讀者想要尋找的內容

哪三項實務的建議呢?

(1)建立部落格

以目前的網頁結構來說, blog是最適合search engine抓資料的, 因為tag/category/publish date等等要素, 讓文章與文章之間會自然產生關聯, 這些關聯會讓片段的文章形成一串互相有關的內容, 這些關聯可以讓search engine知道如何index這些片段, 也可以讓讀者去一層層找到需要的資料, 因此如果您的網站沒有blog的結構, 應該盡快構思如果組織您的內容去建立有價值的blog

(2)善用網路社交工具

什麼是網路社交工具? network bookmark (網路書籤)就是一個例子, 建立部落格後僅是在您的內容上建立關聯, 而使用網路書籤可以讓blog間串聯起來, 並且讓更多人來看到您的內容, 並且網路書籤的tag可以將這些關係標準化, search engine可以很輕易的index相關內容

(3)使用Semantic HTML

什麼是Semantic HTML? 根據wikipedia的Semantic HTML解釋, Semantic HTML不是一般webmaster能夠瞭解的, 但是有另外一篇比較淺顯的說明您可以參考: Writing Semantic HTML

Semantic HTML的目的就是讓您的內容可以清楚呈現給search engine, 因為search engine並不瞭解您的內容, 但是透過HTML tag, 他可以知道這段文字是屬於哪個類別

總而言之, 其實以上三大建議, 是希望您的網站在結構關聯上, 能夠替search engine做更清楚的描述, 如此一來search engine瞭解您的網站, 也同時讓讀者知道搜尋到的是否是需要的內容

真正的Search Engine Optimization (SEO)是在協助search engine, 而不是在欺騙search engine


許多人都說做SEO要偷偷做, 不要讓search engine知道您的作法, 其實只要是正確的SEO作業, search engine反而是鼓勵的, 因為您可以改善他們的搜尋效能

在內容上提升, 在結構與關聯上修正, 才是真正在進行SEO, 請大家光明正大的進行, 如此一來才可以讓讀者找到需要的資料而不是一堆不相干的垃圾

標籤: , , , , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月19日星期二

SEO : 搜尋引擎無法索引Flash檔案?


以往大家都認為盡量不要使用Flash, 因為Flash檔案文字內容無法被搜尋引擎抓取, 但是這種情況已經會逐漸改善, 根據Adobe的SWF說明資料, Adobe已經陸續提供技術給搜尋業者, 以防止Flash會被網站開發者排除使用...

雖然如此, 但是目前使用的搜尋引擎只有Google, 並且目前讀取SWF資料的技術尚未純熟, 因此還是盡量不要整頁使用Flash, 並且需依照Google對於Flash/Image的Guideline:

(1)Googlebot does not execute some types of JavaScript. If your webpage uses JavaScript to load a Flash file, we may not be able to discover and index the contents of that file.

不要使用Javascript去載入Flash
如果使用Javascript載入Flash, 這個Flash就無法順利被index

(2)We currently do not attach content from external resources that are loaded by your Flash files. If your Flash file loads another file - such as an HTML file, an XML file, or another SWF file - we may index the contents of those files, but we won't consider that content to be part of the content in your Flash files.

不要使用Flash去載入另外檔案
如果使用Flash載入其他檔案, 這個被載入的檔案就無法順利被index

(3)We're currently unable to index the bidirectional language content (for example, Hebrew or Arabic) in Flash files.

第三點跟我們比較無關

除此之外, Yahoo只是承諾使用Adobe提供的技術, 並未正式使用, 而Microsft Live Search等也尚未有任何相關訊息

雖然Flash檔案會逐步被搜尋引擎接受, 但在使用上還是要注意許多細節, 提供Flash與Non-Flash版本, 才能夠讓您的網站美觀之外, 還能夠俱備搜尋引擎的可讀性

後續可能發展, 將密切觀察後再跟各位報導啦 ...

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院