2008年8月27日 星期三

SERP : 搜尋排前對消費者的影響

不管公司的大小, 許多產品都希望能夠讓消費者於網路搜尋時可以排列在最前面, 到底搜尋排前對消費者的影響是如何呢? 3位武漢大學的學者在2007年WiCom研討會上有一篇論文: "Does It Pay to Get to the Top? Contextual Factors of Branding in Search Engine Marketing", 做了一個SERP的研究 ...

他們把使用者分成兩大類, 一部分是具備搜尋技能的人, 一部分是不具備搜尋技能的人, 進行四項實驗, 然後去評估他們對產品的認知

這個研究得到幾個結論:

(1)具備搜尋技能的人較不易被SERP結果影響, 但不具備搜尋技能的人易被SERP結果影響對產品的認知

(2)當他們瞭解許多產品有進行SEO(Search Engine Optimization)來影響SERP時, 沒有顯著影響他們原有的產品認知

(3)不知名產品在搜尋排前時, 產品認知的影響比知名產品來得顯著

以上結果代表什麼意義呢? 就是沒有名氣的產品如果能夠搜尋排前是非常重要的, 可以快速建立產品的Branding, 相對的知名產品就沒必要花太大心力在SERP上, 並且對於廣大的不具備搜尋技能的人影響較大, 就算他們知道SERP可能是被操作的, 也不太會對於搜尋排前產生太大疑問

所以如果您的產品越沒有名氣, 把精力放在SEO來改善SERP, 是決對能夠逐步建立品牌的一個快速方式, 並且能夠獲得消費者對於您的產品的正面認知!

標籤: , , , , , , , ,

繼續閱讀

2008年8月26日 星期二

SERP : Search Engine Results Page

前幾篇文章談了一堆關於Ranking的技術, 最後也就是最重要的就是SERP (Search Engine Results Page), 不管您的PageRank, TrustRank ... 等等指標多好, 如果使用者在搜尋時無法出現在前幾頁, 也就是有較好的SERP的話, 所有的指標都只是白費功夫, 空有好的內容, 但搜尋引擎並不認識你, 可說是非常可惜的事情, 如何才能夠讓您的網頁有優秀的SERP表現呢?

SERP與keyword及網頁結構關係最密切, 而高的PageRank不能保證有好的SERP, 高的流量也不能保證有好的SERP, 如果能夠有好的內容再加上優秀的SERP, 那才是網站成功的保證

當使用者下了一個keyword, 哪些重要因素影響SERP的結果呢?

(1)網頁title

例如本文章的重點在談SERP, 而title就是"SERP : Search Engine Results Page"
如果您的內容無法表現在title tag上, 當然SERP就無法有好的表現, 這也就是上次談到: SEO 三大建議, 希望能夠使用blog結構的原因, 因為可以不需額外功夫就讓內容的title顯示出來

(2)網頁meta data

meta data中的keyword, 與內容中的heading處理, 也可以讓search engine特別注意, 這個在上文Semantic HTML也提到過, 使用正確的tag, 可以讓search engine瞭解您的內容

(3)網址與目錄

如果您的網址或目錄中含有keyword, 如http://www.serp.com/serp-pagerank/serp.html, 如此也可以讓您針對SERP這個keyword有較好的結果, 並且就網址後綴來說, 一般org/net/com 也比ccTLD (Country Code Top Level Domain, 如org.tw/net.tw/com.tw)要好

(4)網頁內容

當然在您文章的內容一定要出現該keyword, 並且真的就是關於該keyword的文章, 否則使用者找到您的網頁也就沒啥意思了

(5)Refresh rate

什麼是Refresh rate? 就是您網站的更新頻繁度, 如果您的網站內容時常更新, 除了能夠讓search engine加快抓取頻率外, 也能夠讓SERP有更好的結果

也許有人會問:到底search engine會多久來抓我的資料? 除了使用http://www.google.com/webmasters/可以讓您上傳sitemap來告知之外, search engine也會自動根據您更新頻繁度來修正抓資料的頻率, 也就是如果每次search engine來抓資料都發現您已經更新, 他會修正縮短抓資料的區間, 如果來抓資料時發現您的網站沒有更新, 則放慢抓資料的區間

因此當您的網頁如果已經被indexing後, 並且您的網站屬於Trust那個區塊, 其實search engine抓資料的頻率有很大因素決定在您手上

標籤: , , , , , , , ,

繼續閱讀

TrustRank, PageRank, SERP

許多站長常常問一個問題 : 為何我的網頁已經建置很久了, 但一直沒被Google index? 另外一個問題也常常被問到 : 為何許多PageRank值比我低的網頁, 搜尋時出現在我的網頁前面?

第一個問題的答案是 : TrustRank, 而第二個問題的答案是 : SERP (Search Engine Result Page)與PageRank不一定成正比

本部落格的網頁最快約10~30分鐘就會被Google抓走, 最慢也在一天內就被Google抓走, 原因是TrustRank

什麼是TrustRank? 詳細資料請看 : Combating Web Spam with TrustRank

由於全球的網頁數目太龐大, 因此Google的Sandbox, TrustBox技術會將網頁區分為兩大區塊-被排除的區塊(Sandbox)與信任的區塊(TrustBox)

哪些網站會被信任? 被Dmoz list的網站, 被Social bookmark熱門推薦的網站, 被TrustRank/PageRank高的網站所連結的網站 ... 這篇文章也提到一些成為TrustBox區塊的方式

另兩篇文章 : What is Google TrustRank (TR)?, The Social Side Of Trustrank 也提出許多提高TrustRank的方式, 本站之前的文章也都提到過

當TrustRank較好時才會快速被抓取, 被抓取後才可能有好的SERP, SERP就與網頁結構有很大的關係, 但是真正決定SERP的因素, 現在還是只能由結果來猜測, 尚無真正能夠證明哪些因素來決定SERP (SERP的研究倒是不錯的研究題目)

不過不管如何, 研究了一堆PageRank, TrustRank, SERP ... 之後, 其實最重要的還是老話一句 - 內容與結構! 就把一些指標暫時放一邊, 好好研究如何產生好的內容與正確使用Semantic HTML比較實在吧!

標籤: , , , , , , ,

繼續閱讀

PageRank, BrowseRank, AlexaRank

在八月初的SIGIR (Special Interest Group on Information Retrieval)研討會上, 出現了BrowseRank: Letting Web Users Vote for Page Importance

這個微軟研究中心的BrowseRank演算法, 大抵是想跟Google的PageRank一別苗頭, 到底這個BrowseRank是否能夠比PageRank來得好呢? 我們來研究一下

大略瀏覽了上述的論文, 發現BrowseRank只是Page-level的AlexaRank, 他的data set來自於瀏覽軟體的使用者資料, AlexaRank由Alexa toolbar所得到的資料來分析, 而BrowseRank由微軟的IE所得到的資料來分析

AlexaRank只是Domain-level ranking, BrowseRank比較仔細一些, 進到Page-level Ranking, Website-level Ranking, 而PageRank是透過link-analysis來取得頁面的重要度

論文題目說: Letting Web Users Vote for Page Importance, 其實是值得商確的, 網友到訪了一個網頁, 未必就認為該頁是重要的, 可能看完後幹聲連連 ...

因此我們可以粗略的說AlexaRank標示了網域的熱門度, BrowseRank標示了網頁/網站的熱門度, PageRank標示了網頁的重要度

到底哪個比較精準, 就牽涉到幾個問題:

(1)比較熱門的網站是否就比較重要?
(2)link數目多就代表比較重要?
(3)不同階層的使用者, 熱門度如何參考?
(4)廣度網站與深度網站, 熱門度如何參考?

當然上面問題沒有正確答案, 學術研究的網站一般不能跟入口網站比熱門度(AlexaRank與BrowseRank), 而新興網站一般不能與歷史悠久的網站比重要度(PageRank), 但是也可能會有例外 (而且例外還不少)

所以也很難去比較AlexaRank,PageRank,BrowseRank到底哪個好, 後續有更多資料再來分享啦...

標籤: , , , , , , , ,

繼續閱讀

2008年8月25日 星期一

Pagerank 演算法研究

Larry Page在1996年間發明了Pagerank的演算法, 爾後又與Sergey Brin在Stanford發表了"The Anatomy of a Large-Scale Hypertextual Web Search Engine", 這個Web Search Engine就是現在使用的Google, Pagerank詳細內容到1998年才發表, 並且直到2001年才取得專利

Page Rank公式如下



(以上公式圖形由http://www.sitmo.com/latex/產生)

以上d指damping factor, 其值在0~1, 一般設為0.85
PR(Vi)為Vi這個頁面的PR值
In(Vi)為連進Vi這個頁面的link數目
Out(Vj)為Vj這個頁面連出去的link數目

也就是說如果有3個頁面A,B,C

A如果連到B,C
B如果連到C

如果A的PR=4
則PR(B)=(1-0.85) + 0.85 * 4/2 = 1.85

而PR(C)=(1-0.85) + 0.85 * (4/2 + 1.85) = 3.4225

B,C會平均繼承A的PR值, 但C會單獨繼承B的PR值

Pagerank是一種link-analysis algorithm, 是根據citation analysis而來, 原本使用在學術期刊論文被引用次數的技術

在Pagerank之後, 1999年Kleinberg發表了HITS algorithm(Hyperlink-Induced Topic Search), HITS決定兩個值: authority value & hub value, 並且是在query time計算, 而不是像Pagerank是在indexing time計算, Teoma就是使用HITS (目前被Ask.com收購)

相對於link-analysis algorithm的content-analysis algorithm, 於另外文章再討論

不管是Pagerank或是HITS, 都是iterative ranking algorithm, 非常耗費演算時間及資源, 因此許多研究者提出了不同的方式來加速計算時間:

1999年 Efficient Computation of PageRank(Haveliwala and et al.)

2002年 Pagerank Computation and the Structure of the Web:Experiments and Algorithms(Arasu and et al.)

2002年 I/O Efficient Techniques for Computing PageRank(Chen and et al.)

2003年 Scaling Personalized Web Search(Jeh and et al.)

2003年 Exploiting the Block Structure of the Web for Computing PageRank (Kamvar and et al.)

2003年 Extrapolation Methods for Accelerating PageRank Computations (Kamvar and et al.)

2004年 Parallel PageRank computation on a gigabit PC cluster (Manaskasemsak and et al.)

2006年 Parallel adaptive technique for computing PageRank (Rungsawang and et al.)

2007年 Improvement of Pagerank for Focused Crawler (Yuan and et al.)

但是不管怎麼加速演算法, 其iterative ranking algorithm的特性不會改變, 但可能會加入content-analysis algorithm的一些特性來走向semantic web

而Pagerank公式內的Out(Vj), 使得一些做SEO的人注意到HTML中的nofollow特性, 來進行一些link quality的改善

標籤: , , , , ,

繼續閱讀

2008年8月20日 星期三

網路行銷/網路營銷 : SEO 三大建議

在許多網站上可以看到諸如: "如何快速提升Pagerank", "Pagerank 7的快速捷徑" ...等等的文章或影片, 但是仔細去看這些網站的Pagerank竟然都是低於3或甚至降到0, 他們教您購買軟體, 他們教您快速增加backlink, 他們教您如何以短短幾分鐘的作業去提升PR值, 但是經事實證明, 不但無法達成目的, 還可能造成反效果, 在本篇文章中, 我們很誠實的告訴您真正被Google認可的方式 ...


在前幾篇文章已經提出許多觀念, 您可以去回顧一下:

Internet大破譯(五): 看不見的網路行銷戰場
善用PageRank指標提升企業競爭力
搜尋引擎的運作背後
網路行銷 : SEO 五大要素
網路行銷 : SEO 十大守則
網路行銷/網路營銷 -- 內容為王

除了以上一些觀點之外, 我們再提供三項實務的建議, 當然這些不管是五大要素, 十大守則, 或是三大建議, 最後回歸的都是 Content (內容), 沒有價值的內容創造不出有價值的網站

但是有價值的網站需要讓search engine瞭解, 並讓讀者可以搜尋到您的內容, 這也是所有搜尋引擎希望所有webmaster能夠協助的地方: 在search engine還不夠智慧的情況下, 讓search eninge能夠真正反應讀者想要尋找的內容

哪三項實務的建議呢?

(1)建立部落格

以目前的網頁結構來說, blog是最適合search engine抓資料的, 因為tag/category/publish date等等要素, 讓文章與文章之間會自然產生關聯, 這些關聯會讓片段的文章形成一串互相有關的內容, 這些關聯可以讓search engine知道如何index這些片段, 也可以讓讀者去一層層找到需要的資料, 因此如果您的網站沒有blog的結構, 應該盡快構思如果組織您的內容去建立有價值的blog

(2)善用網路社交工具

什麼是網路社交工具? network bookmark (網路書籤)就是一個例子, 建立部落格後僅是在您的內容上建立關聯, 而使用網路書籤可以讓blog間串聯起來, 並且讓更多人來看到您的內容, 並且網路書籤的tag可以將這些關係標準化, search engine可以很輕易的index相關內容

(3)使用Semantic HTML

什麼是Semantic HTML? 根據wikipedia的Semantic HTML解釋, Semantic HTML不是一般webmaster能夠瞭解的, 但是有另外一篇比較淺顯的說明您可以參考: Writing Semantic HTML

Semantic HTML的目的就是讓您的內容可以清楚呈現給search engine, 因為search engine並不瞭解您的內容, 但是透過HTML tag, 他可以知道這段文字是屬於哪個類別

總而言之, 其實以上三大建議, 是希望您的網站在結構關聯上, 能夠替search engine做更清楚的描述, 如此一來search engine瞭解您的網站, 也同時讓讀者知道搜尋到的是否是需要的內容

真正的Search Engine Optimization (SEO)是在協助search engine, 而不是在欺騙search engine


許多人都說做SEO要偷偷做, 不要讓search engine知道您的作法, 其實只要是正確的SEO作業, search engine反而是鼓勵的, 因為您可以改善他們的搜尋效能

在內容上提升, 在結構與關聯上修正, 才是真正在進行SEO, 請大家光明正大的進行, 如此一來才可以讓讀者找到需要的資料而不是一堆不相干的垃圾

標籤: , , , , , , , , , , , ,

繼續閱讀

2008年8月19日 星期二

SEO : 搜尋引擎無法索引Flash檔案?


以往大家都認為盡量不要使用Flash, 因為Flash檔案文字內容無法被搜尋引擎抓取, 但是這種情況已經會逐漸改善, 根據Adobe的SWF說明資料, Adobe已經陸續提供技術給搜尋業者, 以防止Flash會被網站開發者排除使用...

雖然如此, 但是目前使用的搜尋引擎只有Google, 並且目前讀取SWF資料的技術尚未純熟, 因此還是盡量不要整頁使用Flash, 並且需依照Google對於Flash/Image的Guideline:

(1)Googlebot does not execute some types of JavaScript. If your webpage uses JavaScript to load a Flash file, we may not be able to discover and index the contents of that file.

不要使用Javascript去載入Flash
如果使用Javascript載入Flash, 這個Flash就無法順利被index

(2)We currently do not attach content from external resources that are loaded by your Flash files. If your Flash file loads another file - such as an HTML file, an XML file, or another SWF file - we may index the contents of those files, but we won't consider that content to be part of the content in your Flash files.

不要使用Flash去載入另外檔案
如果使用Flash載入其他檔案, 這個被載入的檔案就無法順利被index

(3)We're currently unable to index the bidirectional language content (for example, Hebrew or Arabic) in Flash files.

第三點跟我們比較無關

除此之外, Yahoo只是承諾使用Adobe提供的技術, 並未正式使用, 而Microsft Live Search等也尚未有任何相關訊息

雖然Flash檔案會逐步被搜尋引擎接受, 但在使用上還是要注意許多細節, 提供Flash與Non-Flash版本, 才能夠讓您的網站美觀之外, 還能夠俱備搜尋引擎的可讀性

後續可能發展, 將密切觀察後再跟各位報導啦 ...

標籤: , , , , ,

繼續閱讀

2008年8月1日 星期五

網路行銷/網路營銷 -- 內容為王

數位網路社群已經走過近十年的時間, 距離上次改版也已經六年的時間, 但到今年四月才驚覺沒有獨立建立部落格架構已經無法符合市場需求

當初在2008.04剛建立部落格時, 當然PageRank=0, 並且完全沒有讀者, 但是到2008.07底, PageRank已經由0翻到4, 雖然部落格流量仍然未見起色, 但靠著文章被引用次數的增加, 已經逐漸被網友知道 ... 喔, 原來數位網路社群還有blog啊!

到底如何在3個月的時間, PageRank由0到4呢? 以下是一些觀念 ...

其實標題已經很清楚的告訴您了 -- 內容為王

您還在使用一些黑帽式的軟體或技巧, 增加您的backlink嗎? 這些方式能讓您的SERP從30幾頁上升到前3頁嗎? 這些方式能讓您的PR在3個月內由0到4嗎?

當然答案應該很清楚!

那應該如何做呢? 只需遵照SEO五大要素, SEO十大守則, 好好規劃您的SEO策略與內容耕耘, 保證能夠有好的成果

也許您會問: 那沒有啥內容怎麼辦?

如果您是搞藝術, 但偏要弄個科技網站, 那就Sorry啦, 當然不能產出好成果 (除非外包找代筆), 因此弄個您真正專長的方向, 並一步一腳印的去驗證上述的SEO五大要素/SEO十大守則, 必定可以馬到成功

也許您又會問: SEO五大要素/SEO十大守則太大方向了, 有沒有Step-by-Step的做法?

SEO不是1+1=2的問題, 因此實在很難寫出Step-by-Step, 光是一個要素可能可以寫一本書, 實在沒辦法詳細告訴您 ... 除非等筆者享受退休生活的時候吧!?

不管如何, 要提供經驗給各位的是: 不要再相信不重視內容的SEO方式, 沒有好的內容...神仙都沒辦法

也許您又會問: 那有不錯的SERP或PR能幹啥?

答案是如果您的網站不是營利型網站, SERP或PR實在沒啥意義, 但是如果您的網站是營利型網站, 就能夠快速的讓網友找到您的站台, 增加交易的機會

並且如果您有幾個SERP/PR不錯的站台, 就可以很輕易的繼續拉抬您其他的新網站邁向成功之路

因此持有優良的SERP/PR的站台或與該類站台保持良好互動, 是非常重要的事情啦

標籤: , , , , , , , ,

繼續閱讀

2008年7月30日 星期三

網路行銷 : SEO十大守則

SEO人人會變, 但各有巧妙不同, 有些手法可以讓您乍看來有效, 但時間一過卻比以前還慘, 有些手法根本無效, 卻口沫橫飛的說得讓您誤以為真, 提供SEO十大守則讓您建立正確的觀念, 以餉網友 ...


守則1: 不要為Rank而Rank
許多網站很熱衷於改善Rank, 但是卻忽略了...網站是給人看的, 不是給搜尋引擎看的, 遵守搜尋引擎的遊戲規則是很重要的, 如果search engine已經很明白告誡的作法, 就千萬不要以身試法, 除非您建立某些站台是用來測試search engine的algorithm, 因此切記...該進行的合法SEO動作以後, 一切就交給search engine啦,如果有SEO廠商告訴您, 讓您的網站在十天內PR值變成5 ... 忘了他吧, 肯定會讓您得不償失, 就好像唸書一樣, 得獎狀不能保證您能獲得高報酬的工作, Rank之外還有更重要的事情等著您 ...

守則2: Ranking只是一個過程,不是目的
Ranking只是一個指標, 更重要的是由這個指標去改善您的網站, 不是獲得好的Ranking就能高枕無憂, Ranking起起落落只是在提醒您是否忘記該進行哪些事項, 建立任何網站重要的是否達成您的目的 ... 有時候忘掉Ranking, 好好耕耘內容反而是比較健康的事情, 沒有一年半載的時間, 成果是看不出來的, 從事網路服務提供已經十餘年, 看到太多網站轟轟烈烈開站而草草了結, 沒耐心的人來搞網路行銷會讓您得憂鬱症的 ...

守則3: 瞭解您的對手
SEO的成果不是絕對的, 它是比較的結果, 十幾年前隨便搞個站, 幾天SERP (Search Engine Result Page)就明列前茅, 現在競爭者多了, 越來越困難, 但是您不是要跟Yahoo比, 您不是要跟YouTube比, 只需要鎖定您的對手, 就能清楚規劃出SEO的策略 ...

守則4: 讓搜尋引擎瞭解您的網頁
網站不是為Search engine而設立, 但是要讓它瞭解, 如此才能妥善的抓取您的內容來indexing, 瞭解最新的W3C規則, 健全您的網站結構, 清楚的sitemap, 都能讓您的SEO策略事半功倍...

守則5: 選擇適合的關鍵字
思考您的客戶可能使用哪些Keyword, 進而使用一些工具來分析來客傾向與導引, 是非常重要的, 對於關鍵字的focus不要一次太貪心, 剛開始選擇一兩個關鍵字, 效果出來了再慢慢增加關鍵字, 例如本站在近期才將"網路行銷"加入關鍵字策略, 並且相近簡體字"網路營銷"亦加入, 目前已經從Google SERP 30幾頁的位置, 提升到前三頁

守則6: 內容至上
沒有內容就一切免談, 胡說八道或到處亂抄只能暫時讓您的網站看似豐富, 但最後除了會被Search engine封殺之外, 也會被網友拋棄, 所以還是回歸最重要的原點 -- 內容, 好內容總有出頭的一天, 何況search engine掃瞄的速度之快, 一定可以讓您的網站浮出抬面的...

守則7: 使用正確的鏈結策略
一堆無用的backlink可能讓您的Ranking緩慢提升, 但高品質的backlink可以讓您的Ranking快速改善, 但是如何呢? 前面文章已經說太多次了, 就不再贅言

守則8: 撰寫正確而適合的Meta內容
除了網站正確的結構之外, meta內容是否真的符合您的網站也是很重要的, 您明明沒有賣相機, 但meta內容卻會讓網友透過"相機"找過來, 這些無效搜尋對Ranking的提升是毫無助益的, 只是浪費大家的時間

守則9: 與相關link站在一起
在一些Open Directory的適當類別可以找到您的網站, 在類似的網站能夠link到您的網站, 您自己網站的相關內容能夠link在一起 ... 都是search engine的最愛, 為啥有人說search engine喜歡blog的結構? 因為blog的特性 : 文字多/RSS/tag ... 這些都讓內容相近的文章可以互相串聯

守則10: 如果需要的話, 還是要向專家諮詢
SEO看似簡單, 大家都可以做, 但卻是非常技術性的工作 (也是很勞力的工作), 因此多多向專家諮詢以獲得量身訂做的SEO策略也是非常重要的, 更重要的是您自己要具備正確的SEO觀念, 如此一來才能讓您的網站常久經營下去, 並且日漸茁壯 ...

標籤: , , , , , , , ,

繼續閱讀

2008年7月2日 星期三

網路行銷 : SEO 五大要素



許多網路業者都提供SEO(Search Engine Optimization)服務, 有些是白帽式的(White Hat), 也就是中規中矩的來改善您的網站品質, 也有些是黑帽式的(Black Hat), 也就是利用搜詢引擎的漏洞來提昇搜尋排名, 而現在已經不止企業需要進行SEO, 連部落客也都需要SEO來拉抬人氣, 因此對於SEO種種觀念是否正確就顯得非常重要, 如果對於SEO的觀念不夠正確而誤用了看似有效的黑帽式SEO技倆, 付出的代價可能會讓您哭不出來 ...

先就SEO的五大要素來說明, 而這些元素互為表裡並且相互影響, 因此不可能只針對單一元素來進行SEO

(1)網頁指標 - 不同的搜詢引擎會使用不同的網頁指標, 其中較耳熟能詳的網頁指標大抵是Google的PageRank與Alexa的AlexaRank, 另外就是您的網頁存在搜詢引擎中的backlink或inlink數目

(2)網域名稱 - 網域名稱是否有意義, 後綴為何以及網域名稱註冊時間的長短都會影響SEO的成效, 例如租車網站來說, CarRental.com基本上就比myCarWeb.com來得優, CarRental.com就比CarRental.org優勢, 而承接已經註冊很久的網域名稱就比新註冊的來得容易進行SEO, 如果您使用部落格服務提供的網域名稱, 也需要先觀察哪些部落格網域名稱具有較高的網頁指標

(3)網站流量 - 網站的訪客量會直接影響AlexaRank, 也會間接影響PageRank, 以往PageRank與流量關係不大, 但是自從去年Google修改演算法之後, 流量與PageRank的關係有增加的現象

(4)網站內容 - 當然網站有許多高品質的內容, 相對的會提升流量, 也會影響網頁指標, 並且網站內容應該與您選擇的keyword結合, 將keyword自然而平均的散佈在網頁內容裡

(5)網站結構 - 網站結構屬於比較技術性的, 許多SEO廠商喜歡從這裡著手

在說明如何進行SEO之前, 先來談談search engine, 我們先以較淺顯的方式來說明, search engine當然希望能夠最精確的找出使用者需要的內容, 因此以search engine的角度來看, 你的網站就必須讓search engine能夠理解, 並且以最"自然"的方式告訴search engine

以上牽涉到兩個重點: 以自然的方式, 讓search engine理解

許多SEO業者都忽略了以自然的方式來呈現, 例如為了增加backlink而在一天之內於網路上增加某頁面成千上萬的link, 這樣的link是會被search engine過濾掉的, 因為不夠自然, search engine對於黑帽式的SEO是持續的監看與反制的, 因此不要花太多力氣去製造無用的backlink

因此對於search engine的瞭解是製作網頁很重要的課題, 另外根據觀察, Google對於具有學術參考價值的網頁有特別的偏好, 因此在您的網站多增加一些這類內容是不錯的選擇

再來就以Q&A的方式來細談一些SEO的內容 ...

(1)SEO的程序應該如何進行?

- 瞭解您的競爭對手, 用上述的五個元素來解析競爭對手的網站, 並選擇您要的關鍵字
- 先瞭解上述網域名稱的特性來決定使用舊有的網域名稱, 還是乾脆另站重新來過選擇新的網域名稱
- 解析您的網站結構, 如title, meta, 目錄結構等...
- 構思您的網站內容策略, 並注意backlink品質
- 利用交換聯結, 公用書籤 ... 等等方式增加曝光度與流量
- 網站完成並經營一段時間後, 開始submit到各大search engine與dmoz
- 善用Google網站管理工具與分析工具

上面說的程序看似簡單, 但過程都是相當繁瑣, 舉個簡單的例子: 您當然希望別的高PR的頁面能夠link到您的網站, 但是不如注意自己網頁的PR值, 在自己有高PR值的頁面連回自己網頁, 本網提供的PR貼紙(PageRank Checker)就可以讓你瀏覽自己網站時隨時動態瞭解PR的變化, 當觀察到自己頁面有高於1的PR時, 就以自然的方式增加幾個link回其他頁面

(2)關鍵字出現在自己網頁的密度越高越好嗎?

答案是否定的, 同樣的關鍵字的密度也必須以自然的方式顯示, 以meta中的title為例子, 一般而言關鍵字不要超過title的一半, 最好保持在30%~50%左右

如果"相機"是您的關鍵字, title為"相機網-專業攝影器材網站"比title為"相機網"好一些

(3)為什麼要網站完成後再送到各搜詢引擎?

DMOZ來講, 如果您的網站尚未完工, 可能被直接刪除或擱置一旁, 可能變成永遠不會被處理的網站

(4)如何增加backlink?

如果能夠有好的內容, 然後利用網路公用書籤是最佳的方式, 其次就是交換聯結,參加一些網頁排名,透過DMOZ服務, 不要太迷信其他旁門左道的黑帽式方法

林林總總說了一堆, SEO絕對是一項人力密集的工作, 沒有一個軟體或簡單步驟可以達成目的, 而且如果沒好的內容, 做半天SEO也不會太有效, 因此回歸到原點, 還是好好思考如何提供有品質的內容, 再來煩惱SEO吧!

標籤: , , ,

繼續閱讀

2008年6月25日 星期三

Google資料中心的秘密



Google提供全球大量的服務,幾乎已經快橫跨整個資訊科技的服務,但是Google資料中心的內部運作一直都是秘而不宣,許多人可能都碰過Google的服務出狀況,但是這些狀況總能在可容忍的範圍內解決,你可能發現你的Gmail的容量一直在改變,是什麼架構讓空間像捏橡皮糖一樣越捏越大?前陣子Google伙伴Jeff Dean在Google I/O會議中稍微揭開了公司基礎設施的神秘面紗。

Google的神秘面紗包括了: (1)軟體 (2)硬體 (3)叢集平行處理機置

Google軟體的三個核心要素:GFS(Google檔案系統)、BigTable和MapReduce演算法。而硬體卻是一般的伺服器、處理器、硬碟、記憶體等等。另一方面伺服器的叢集能在半秒之內回應700至1,000台伺服器的搜尋請求。

根據Google的說法,GFS是"a scalable distributed file system for large distributed data-intensive applications. It provides fault tolerance while running on inexpensive commodity hardware, and it delivers high aggregate performance to a large number of clients". 就是這個GFS的分散式檔案系統,讓Google服務可以隨時長出空間或是切去毀損的部分,而管理這個GFS的機置就是BigTable。目前有超過200個叢集在執行GFS,其中許多都包含數千台主機。

GFS把一塊儲存的資料(通常是64MB),至少放在三台稱為chunkserver的主機內。

如果chunkserver發生故障,Master Server(主伺服器)便負責把資料備份到一個新的地方。至少在儲存層級,主機故障完全由GFS系統處理。

Google到底擁有多少台伺服器?據Dean表示,每個機櫃存放40台伺服器。而根據某項估計,Google目前在全球有36個資料中心,以每個中心有150個機櫃計算,Google的伺服器至少超過20萬台,並且每天都在增加中...下圖就是Google最早期的server rack,當然目前的硬體比這個肯定更驚人了。



Google之所以成為Google,部分原因是他們推翻了電腦界的傳統作法。當所有的超大型資料中心都使用主流伺服器和軟體,Google的資料中心絕大部分是靠本身的技術構建而成。Google把命運操縱在自己手中,共同創辦人Larry Page鼓勵員工"別太相信有什麼不可能的事情"。

要維持如此大規模的運作,也許可以說全世界是卯起來操Google的架構,Google必須對每一台機器抱有一種隨時可犧牲的態度。伺服器製造商喜歡主打他們的高階主機承受故障或當機的能力,但Google寧願把錢投資在容錯軟體上。他們認為擁有兩倍數量但較不可靠的硬體,勝過一半數量但較可靠的硬體。你必須在軟體的層級提供可靠度,如果你有1萬台主機在運作,每天一定會有一些東西掛掉。這個跟我們一般的認知確實有蠻大的差異,我們通常都希望有數量雖少,但功能穩定的機器,而不願意有一大籮筐兩光的機器。

每個新叢集上線的第一年,通常會發生1,000次個別主機的故障,數千次硬碟故障...

一次電力輸送問題,導致500至1,000台主機失效約6小時...

20次機櫃損壞,每次造成40至80台主機下線...

5次機櫃搖晃,導致半數的網路封包在傳送過程中遺失...

整個叢集至少一次重新上線,在兩天之內的任何時間,影響5%的主機...

整個叢集還有一半的機率會過熱,在5分鐘之內讓幾乎所有伺服器當機,並且花上1到2天的時間恢復...

雖然Google用一般硬體組件來組裝其伺服器,但卻不用傳統的封裝,他們要求Intel提供特製的主機板。Google目前在每40台伺服器的機櫃外,包覆一層外殼,而不是每台伺服器有個別的外殼。

Google在2004年開始設計的BigTable,用BigTable為所有資料提供若干結構,目前用在超過70個Google計畫,包括Google Maps、Google Earth、Blogger、Google Print、Orkut和核心搜尋索引。最大的BigTable實用範例管理橫跨數千台主機、約6 PT(petabytes)的資料。

Google在2003寫出第一版的MapReduce,讓該公司有辦法實際發揮那些資料的用處。舉例來說,MapReduce能找出某個特定字彙在Google的搜尋索引中出現的次數、列出所有特定字彙出現的網頁,和連結到某個特定網站的所有網站。

利用MapReduce,Google能用相對迅速的時間,建立一個包含"digital"、"network"和"society"三個字的所有網頁索引。"Dean說:「你必須能夠依序地橫跨數千台主機作業,才能在一個合理的時間內完成這項工作。」

MapReduce軟體在Google內部的應用日漸增加,2004年8月,該軟體執行2.9萬項工作,到2007年9月,已經暴增到220萬項。在這段期間,完成一項工作的平均時間也從634秒降至395秒,而MapReduce的工作產出則從193 terabytes上升到約1.4萬terabytes。Dean說,Google在任何一天都要執行約10萬項MapReduce工作,每一項工作佔用400台伺服器,且需要5到10分鐘完成。

MapReduce就像GFS,是特別設計用來迴避伺服器問題的。Dean表示:「當某台主機故障,主伺服器知道那台機器正在執行什麼工作,將命令其他主機接手那項map工作。你可能影響到100個map工作,但會有100台主機接手那些工作。」

MapReduce的可靠度一度遭到嚴厲的試煉,當時一個1,800台伺服器的叢集正進行維護作業,工作人員一次拔下80台主機的插頭,同時另外1,720台主機必須接下停頓的工作。Dean說:「速度變得有點慢,但工作全部完成。」而在一次2004年的簡報中,一個1,800台叢集的系統,承受了1,600台伺服器同時故障。

所以,Google資料中心的運作似乎如魚得水,一切順利。但該公司還不滿足,列出了一長串待改進的事項。大多數公司都試圖找出如何平順地將工作在伺服器之間轉移,但Google已經超越了那項挑戰,他們要能夠自由、平順,且自動地,將工作在各個資料中心間轉移。

Dean說:「我們下一代的基礎設施要是一個能夠橫跨大區塊主機轉移,而非單一機器的系統。」目前,某些大型的檔案系統具有不同的名稱,如GFS/Oregon和GFS/Atlanta,但他們都是彼此的拷貝。他表示:「我們要一個單一的名稱集。」

Google種種獨創的系統替他們開創了天下,也建立了其他競爭者很難跨過的門檻,但是隨著越來越複雜的環境,Google自己需要解決的問題,肯定挑戰會越來越大。

標籤: , , , , , ,

繼續閱讀

2008年6月16日 星期一

網路騙術何其多


(可點圖放大, 圖一: 網站看起來很正常, 但其實就是要騙你加入付費)

近日在網路上搜尋一些檔案, 真是被垃圾網站搞得啼笑皆非, 這些垃圾網站提供你任何你搜尋的內容, 你需要建置SOA的Web Services List? 他們有! 你需要Java建立on-the-fly的統計圖表? 他們有! 你需要衣索匹亞的GPS地圖? 他們有!


當然點進去之後, 只有兩種結果: 讓你誤點他們的廣告, 或是誘導你付出幾塊錢美金加入會員, 但這兩種結果都只能算是一種, 就是讓你被騙!

起初還真佩服這些網站, 哇! 什麼東東都有! 但是點進去...先付$4.95, 而且只優惠到月底, 讓你整年無限下載...但是仔細用各種方式評估, 才發現真的好笑到不行!

我們現在來看看這些好笑的網站, 特別打入非常特殊的關鍵字: 老狗與小烏龜
哈哈哈....看看下圖, 還有最新2008版本呢!


(可點圖放大, 圖二: 打入老狗與小烏龜, 哈...還有檔案讓你下載!)

再打入更特殊的關鍵字, 試看看

(可點圖放大, 圖三: 哈...也有檔案讓你下載!)


(可點圖放大, 圖四: 還有德文版的喔!)


(可點圖放大, 圖五: fuck my chair on the street檔案還真多喔, 而且有很多回覆感謝呢!)


(可點圖放大, 圖六: 老狗與小烏龜還有破解版的喔!)

這些網站只要騙你$4.95, 當被騙的人數多時, 真是一筆不小的收入 ...

真是網路騙術何其多, 真的不要太相信網路上的內容, 多培養專業知識, 以防止被騙失金!

標籤: , ,

繼續閱讀

2008年5月28日 星期三

Microsoft的搜尋與多媒體技術


微軟亞洲研究院成立十週年,院長洪小文(上圖)透露了部份研究成果:搜尋與多媒體技術。目前進行的研究成果包含自動化圖片編輯、與行動定位系統搭配的圖片搜尋、以搜尋為基礎的翻譯技術、哼唱搜尋,以及自動語音合成技術等,全都與多媒體或搜尋技術相關,顯示微軟打算與Google正面交峰的企圖。

與Google Earth與街景服務競爭的圖片搜尋技術稱為Photo2Search,使用者可用手機將街道上的建築物拍攝並上傳至系統,系統便會先取得基地台的位址資料,再將附近街道圖片與使用者上傳之圖片進行比對,比對完成後,再將使用者所需的資訊,如附近地圖、觀光點、建物資訊等訊息回傳給使用者。

傳統的圖片搜尋多半是透過metadata才能進行搜尋,但Photo2Search是透過基地台的位置比對,將搜尋目標範圍縮小後,再針對圖片內容進行畫素分析。

Photo2Search顧名思義就是利用圖片來搜尋,想要知道最近出來的DVD的反應如何?是值得一看還是浪費時間?只要照個像丟上系統查詢...想要知道最近開的餐廳評語如何?也只要照個像丟上系統查詢...

Photo2Search就是要讓: a picture is worth a thousand words , 一張圖片勝過千言萬語, 讓圖片自己與系統對話!

這個技術就是要解決實際世界與數位世界的差異問題, 這項技術的前身是Content Based Image Retrieval (CBIR) - 圖片內容頡取, 但是運算時間長且不易取得同類查詢的結果, Photo2Search使用另外的方式來比對事先取得的圖片資料庫, 這個技術可以運作在圖片、聲音、影片上。

其他關於搜尋的技術研發,還有翻譯搜尋Lingo。透過比對網路上現成的多語言資料,可以更精確找出特定語詞的譯法。至於已被商品化的搜尋技術,則是哼唱搜尋(Query by Humming),藉由哼唱一段歌曲,再透過語音辨識技術來找出資料庫中吻合的曲目,該技術目前已輸出給部分手機鈴聲(ringtone)業者,並已有商業化服務。



該語音合成的發聲特徵來自建模(modeling)技術,任何人只要先花二十分鐘讓系統學習,然後就能用他的聲音唱任何歌曲、說任何話。

這樣一個系統在任何多媒體資料庫上是非常有用的,其中載有音樂的資料庫提供一個替代性和自然的方式查詢。可以廣泛使用這種系統在商業音樂產業、音樂電視台及電台、音樂商店,甚至於個人的使用上。

標籤: , , ,

繼續閱讀

2008年5月22日 星期四

搜尋引擎的運作背後



相信大部分人都不太清楚到底搜尋引擎如何運作, 就算是SEO專家或是技術高手, 對於Google的PageRank也都只能由觀察來推論實際運作的可能性, 現在我們就幾個關鍵人物的說法來探究 ...

近日Google的官方部落格刊登了Udi Manber(VP Engineering, Search Quality)的這篇文章: Introduction to Google Search Quality, 並且透露Google將定期公告關於搜尋引擎的訊息

Udi Manber在2006年前是負責Amazon的A9搜尋引擎, 因此雖然只加入Google兩年, 但是已經算是搜尋引擎的老鳥了

在談Udi Manber的文章前, 我們先來看Blekko的Rich Skrenta, 他敘述關於search engine:

Step 1 is to copy the internet onto your cluster. Step 2 is to analyze it..

Search is like 7 hard problems wrapped into a stack. Distributed systems, html analytics, text analytics/semantics, anti-spam, AI/ML, frontend/UI. And scale...

Plus there is always something fresh and new every day mining through the vast sordidness of the many billions of pages on the web. You expect to be amazed at the endless varieties of crazy porn domains and new approaches to webspam.

Rich Skrenta說到, 搜尋引擎就是把全球的頁面複製一份到你的叢集裡, 然後進行七項苦工(分散式系統,HTML分析,文字與語意分析,反垃圾,人工智慧與機器學習,使用界面,彈性的系統規模)...然後每天都會驚訝發現許多的色情與垃圾網站...(僅就意思翻譯,請多包涵)

他的最後一句透露了兩個重點...取巧的網頁會被抓出來,以及人類在整個過程中會介入資料的判斷

其實從上次Google的PR調整來處罰Paid link, 大概就清楚人為干擾search engine algorithm的例子 ,但由Rich Skrenta的說法就更明白, 非自然的網頁行為是被嚴密的監控的, 也許您會認為上億頁的資料中不會被發現, 那您就低估了人工智慧與機器學習的可能性 ...

SitePro列出的SEO十大守則

Commandment 1: There are No Rank Guarantees
Commandment 2: Ranking is Not the End, It's the Means
Commandment 3: Know Your Competition
Commandment 4: Use Search Engine Friendly Design
Commandment 5: Select Keywords that are Worthy
Commandment 6: Write Great Content
Commandment 7: Use Good Hyper Linking Strategy
Commandment 8: Write Relevant and Original Meta Content
Commandment 9: Acquire Relevant Links
Commandment 10: Consult Experts, If You Need To


也可以很清楚的知道: 好好耕耘內容, 不需要太在意評分, 自然可以呈現好結果

我們現在再回來看看Udi的文章 ...

PageRank is still in use today, but it is now a part of a much larger system. Other parts include language models (the ability to handle phrases, synonyms, diacritics, spelling mistakes, and so on), query models (it's not just the language, it's how people use it today), time models (some queries are best answered with a 30-minutes old page, and some are better answered with a page that stood the test of time), and personalized models (not all people want the same thing).

顯示PageRank只是"Part-of", 由許多觀察也發現, PR與SERP不如以前關係緊密, 因此許多追求PageRank的作法應該有所調整, 並且以後可能搜尋結果可能會因人而異(您看到自己頁面的搜尋結果很好,不要太高興啦...)

In 2007, we launched more than 450 new improvements, about 9 per week on the average...we made significant changes to the PageRank algorithm in January.

去年Google就進行了450次以上的調整, 並於2008.01做了PageRank algorithm重大調整, 跟一些專家所說的數字差距真的太遠啦

There is a whole team that concentrates on fighting webspam and other types of abuse. That team works on variety of issues from hidden text to off-topic pages stuffed with gibberish keywords, plus many other schemes that people use in an attempt to rank higher in our search results. The team spots new spam trends and works to counter those trends in scalable ways; like all other teams, they do it internationally.

如Rich Skrenta所說的, Udi也提到非自然的取巧作法是被嚴格觀察的...尤其當您在網頁上看到某些取巧的作法時, 就趕緊停止吧, 因為Gooogle早晚也會知道的...

我們就密切注意Udi Manber後續的文章吧, 如果您懶得看英文, 隨時回來這裡交流吧 ...

標籤: , , , , , ,

繼續閱讀

2008年5月21日 星期三

Blekko:下一個Google?



如果跟您說Blekko這家公司創於2007年六月, 並且已經募集了數百萬美金, 而他的網站在這裡, 不知您做何感想?

但是如果再跟您說, 他的創辦人是Rich Skrenta:撰寫第電腦病毒Elk ClonerDMOZ ODP創辦人之一、Topix線上新聞創辦人之一, 並且他的夥伴是早期Google的人David DesJardinsJeremy Wenokur(Jeremy也是ODP的早期創辦人之一), 大概您就不會那麼驚訝了

不過一堆有頭有臉的人搞出一個Blekko這樣的公司, 到底葫蘆裡是賣什麼藥呢?

據Skrenta表示, Blekko主力在indexing,query serving的後端, 將會讓使用者有全然不同的搜尋經驗, 但是真正宣佈prototype應該不會早於2009年, 因此可以預知2009年後以Google PageRank為主的SEO會有一個不小的改變

也許您會說:幾個人加上幾百萬美金, 可能憾動Google在搜尋上的地位嗎? 如果您仔細瞭解他們在Google、DMOZ上扮演的角色, 也許您就不會太懷疑Skrenta所說的

除了Blekko之外, 還有TwinePowersetFreebaseKartooizitoujikohakia ... 緊追其後, 2008年到2009年之間, 搜尋引擎還有一場大戰, Sit back & Enjoy it !

標籤: , , , ,

繼續閱讀

2008年5月15日 星期四

語意搜尋的前哨站 : 垂直搜尋


Google的一般搜尋後又推出各類搜尋之際(圖書搜尋, 地圖搜尋, 學術搜尋, 網誌搜尋, 產品搜尋, 新聞搜尋...等), 各家一堆特定目的垂直搜尋也紛紛想要搶下一片江山, 這些搜尋引擎到底存活的機率有多少? 功能如何?

目前廣泛性的搜尋除了Google外, 大抵普遍被使用的就是Yahoo/Microsoft/A9/AltaVista/AllTheWeb/Lycos/Ask.com/Baidu...等等, 在這些廣泛性搜尋引擎與語意搜尋引擎(如Kartoo/izito/ujiko/hakia...等)之間, 垂直搜尋引擎的出現也彌補了目前搜尋不精準的缺點。

以下就來介紹一些功能不差的垂直搜尋及特殊查詢網站...

(1)(垂直搜尋)Kooxoo酷訊網 : 提供中國大陸的工作、房屋、票務、酒店、旅遊、購物等生活內容的搜索服務。這個酷訊網由北京大學計算機工程背景的陳華所創辦, 可以搜尋到的訊息可以說幾乎涵蓋了中國大陸的食衣住行娛樂, 由於表現不凡, 也獲得了Qihoo不少資金的投資。

(2)(垂直搜尋)Jobui/Jobmet : 為求職者提供大量的工作訊息,及中高端人才獵頭服務。這類服務與台灣的104人力銀行不同, 他們沒有自己的資料, 只是提供界面去各人力資源網站抓取資料加以整合。

(3)(垂直搜尋)Krillion產品搜尋 : 這個查詢與Froogle類似, 但資料量不夠多, 面對Google大概存活率不高, 除非資料能夠往精緻化發展。

(4)(垂直搜尋)Spock找人服務 : 這個找人服務與USA People Search類似。

(5)(垂直搜尋)Yoinkd音樂搜尋 : 與百度的MP3搜尋類似, 精準度不錯, 而且資料量也不差。

(6)(特殊查詢)Openrice餐廳搜尋 : 可以搜尋香港各類餐廳, 但不算是垂直搜尋, 因為資料蠻齊全的, 因此也把他列進來。

(7)(整合界面搜尋)oskope視覺搜尋 : 提供搜尋eBay/Amazon/flickr/Fotolia/Yahoo/YouTube等內容的視覺化搜尋, 其功能與Spacetime類似, oskope需要安裝額外的plug-in, 而Spacetime需要安裝額外的軟體, 並且硬體需求也較高。

(8)(垂直搜尋)FindBook翻書客 : 提供各網路書店的書籍比價搜尋, 類似的服務有isoshu, 但是isoshu找的不是書籍的價格, 竟然找的是書的內文, 不知他是如何處理版權問題。

(9)(垂直搜尋)Yousee BBS搜尋 : 提供BBS站內的文章搜尋, 是政治大學資科系團隊製作出來的。

在網路上資料日增的情況下, 各種需求已經無法以單一普遍性搜尋引擎來滿足, 因此專門領域搜尋、垂直搜尋、語意搜尋等需求會越來越高, 並且更符合人性化的界面也是大家所期盼的, 以上這麼多的搜尋網站到底誰能勝出? 還是只是曇花一現? 就看使用者賞不賞臉了!

標籤: , , , , , ,

繼續閱讀

2008年5月14日 星期三

搜尋引擎的下一步:語意搜尋

現在的搜尋引擎雖然精準度已經比以往提高不少, 但是還是常常搜非所尋, 想要找亞馬遜叢林的資料, 輸入Amazon卻都是亞馬遜書店相關訊息, 必須翻到好幾頁以後才陸續出現亞馬遜叢林的資料

因為亞馬遜書店的PageRank值高, 因為亞馬遜書店的流量大, 所以搜尋引擎就以最可能你需要的出現在最前面, 但是偶爾(或是常常?)你要的資料並非最熱門的, 你就得耐心的多翻幾頁, 或者多使用不同的搜尋引擎來找尋 ...

但是, 這種現象已經慢慢在改觀中, 因為許多語意相關的技術已經逐漸純熟 ...



如上面畫面的izito, 當你輸入關鍵字以後, 右邊會出現Topic與domain選項, 當你輸入amazon後, 就可以選擇river或books等選項來確認你所謂的amazon是啥意思, 但是不幸的是...雖然izito可以搜尋中文, 但是對於資料的分類(也就是ontology的建立), 尚無法精確的處理中文網頁, 你如果輸入"五佰", izito自做聰明的分類還是會讓你滿臉豆花 ...

而如下圖顯示的ujiko雖然不允許處理中文資料, 但是允許使用者對搜尋結果做客製化(如搜尋到的結果給他一顆心, 或丟到垃圾桶), 下次搜尋就會以你客製的結果出現, 並且ujiko也提供跟izito類似的topic分類, 並且可以往下再分子類別, 雖然介面稍微複雜些, 但搜尋結果還算不錯



而如下所顯示的kartoo就更厲害啦, 當滑鼠移動到某個link時, 便會顯示這個link在ontology中的關係, 同樣的他的左邊選單也提供topic的選項, 不過kartoo也不支援中文搜尋



當然Semantic Search Engine還不只這些, 下次再來談多些相關網站及這些語意搜尋的技術層面內容 ...

標籤: , , , ,

繼續閱讀

2008年3月20日 星期四

善用PageRank指標提升企業競爭力

處於網路資訊時代,如果無法在全球資訊網上建立網路身份,將喪失未來與對手競爭的能力。這絕對不是危言聳聽的言詞,因為許多事實已經很明顯的呈現。

舉個最常見到的例子,我們如果想要計畫一個旅遊行程,通常會在網路先搜尋前往地點的一些資訊,如景點、食宿、交通等。藉由這些資料的取得與呈現結果,會大半決定了旅遊路線與到訪地點,如果旅遊相關業者在網路上沒有訊息或是極少訊息,可以吸引旅客前往的機率便會相對減少。

實體企業的競爭力會影響企業網站的重要性,而企業網站的重要性也會影響實體企業的競爭力,兩者互為因果。我們由Google的PageRank來觀察,IBM (PR 9/10)、Apple (PR 9/10)、HP (PR 9/10)、NOKIA (PR 9/10)、Dell (PR 8/10)、SONY (PR 8/10)、ASUS (PR 6/10)、Acer (PR 6/10),與實際企業的市場規模完全吻合 (參考: PageRank查詢工具)。

再看看學術單位的PageRank指標,台大 (PR 8/10)、交大 (PR 7/10)、清華 (PR 7/10)、政大 (PR 7/10)、中山 (PR 6/10)、成大 (PR 6/10)、中央 (PR 6/10)、師大 (PR 6/10)、逢甲 (PR 6/10)、淡江 (PR 6/10)、台北科大 (PR 5/10)、雲林科大 (PR 5/10),跟webometrics學校全球排名結果也幾乎一致。

因此除了提升實體競爭力之外,對於網路上PageRank指標的重視也是企業很重要的議題。因為較高的PageRank可以讓企業網路上的資訊可以較為容易被網友取得,詳細內容已經在"看不見的網路行銷戰場"說明過,就不再贅述。

什麼是 Google PageRank? PageRank 是以 Google 公司創辦人拉里·佩奇(Larry Page)命名,剛好也表示網站頁面的等級指標。是一種由搜索引擎根據網頁之間相互的超鏈接來計算的網頁排名。PageRank 跟流量不一定成正比(Alexa Rank與流量比較相關,其他文章再談),但能夠表示頁面內容的重要性,Google 把從 A 頁面到 B 頁面的鏈接解釋為 A 頁面投票給B頁面,一個頁面的「得票數」由所有鏈向它的頁面的重要性決定。 (詳細說明可以參考 : Wikipedia)

因此高的PageRank表示較多網站對於該頁面的認同,但是網海茫茫,該頁面的內容豐富度並不一定會被發現進而認同,所以除了網頁內容的豐富度之外,隨時觀察PageRank與進行SEO (Search Engine Optimization, 搜尋引擎最佳化) 是相關重要的課題。

您可以使用本網提供的PageRank工具來查詢,或把HTML碼複製到您的網頁,瀏覽時就可以隨時瞭解網頁被認同的指標,來調整網站內容的方向。例如,如果您發現某些頁面的PR值比其他頁面高,表示該內容已經被其他網頁連接與認同。有了這個工具,您就不需安裝其他的軟體,也不需時常去搜尋引擎查詢被聯結的狀態。

如何把HTML碼複製到您的網頁來顯示PageRank呢?
(1)瀏覽PageRank工具
(2)由Style#1~10中,選一個較適合的圖案
(3)將該Style的HTML碼複製
(4)放置在您的網頁適當地方 (在<BODY>與</BODY> tag內)

完成以上程序,就可以顯示出該頁面的PageRank。而如果在Style#1~10中都沒有適合的圖案,也歡迎跟我們聯絡,提出您的色系與大小需求,將另外免費製作適合您網頁的圖案。

標籤: , , ,

繼續閱讀

2007年4月10日 星期二

Internet大破譯(五): 看不見的網路行銷戰場

大家都在談網路行銷,動不動就說"現在是網路時代,不使用網路來行銷,就會如何如何...",閱讀了一堆關於網路行銷的資料,但都是一堆理論屁話,我敢打賭那些作者學者大人,自己絕對沒有真正使用網路來行銷的實際經驗,搞不好自己連網路怎麼運作都還不是很清楚。

自己搞網路二十多年,深覺網路行銷有兩大類戰場,一類是看不見的戰場,一類是看得見的戰場。所謂看不見的戰場就是一般人感覺不到,但卻在抬面下炮火不斷的戰場,那些原本搞行銷理論的人來談網路行銷,根本不知道還有這種看不見的戰場。舉個簡單的例子來說明,如果業者花錢去買網路廣告放置在各大入口網站,或買Yahoo!Kimo的關鍵字廣告,是屬於看得見的網路行銷戰場。

但如果使用者去使用各搜尋引擎去搜尋而能『自然』出現在前幾頁或前幾名的結果,就是屬於看不見的網路行銷戰場。

看得見的網路行銷戰場任何行銷人都可以說出一堆理論,但他們就無法插手看不見的網路行銷戰場,因為這是屬於網路運作與網路技術領域。

許多企業都知道要架企業網站或企業部落格,但是架設完成之後如何讓消費者看到或如何調校就看著辦了。

如果消費者在網路上搜尋你的產品,但是就是找不到資料,或出現一堆負面的資料,相信消費者不會成為你的客戶。

看不見的網路行銷戰場怎麼打?

我把它分成三階段來說明: 網站製作階段、網站完成階段、與最後行銷階段,但到每一階段都可能會回朔到前面階段做調校。

這三個階段都與SEO(Search Engine Optimization, 搜尋引擎最佳化)有關係。

( 一)網站製作階段

網頁中的幾個meta tag(Keywords, description)、title tag、網站的URL、網站目錄名稱...等等,都會間接或直接影響網站的search排行。meta tag與title tag一般網頁設計者都知道會影響search,但可能不知道網站的URL、網站目錄名稱也會影響。

如果你的網站URL含有car或auto (如taiwanCar.com.tw, bestSaleAuto.com.tw),當使用者以car、auto、汽車去查詢時,你的網站會有較大優勢。

同樣的如果你的網站有 abcd.com.tw/car 或 defg.com.tw/auto路逕時,你的網站也會有較大優勢。網站的URL對於search engine的影響,有些顛覆以往網域名稱的