2010年1月22日星期五

SEO教學 : PageRank Sculpting



Pagerank對於SEO有沒有意義? 需不需要去注意網頁的Pagerank? 我們在Pagerank的相關文章已經說過太多次了, 在許多國內外的SEO專家都認為不能放棄Pagerank的情況下, 如果還要認為Pagerank不重要的話, 你會喪失很多網站可能的曝光機會 ...

許多人會認為Pagerank沒有意義的原因不外有幾個:

- 有些大站或人氣站台的Pagerank很低
- 有些Pagerank高的站台根本沒有什麼內容也沒有讓SERP表現突出

之前的文章"搜尋行銷 : PageRank 的三兩事"解釋過: Pagerank高未必好, 要看他的Pagerank是如何來的

為何大站或人氣站台的Pagerank很低? 通常是因為原創性不高, 其內容也可以由其他來源取得

為何有些Pagerank高的站台根本沒有什麼內容也沒有讓SERP表現突出? 如果透過少數高PR頁面加持而來的Pagerank, 當然對於SERP沒有助益


去年的Pagerank演算法的更新, 因nofollow而會讓PR值蒸發, 更讓許多人不知如何是好

這篇"PageRank Sculpting Leaves NoFollowed Tags Behind"算是寫得很清楚, 應可以解開不少人的困擾

Scott Smigler認為Pagerank Sculpting還是必須要進行的, 只是不能用以往nofollow的概念來做, 他認為有幾點應該注意:

(1)Reorganize the links 重新組織連結
(2)Remove low SEO potential pages 移除低度貢獻的頁面
(3)Perform usability testing and track conversion rates 進行使用度測試及追蹤轉換率


也就是說想要進行Pagerank Sculpting, 真的必須要進行人力密集與技術密集的作業了; 而nofollow還用不用呢? 當然還是可以用的, 只是作用不在Pagerank, 而是代表其他的意義

也許Pagerank有一天會消失他的功能, 但是不是現在; 如果還認為Pagerank沒有意義, 你的SEO作業會失去很大一塊應該耕耘的沃土 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月15日星期五

搜尋行銷 : PageRank 的三兩事



常常有人會問: 我應該如何才能讓網站的PageRank提高? 為什麼我的PageRank提高後, SERP根本沒有提升? 為什麼有些網站可以在短期內拉高PageRank? 我們在之前已經寫很多關於PageRank的文章了, 現在稍微來整理回顧一下 ...

1)影響PageRank的因素已經不一樣

首先目前的Pagerank演算法, 已經跟最初的公式有所差異了, 雖然精神一樣, 但是相關的因素已經不再只有Backlink

如"Pagerank algorithm improvement by page relevance measurement"所提到的「內容相關」

"Topic-sensitive PageRank: a context-sensitive ranking algorithm for Web search"所提到的「主題相關」

"Hyperlink Classification: A New Approach to Improve PageRank"所提到的「連結分類相關」

2)PageRank跟網站信賴度

網站信賴度高的, 相對會俱備高的PageRank; 但是高的PageRank未必是俱有高的網站信賴度; 同樣的, 網站信賴度低的, 相對會俱備低的PageRank; 低的PageRank大多是低的網站信賴度; 也就是PageRank高不一定好, 但是低的通常不好 ... 這些內容在"SEO 關鍵解碼"也都有清楚的說明

網站信賴度代表的是: 抓取頻率跟索引量; 網站信賴度高的話, 新資料在短期間就會被抓走, 並且被索引的資料量會更多; 如此一來, 能夠出現在較優的SERP的機率就會增加

為什麼高的PageRank未必是俱有高的網站信賴度呢? 如果你的PR是因為被幾個高PR連結拉高的, 例如: 透過幾個PR7的連結就可以把PR拉到5或6, 這樣的PR值並不代表「網站信賴度」, 也就是透過多樣性網站的連結來傳入PR值累積, 會比少數高PR值加持而達到的效果高, 而俱備更好的「網站信賴度」...當然這裡指的"多樣性網站的連結"必須不是link farm才算數啦... 當然如果同時有「高PR值加持」跟「多樣性網站的連結」當然就更好了

這也就是為什麼有些高PR的網站並沒有「高的抓取頻率」跟「高的索引量」的原因, 如此下來, 當然SERP就沒有好的表現

也許有人會問: 為什麼有些低PR的網站的抓取頻率也很高呢?

我們說「高網站信賴度則有高的抓取頻率」, 但是決定「抓取頻率」的因素不是只有「網站信賴度」, 所以低PR的網站如果抓取頻率也很高...也許是流量高, 也許是網站歷史時間長 ... 等等其他因素而造成的

3)PageRank值的來源關係到SERP

我們上面說到, 「高PR值加持」跟「多樣性網站的連結」當然兩者都有最好, 但是後者反而比前者好, 也就是同樣是PR6, 如果靠的是「高PR值加持」, 倒不如是由「多樣性網站的連結」而來

"SERP v.s. PageRank : PR值與搜尋排前的關係", "SERP : Search Engine Results Page" 說過: PR值與SERP不一定成正比, 隨著時間PR會逐漸減少對SERP的影響 ...

並且由第(1)項中許多探討PageRank改善的研究顯示, PageRank值的背後應該還有其他的屬性(Attributes), 只是這個屬性沒有連帶公佈出來, 這個屬性就可能才是真正影響SERP的因素, 而非PageRank本身; 如同英文檢定分數相同的人, 可能有些人的聽力分數高, 有些人是閱讀分數高, 如果只比總數的話, 就無法分出分項能力了

所以我應該如何才能讓網站的PageRank提高? 如果你只在意PR值本身的話, 只需要積極跟高PR的網站打好關係, 然後看是否有機會互連; 如果你在意的是「網站信賴度」, 那就必須花更多的時間去產生quality links

為什麼我的PageRank提高後, SERP根本沒有提升? 就是上面所說的, 要提高的是「網站信賴度」而不光是PageRank

為什麼有些網站可以在短期內拉高PageRank? 除了可能使用黑帽手法之外, 就是靠「高PR值加持」, 當然就可以做到短期內拉高PageRank

套句俗話: PageRank不是萬能, 但是沒有PageRank就萬萬不能

在提升PageRank的同時也注意「網站信賴度」是很基本的工作, 如果連PageRank都拉不高, 很難進行後面的作業

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月2日星期六

Google PageRank Update : 本站更新為 PR6



Google在2009年的最後一天更新了PageRank, 從Google大約每季的PageRank更新中都隱約可以看出Google演算法的走向, 目前本站(dns.com.tw)的PageRank為PR6 (如上圖), 而其他次目錄的PR值則分佈在PR5到PR0...

由多個datacenter來查詢, dns.com.tw也都是PR6(如下圖), 所以應該是確定更新完成了, 只是希望下次更新還能夠維持下去...當然能夠持續提升就更好啦 :)



前兩個星期前剛建立了另外一個新站, 也由原本的PR0更新為PR4, 這個新站的內容將後續再來介紹; 本站的PageRank Checker服務頁面也在兩個月內由PR0更新到PR5 ...

有許多人有個疑問: 到底PageRank還有用處嗎? 這個問題我們在"SEO關鍵解碼"已經有詳細說明, 就不再贅述, 基本上PageRank與我們所重視的「網站信賴度」有關, 但也不是PageRank高就代表「網站信賴度」高, 只是其間有所關聯; 如果缺乏「網站信賴度」, 其他作業的操作難度會增加許多

所以「PageRank還有用處嗎?」當然有用處! 「PageRank就是讓搜尋引擎信賴的重要因素」

許多人也有疑問: 應該如何才能讓PageRank提升呢? 老話一句...這個問題我們在"SEO關鍵解碼"已經有詳細說明 ... 是真的都說得很清楚了...

而且PageRank演算法已經不再只是由連結的PR累積: 並非每個連結(非no-follow)都會被認定有效, 有效的連結還會有其他因素來加權處理PR值(這個加權可能是正或負)

PageRank的演算法已經跟往常所認知的公式不相同

2010年是很變動的一年, 也許等Google Caffeine完全正式上線及Microsoft-Yahoo合作案塵埃落定後會有更大的改變, 更多的操作細節將陸續為您報導, 希望可以讓更多人瞭解SEO/SEM等等詳細作業 ...

P.S. 以下是本站的WebsiteGrader評分(滿分100分)



標籤:

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月17日星期三

SEO - 到底要 DoFollow 還是 NoFollow?



上幾篇文章談到NoFollow的問題, "NoFollow 真的可以做到 PageRank Sculpting 嗎?"及"PageRank Sculpting 與 PageRank Siloing", 對於SEO來說到底應該如何看待NoFollow呢?

沒想到真的Google在一年多以前就已經更改了NoFollow的演算法, 大家都以為加上NoFollow就可以防止PR的分享, 但竟然是無功而返...

會需要加上NoFollow原本是為了:

-- 在Web 2.0下, 讓讀者個人產生的回覆內容中的連結不要分散了PR,
-- 以及某些網站雖然自己加上連結, 但並不表示投下一票

所以我是否該繼續使用NoFollow? 當然繼續使用, 但是使用的心態必須調整了, 怎麼調整呢?

NoFollow原本著眼在「PR」, 但現在應該著眼在「關聯」 ... 什麼意思?

就是「NoFollow」表示我這篇文章跟連結是「沒有關聯」的, 也就是請搜尋引擎到此為止, 不要把我的網頁跟連結內容扯上關係

也就是遵守搜尋引擎的規則: 「壞的網頁會連到好的網頁,但是好的網頁不會連到壞的網頁」, 以及「outbound link effect」

就是NoFollow可以使用在交換連結、讀者自己產生的連結、非相關內容的連結...等等

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年6月5日星期五

PageRank Sculpting 與 PageRank Siloing



什麼是PageRank Sculpting 與 PageRank Siloing? 這個名詞如果逐字翻譯會有點好笑, 我們來談談吧...

Sculpting 是雕刻、雕塑、塑造的意思, 如果把PageRank Sculpting 翻成PageRank塑造/雕塑, 有點好笑

Siloing 這個字更是沒有相對應的簡單中文詞, 如果查起來是...裝秣窯的過程, 這個到底是什麼??

我們先來談Sculpting, 就是依照你的意思去把東西塑造出來, 當然PageRank不能用塑造來形容

PageRank Sculpting就是指是否用nofollow來取消某些連結的分享, 也就是說依照你的意思去分派或指派可以分享跟不能分享的連結

所以PageRank Sculpting如果翻成中文, 應該是「PageRank指派」或「PageRank分派」



Silo這個字是古時候儲存農作的地方, Siloing就是儲存農作這個動作, 儲存農作時會做什麼動作? 就是分門別類

就是放甲農作的不跟乙農作混在一起, 也就是不要混在一起, 另外一個詞是Silo effect(窯效應), 就是有點類似我們前面說過的Beer game, 就是資訊互相不暢通而造成企業部門間的溝通不良...因為Silo都是密閉不通風的, 所以引申沒有溝通管道

這裡PageRank Siloing就是說透過nofollow來分類不同的議題, 告訴搜尋引擎, 雖然有link, 但是我跟他是沒有關連的...如果沒有nofollow, 就會有我們說的outbound link effect, 讓搜尋引擎以為有關聯

所以PageRank Siloing應該翻譯成「PageRank區隔」或「PageRank分類」, 把nofollow認為是沒有內容相關而不分享PageRank



另外一個問題...nofollow真的是可以照我們的意思去分派PageRank嗎?? 我們後續再談了...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月5日星期二

PageRank Algorithm : 別說你懂PR演算法



在"Pagerank 演算法研究"曾經大致上說明了基本概念, 但是沒有提到一些實務的細節, 最近因為需要整理資料, 把國內外談到Pagerank 演算法的網頁都看了一下, 發現繁體內容少有對於PageRank正確的描述, 國外英文內容也幾乎一半以上都在胡扯, 也許你會說... 怎麼可能? 往下繼續看...看你是否真的懂PageRank?

先有幾個問題:

(1)如果有一個網頁A, 其PageRank等級為1, 具有100個對外連結, 當網頁B只有網頁A連入, 網頁A會如何貢獻PageRank給網頁B?
(2)如果有一個網頁A, 有1000個網頁連到網頁A, 這些連到網頁A的網頁, 每個都是PageRank等級1, 都具有100個對外連結, 請問網頁A的PageRank等級是多少?

如果你的答案是:

(1)PR(B)=(1-0.85)+0.85*(1/100)=0.15+0.0085=0.1585
(2)PR(A)=(1-0.85)+0.85*((1/100)*1000)=0.15+8.5=8.65

答案是這樣嗎? 如果你認為YES....那你還不太清楚PageRank演算法

從第一個答案還看不出怪異, 但從第二個答案, 應該就有人會覺得怪了....怪在哪裡?

具有1000個backlink, 且來源都是PageRank等級為1以上的網頁不稀奇, 怎麼可能就能把PR變成8???

如果今天如果有一個網頁A, 有10000個網頁連到網頁A, 這些連到網頁A的網頁, 每個都是PageRank等級1, 都具有100個對外連結, 請問網頁A的PageRank等級是多少?

結果變成 PR(A)=(1-0.85)+0.85*((1/100)*10000)=0.15+85=85.15

怎麼會是85?

你知不知道有多少網頁的外部連結可能到數十萬個, 如果這樣算的話,要到PR10太簡單了吧!(當然不會這樣)

也許有人會說, 那只是初始值, 還會經過迭代計算...然後收斂, 值會收斂下來

那麼我們來談談收斂, 什麼叫收斂? 就是經過多次計算後, 當數值呈現穩定不變, 就達收斂的狀態, 不管再經幾次迭代計算, 數值都不會再變

上面的式子根本就是固定值, 也就是不用迭代計算, 早就穩定不變

為什麼上面答案(1)(2)是錯誤的? 其中0.85目的何在? 為什麼會選擇0.85? 而不是0.8,也不是0.5?

許多SEO書籍對於這個問題大多避而不談, 因為實際上可能也不知道該怎麼談

問題出在哪裡呢? 我們後面再來解釋答案了!

相關訊息:
Pagerank 演算法研究
什麼是PageRank Hijack?
善用PageRank指標提升企業競爭力
Google Analytics & PageRank
SERP vs PageRank : PR值與搜尋排前的關係

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年4月22日星期三

Yahoo WebRank?



網路上有人說Yahoo是以WebRank來評估網頁等級, 並且有圖為證(如上)
我們知道Google的網頁等級是以PageRank, Microsoft是以Browserank, 現在又有WebRank啊? 只能一笑置之, 我們來看看究竟是如何吧!

我們在"SEO觀點 : SEO面對的是巨變的環境"說過

如果您看過美式足球, 一定曾經被足球比賽的多變所震憾過, 一場比賽沒有到結束前, 沒人知道哪個隊伍是最後贏家, 因為任何時刻都是關鍵, 差之毫釐沒有抓到球或是沒有攔到對手, 都可能翻轉整場的勝負

教練必須在各種瞬息萬變的狀況下隨時調整策略, 以應付當時的情勢, 而所有現場的反射動作都是平常多年累積下來的經驗結晶, SEO(Search Engine Optimization)也是如此, 沒有絕對不變的真理, 只有隨著整個網路生態與技術的推移逐步調整出最好的步伐...


Yahoo開始用WebRank嗎? 其實WebRank不是現在的新名詞, 大約在五、六年前就有的, 當時也真的有WebRank Check Tool, 不過已經都查不到東西 ...

WebRank當時的用意跟BrowseRank類似, 我們在"PageRank, BrowseRank, AlexaRank"談到 -- BrowseRank只是Page-level的AlexaRank

而這篇"Microsoft Unveils BrowseRank, Google Feels a Draft"也認為BrowseRank尚未真正成熟

我們如果從PageRank/BrowseRank/AlexaRank/WebRank的資料來源觀察, 大概就可以知道哪些是比較精準而可以延用下來的

何時Yahoo才會重拾WebRank呢? 如果連BrowseRank也搞不起來的話, WebRank大概就無法重見天日了, 後續再以技術層面來探討PageRank、BrowseRank...等ranking algorithm


標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月5日星期五

Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)



延續之前文章

"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

我們繼續來談其他問題...

Q: I have a website in 5 languages (and I cannot buy 5 different localized domains), which option is the best? To have different subdirectories (domain.com/en) or to have different subdomains? (en.domain.com)
如果網站有五種不同語言的內容, 網址應該如何取捨? 子目錄或子網域?

A: both versions are fine. I personally generally recommend using a subdomain when the sites are completely different and using subdirectories when it's more or less a shared site, but it's up to you.
當網站是完全獨立的可以用子網域, 若共用則使用子目錄


以上回答如果有聽沒有懂, 請參考:

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory

Q: If my sub domain got high Page Rank, how far it will contribute to the main domain?
次頁的PR是否會貢獻給主頁?

A: PageRank is on a page-by-page basis. The PageRank of a page (on a subdomain or not) is based on the links to it.
不會


雖然PageRank是以頁面來計算, 不會貢獻給上層網頁, 但是如果適當調整link, 可將link的PR貢獻給上層或其他網頁, 因此監看各頁的PR還是必須進行的

Q: Recently you posted on the webmaster central blog that you would suggest to not rewrite dynamic urls to static. Is there penalties for sites that rewrite? Would you suggest changing if a site has 5+ years history? Can you discuss further? Thanks.
將動態URL改寫成靜態URL影響如何?

A: great question. If your site is already doing well and you have rewrites, then you're probably doing them properly so please don't worry about it.
Feel free to spend time on your content and business! Yay! :)
In our blog post, we wanted to discourage new sites, or less experienced webmasters, from feeling they HAD to use rewrites. We've improved our processing of dynamic URLS, so there's no need for newer webmasters to be afraid of them any longer.
沒有必要


在以往靜態URL的SERP比動態URL要好, 但是目前已經沒有差異

Q: Sub-Domains are considered as a new site for Search Engines, if a 5 years old site which uses forums.domain.com, www.domain.com now plans to add shop.domain.com and download.domain.com will this take another few years for both new domains to get rank?
舊站的PR是否能夠貢獻給新的子網域站台

A: PageRank is purely at a page level, so if you forums.domain.com has a high PageRank and links to new urls such as download.domain.com, that PageRank will flow immediately.
如果舊站有高PR, 並且指向新站, 新站很快就會有影響


不管子網域或次目錄等, 應該善用高PR的頁面, 逐步培養新的頁面

Q: Will it make any difference between a shared IP and a dedicated IP on SEO or search results, as opinions are divided on this aspect?
共用IP與獨立IP對於SEO有何影響?

A: most of the web is on shared IP addresses, so it doesn't make much sense for us to give those on dedicated IP addresses any advantages. That said, if your server is struggling with the load of your website, it might make sense to move to a dedicated server that helps to make sure that your users are happy when visiting your website.
沒有


PageRank與SERP並不會以IP來ranking, 只會以IP來判斷區域

Q: If I 301 redirect a well-ranked page to a new domain with the exact same content, will all of the rankings be replaced with the new domain once it has been indexed? How long after indexing can we expect the swap? And is the same thing true for 302s?
301 redirect是否會轉移PR, 那302呢?

A: If you're moving from one URL to another (even if it's on a different domain), ranking signals can be passed via a 301. A 302 is used for temporary redirects, so this is less likely to transfer ranking signals.
301 redirect可用於網站轉移, 302只是暫時


詳見 : SEO策略: PR5+PR4=PR6?

Q: Google takes 200 signals for ranking a query and PR is one among those. If that is the case, why is it still showed prominently on toolbar. Any possibility of seeing PR info dropped from Google toolbar?
之前說過Google使用200個因素來判斷SERP, 為何toolbar要顯示PR...

A: PageRank is just one signal that we use, but it's also one of the easiest metrics to show to users and an easy one to understand where the metrics come from. So I think it's something that still provides value to users and still makes sense to show to them in the Google Toolbar.
因為是一個最早也最簡單說明的因素...


本站文章已經就各種不同因素說明, 200個因素要說好久...慢慢再說明啦

Q: How often does your search algorithm change?
Google多常修正演算法?

A: We change the algorithms all the time - last year we had over 450 changes.
經常, 去年修正了超過450次


參考前文"SEO觀點 : SEO面對的是巨變的環境"

Q: Should I be using hyphens instead of underscores in my URLs to improve a page's rank?
我應該在URL使用底線還是中線?

A: For the time being, I would recommend still using hyphens instead of underscores. If you're already using underscores and that's working fine for you and your rankings, it's not worth switching. But if you're doing a new site, then I would go with hyphens.
中線較好


參考: SEO策略 : 如何產生更多的backlink?

Q: Does link: gives exactly the number of back links to a site?
link:這個指令是否列出所有backlink資料?

A: The link: operator only shows a sampling of links to a site, so it may not show all of the links that Google knows about. To find more information about backlinks to your own site, we give verified site owners more information about backlinks in Webmaster Tools:
http://www.google.com/support/webmasters/bin/answer.py?answer=55281
非也, 只是列出代表性, 並非所有backlink, 可以參考上述連結


只有在Webmaster Tools中的資料才是完整資料

Q: If my website "A", linking to website "B", and "B" linking back to "A" - am I going to be penalized? Does linking strategies still work?
如果A頁連到B, 然後B又連回A, 是否會被懲罰?

A: Participating in linking schemes to impact ranking is not advised it's against the webmaster guidelines.
http://google.com/support/webmasters/bin/answer.py?answer=66356
The best linking strategy is to create a site with unique content or services that people want to link to. Then publicize it.
想要影響ranking的話...是的


link schemes需要好好想想, 並非都不行, 但某些狀況不行, 請詳讀上述link

Q: Are you going to focus more on personalised search? If so, these results we currently look at won't really matter, as different sites will be at #1 for different people, right? - thank you :)
是否某人看到的SERP會異於他人看到的?

A: that's right -- with personalized search it's possible that each user sees slightly different search results. We try to make those search results unique and compelling enough to make the user go visit and stay on the sites listed -- so if your site is really awesome, chances are high that we'd be recommending it to users as well :-).
是的


參考 : "Personal search is coming : 個人化搜尋將全盤改變SEO"

(全文完)

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)



延續"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", "Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)", 我們繼續來談其他問題...

Q: In addition to a XML sitemap, does it make any sense to have also an HTML sitemap on the same website? Does HTML sitemap helps improve the rating?
除了XML的sitemap外, 有HTML的sitemap對於rating有幫助嗎?

A: A HTML sitemap file can help search engines, especially those that don't use XML Sitemap files. Also, the 404 widget in Webmaster Tools (which you can place on your 404 pages) will use "/sitemap.htm" and similar files to help users to find the content they're looking for. So yes, I would recommend making HTML sitemap files, however I'd focus on the user and not the search engines.
是的, 但是是指對使用者有幫助


HTML sitemap可與Webmaster Tools 404 pages結合(也就是當找不到網頁時), 可以指向HTML sitemap, 此舉可以讓讀者繼續停留在網頁上

Q: Recently went through a rebranding of our company name. The old domain name was successful in page ranking, however the new domain name has terrible page ranking. Do 301 redirects transfer the site equity from the old domain to new domain?
當移動網站時, 301 redirect可否轉移ranking?

A: This is a pretty common question, so we actually did a blog post about it recently. In short, 301's are the best way to retain users and search engine traffic when moving domains. You can find the full post here: http://googlewebmastercentral.blogspot.com/2008/04/best-practices-when-moving-your-site.html
移動網站時可參考上述連結


這個問題我們在"SEO策略: PR5+PR4=PR6?"也已經談過

Q: Is the bounce rate and speed taken into account when ranking a page? i.e. if you see a searcher click on a result then return very quickly and choose another result, is the first page ranked lower?
Bounce Rate是否會影響SERP?

A: assuming that users will be jumping out of a site like that, there's a high probability that they won't be willing to recommend it to others (or come back themselves). So yes, indirectly at least, if a site is made in a way that users run away right away, then chances are that we might not be recommending it as much as other sites that users like (and recommend to others).
間接來說, 是的


我們在"BounceRate是否影響SERP?"也談過啦

Q: Many believe that to rank well, you simply need "quality" backlinks. But how important is having your keywords in the , and throughout your site? Is keyword density of any importance to show what the page is about? What % is suggested?
有人認為高品質的backlink是重要因素, 並且關鍵字密度比例應如何?

A: Links are just one factor involved in Google's ranking of pages. We look at both on-page and off-page content, so what you have on your page can be an essential part of ranking. However, there is no recommended "keyword density." Your content should be high quality and written for users. If you try writing for search engines, the language can become very unnatural, which may end up hurting you more than it helps.
on-page與off-page都是重要因素, 沒什麼關鍵字密度比例問題, 只需產生高品質的內容...


請參考之前"SEO策略 : OnPage & OffPage SEO"

Q: Does inconsistent capitalization of URLs cause duplicate content issues and dilution of page rank? For example www.site.com/abc vs www.site.com/Abc. On Windows hosts, these are the same page, but are different pages on Unix hosts.
URL上的大小寫是否造成不同的URL?

A: based on the existing standards, URLs are case-sensitive, so yes, these would be seen as separate URLs. Since the content on the URLs is the same, we'll generally recognize that and only keep one of them. However, we'd recommend that you try to keep all links going to one version of the URL. Keep in mind that this also applies to robots.txt files.
是的, 如果出現大小寫不同的URL指向同一內容, 我們只留其一


在使用英文大小寫需注意, 在UNIX類的機器是大小寫不同, 而windows是大小寫視為相同, 最好在網址與robots.txt上都保持一慣性

Q: Does appearing high in image searches help improve the host sites PR and appearance on standard searches?
影像可被搜尋是否對PR有幫助?

A: Thanks for the question Andy. Well-optimized, relevant images could definitely help increase traffic to your site, especially with the introduction of Universal Search, where we mix images, videos, and more into the web search results.
是的, 影像可被搜尋可以增加流量


在網站的影像影音檔應注意檔案名稱與alt的內容, 以便能夠被搜尋

Q: Is there a META tag we can use to tell Google the geotarget (country) of a particular webpage?
在meta可否標示地區?

A: we don't have META geotargeting capability at this time.
沒有


要讓網頁能夠有地區或語文區分, 可參考
http://googlewebmastercentral.blogspot.com/2008/08/how-to-start-multilingual-site.html
http://googlewebmastercentral.blogspot.com/2007/10/better-geographic-choices-for.html
http://googlewebmastercentral.blogspot.com/2008/04/where-in-world-is-your-site.html

繼續閱讀"Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)



延續上一篇"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", 我們繼續來談其他問題...

Q: Do inbound links from other sites owned by the same company help or hurt rank? 自己公司的自我連結是否有益或有害於ranking?

A: I've see SEOs have 1000 or 2000 different domains and cross-link them. I definitely would not recommend that... if you run a sporting goods site, and you link to your sister companies for camping and tailgating equipment, that's good for the user...Put yourself in the user's seat, and do what makes sense for these links. Good luck! SEO式的胡亂連結並不推薦, 但合理的連結可以接受, 只要站在讀者的角度有意義的連結都算OK


最後那句Good luck...有點毛骨悚然吧, 有些好自為之的意涵, Google並非全然沒發現non-sense link, 只是要不要處理的問題, 如果被處理到...就全盤皆輸了...還是Good luck...保重吧, 合理的連結可以接受, 但是如果是無意義的大量連結就盡量避免吧

Q: Will Webmaster Tools ever give us an option to "disassociate" from sites that link to us? This feature exists in Yahoo's Site Explorer, but not Webmaster Tools. 是否在Webmaster Tools提供拒絕對方連結的功能?

A: So far because we work really hard to make it so that one site can't hurt another site, we haven't really offered this...So that's a challenge, and since we haven't seen a need for it yet, that's why we haven't offered it yet. 對方的連結並不會影響, 目前沒看出有這個需求


Google的演算法中, 他站的連結並無法去搞亂另外站台的ranking, 真的如此嗎?

Google的假設是壞站可能會連到好站, 但好站不會連到壞站, 但是如果你有透過交換連結, 你如何知道對方何時會變成壞站? 更多詳細內容, 我們後續再討論

Q: Does Google plan to let us see rankings/positions of keywords in the webmaster tool? 是否會在webmaster tool工具中, 可以查詢關鍵字的ranking?

A: We already do, for a limited number of keywords, in the "Top search queries" section of Webmaster Tools. While we generally don't comment on future features or plans, expanding this functionality is certainly an idea that's been suggested to us. 已經如此做了, 增強的功能也進行中


Google Webmaster Tool中的查詢關鍵字ranking, 目前功能並不完善, 顯示的排名也似乎與實際資料有落差

Q: Until recentley (the last six months or so) a high ranking was achievable by submitting articles to article directories (providing they were 40%-60% unique), it no longer seems to be the case. Have links from article sites been de-valued at all?
目前一些文章目錄網站的效果是否降低?

A: In my experience, not every article directory site is high-quality. Sometimes you see a ton of articles copied all over the place, and it's hard to even find original content on the site. The user experience for a lot of those article directory sites can be pretty bad too. So you'd see users landing on those sorts of pages have a bad experience.
If you're thinking of boosting your reputation and getting to be well-known, I might not start as the very first thing with an article directory. Sometimes it's nice to get to be known a little better before jumping in and submitting a ton of articles as the first thing.
有些文章目錄網站品質並不高, 並不建議利用文章目錄網站來提高曝光度


文章目錄網站品質不一, 所以在把文章丟到文章目錄網站前, 應先好好審視品質, 否則只是白費功夫, 但是優秀的文章目錄網站還是具有一定的效果

Q: For SEO, I'd like to improve my rankings by removing technical obstacles (starting with dynamic URL parameters), what are the most important site fixes to make and how can I document before and after success metrics using the Google Webmaster Tool?
如何有效找出網站技術缺失並修改?

A: To check the crawlability of your site, I would recommend crawling your site with a crawler like Xenu's Link Sleuth (freeware, for Windows). Doing that gives you a rough look at how search engines view your site and can point you towards areas where crawlers get stuck in a loop or start crawling duplicates based on the URL parameters.
應先了解搜尋機器如何抓取你的站台


以搜尋引擎的角度來審始自己的網站是很重要的, 可以利用Google工具或一些免費工具來看哪些抓取會有困難, 然後修正

Q: Are .gov and .edu back links still considered more "link juice" than the common back link?
如果有被政府或教育單位連接, 是否比一般連結有效?

A: This is a common misconception--you don't get any PageRank boost from having an .edu link or .gov link automatically.
沒有分別


常常有人認為被政府或教育單位連接, 其PageRank/SERP表現會更好, 其實不是, 只是可能因為能導入流量而引起效果, 與gov/edu並沒有直接關係

後續問題分析還有很多內容, 容後再續...繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年12月4日星期四

Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)



Google搜尋引擎真正的運作機制一直是一個黑盒子, 但在Live Chat Q&A當中, 可以透過一些對話來了解大家關心的重點及解答, 我們來研究這些對話並且解析出到底哪些才是搜尋引擎最佳化的真正核心問題...

Questions and answers from the third online Webmaster Chat from October 22, 2008記載了所有詳細的對話, 但是光是看這些對話只是一些公式化的官方回答, 我們一一來解析中間的奧妙
Q: What weight does the age of a site and the amount of time a domain is registered for have on it's search placement? 網域名稱的註冊時間與長短是否影響搜尋排名?

A: In the majority of cases, it actually doesn't matter ... I try never to rule a signal out completely, but I wouldn't obsess about it. 大部分情形, 這個因素並不太重要 ... 我認為沒有單一因素

從這個回答中, 我們可以知道網域名稱的註冊時間與長短是"其中"一個因素, 只是Matt Cutts認為還有許多因素互相影響...這有點廢話, 不過Matt Cutts並未否認網域名稱的註冊時間與長短的重要性就是了

網域名稱的註冊時間與長短是搜尋引擎最佳化的一個因素
Q: Recently, you removed this suggestion: "Submit your site to relevant directories such as the Open Directory Project and Yahoo!" from your guidelines. Is there any chance that you will be discounting these kinds of links for ranking value in future? 是否將網址送到開放目錄已經不再重要了?

A: There's always the chance that we'll discount directory links in the future...Right now we haven't changed how we're weighting directory links--we've only removed the directory suggestion from the webmaster guidelines. 以後一定會減低這些目錄的重要性, 但目前並未如此做

也就是將網址送到DMOZ等較有公信力的開放目錄還是有效果的
Q: Can you explain how the use of sub-domains helps / hurts a sites ranking? 次網域是否會減損或加強ranking?

A: Good question--do mean in terms of subdomains vs. subdirectories? Maybe we can talk through this one after the official presentations? 沒有正面回答

這個問題被評為好問題, 表示已經觸及了一些重點了, 到底是次網域好?還是子目錄好?哪個可以對於ranking有正面效果呢? 這篇文章"Advice on Subdomains vs. Subdirectories for SEO"可以參考, 以往sub-domain也許可以得到一些效果, 但現在sub-domain與sub-directory似乎已經具備相同效果, 但是有一點值得研究的是site-1.example.com與site-2.example.com到底算同一個site嗎?其ranking的分配與sub-directory如何取捨? 你可以參考以下文章

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory
Q: Since Google is against using ranking software (ie:WebCeO) to monitor SERP rankings, is there any plans on Google creating an approved, in-house rank check application that webmasters can use? Google是否會提供rank check軟體?

A: It's something that we've talked about. My concern is that sometimes people get too worried with paying attention to their "trophy phrase" and want to rank for that even if that's not the best phrase for them, or concentrating on one phrase to the exclusion of all the other stuff they rank for isn't the best idea. I think paying attention to server logs or analytics data gets you a really nice array of keywords that are practical to work on. But this is feedback that we've heard, and personally I think it would be nice if we offered this for some reasonable size of keywords. 回答得好長, 希望不要把重點放在ranking (廢話, 沒Google大家就不會計較ranking啦), 但是重點是可能會提供...以後吧

Google對於PageRank Checker大抵是不鼓勵、不反對, 當然最好的方式是使用Google Toolbar上的PageRank Display, 但因為還要安裝軟體, 所以並不是很方便, 我們提供的PageRank貼紙是一個不錯的選擇

而Google對於SERP的Ranking則是反對的態度, 不過有一些免費工具可以尋找SERP Ranking, 我們整理完後再陸續提供, 其他問題的解析, 我們後續也會繼續探討...

繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"


標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月19日星期三

Personal search is coming : 個人化搜尋將全盤改變SEO



各位不知是否在近期的Google Search上發現SERP有異於往常的結果? 第一個是Google Dance的頻率較為頻繁, 第二個是在不同的電腦搜尋可能出現不同的SERP, 這就是我們在之前文章"Search Engine Optimization 六大心法", "SEO觀點 : SEO面對的是巨變的環境"都提過的, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

Bruce ClayPubCon上提出了他的看法, 認為明年第一季Google的搜尋技術將有重大的改變, 這個改變就是個人化的搜尋, 而此改變將連帶影響SEO的技術

語意搜尋(Semantic Search)尚未完全成熟前, 個人化搜尋 (Personalized Search)是改善搜尋的一個方式, 也就是您的IP, Cookie以及搜尋歷史資料來決定SERP, 當使用"java"來搜尋時, 有可能是要尋找程式資源, 可能是要尋找渡假資料, 也可能是要尋找咖啡資料, 若使用目前的ranking方式, 並無法讓使用者快速找到訊息, 因此讓不同的SERP出現在使用者面前, 是Google明年即將進行的大工程

這個變革將改變了什麼? Pagerank不再只以backlink為主要依據, 因此黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌

除了個人化搜尋之外, Google在明年還將有其他重大技術改革, 因此持續觀察並調整策略是SEO的重要課題, 在明年結束前應該就會有確定的答案, 如果無法隨時跟上Google或其他搜尋業者的腳步, 可能就會在這波趨勢上滅頂...

參考: System and method for providing preferred language ordering of search results

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年11月5日星期三

SEO策略 : 如何產生更多的backlink?



前文"SEO實例 : 請大家都去撞牆"舉出了一個黑帽式的link策略, 也是目前SEO業者最常用的策略, 這個方式雖然目前有用, 但卻是走在鋼索上的作法, 也非常容易被任何人識破, 並且對於網站的信賴度會大幅降低

如果SEO業者只會使用這類策略, 會逐漸失去客戶的信任, 除了這個方式之外, 還能夠有哪些方式產生更多的link呢...

談到link generation, 可以分成兩大類: 自我頁面的link與外部頁面的link

(1)自我頁面的link就是當你的某篇文章談到某個主題, 而跟你之前文章關係密切, 你就可以在本文中去建立自我頁面link (如前段文章舉出先前文章提過的內容)

這樣的link策略可以讓各篇文章形成關聯, 但是前提是必須真正有關聯, 這種自我連結在計算PageRank及連結數也是有幫助的, 並且可以將相關文章串聯起來

(2)另外自我頁面的link就是部落格結構的tag(標籤), 這些tag也可以讓各個不同篇幅形成關聯

前者(1)自我頁面的link, 切記要注意anchor text, 盡量不要用"這一篇文章", "這裡"...一些無意義的文字, 最好使用很中肯的關鍵字或使用該篇文章的title, 這樣可以加強link的效果, 我們在"SEO策略 : OnPage & OffPage SEO"已經提過

後者(2)自我頁面的link也就是部落格結構的tag(標籤)

儘量不要使用如

"WebsiteOptimization" 或
"Website_optimization"

而要使用

"Website Optimization" 或
"Website-optimization"

因為前者tag搜尋引擎不一定能夠正確解析(parse)成兩個字

Website optimization不一定等於WebsiteOptimization或Website_optimization

但後者搜尋引擎可以解析

Website optimization等於Website Optimization或Website-optimization

也就是空格與中線("-")是搜尋引擎比較能夠清楚分隔英文的方式

再來談外部頁面的link, 就是指其他網站連結到你網頁的link, 方式敘述如下

(3)Social bookmark

這裡指的是社交網路上的link, 如網路書籤, 部落格社群, web2.0回覆, 論壇簽名檔...等

進行這類的link活動, 需要特別注意, 因為稍不留意會由白帽變成灰帽或黑帽

黑帽與灰帽式就是大量毫無意義的自我增加link, 或大量製造相同或類似的link, 白帽,灰帽或黑帽的界線對於電腦而言很難畫分, 但可以用人工方式去判讀這些link是否惡意製造

(4)再來就是跟內容息息相關的, 如果你能夠提供資訊性的、新聞性的、幽默性的、另類性的、工具性的、插件性的內容的話, 也可以引起其他人爭相link你的網頁

但是說起來容易, 不同類型的網站要提供以上的內容方式不盡相同, 其難度也相當高

舉個例子, 本站提供了本土化的PageRank貼紙, 就在短短三個月的時間增加了兩萬多個backlink, 並且許多網站都相繼推廣, 因為他可以隨時監控各頁面的PR值, 讓您瀏覽網頁時就可以注意PR變化而採取不同的SEO策略...

雖然只是一個小小的工具, 但是卻能夠發揮不小的作用

資訊性的、新聞性的、幽默性的、另類性的、工具性的、插件性的內容不能是普遍大家都知道的, 必須具備獨特性, 這些內容的產生除了必須時常注意網路上相關網站的動向之外, 最重要的就是多讀紙本的書籍

許多人由於網路上瀏覽習慣養成後, 可能已經不再買書看書了, 但是許多正確而有用的資訊還是必須不斷大量的透過傳統的閱讀來取得的...

如果您能夠依照以上的SEO策略來進行, 相信可以用白帽式的方法來產生不少有用的backlink

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月21日星期二

SEO實例 : 請大家都去撞牆

現在談一個讓大家都想去撞牆的實例, 您猜猜如下面這樣頁面的網站他的PageRank到底有多少? 您沒有看錯...頁面就是只有一個畫面加上一個唸經式的音樂, 完全沒有內容或者連結...




以上這個垃圾網站的PageRank竟然高達6...

經過PageRank Hijack的觀察, 其PageRank也是真的...

再來透過Google與Yahoo的backlink資料, 其Google的backlink有812個, Yahoo的backlink有18,779個

再經過這些link的連結往下看...

原來就是透過SEO業者最喜歡使用的, 在各網站張貼垃圾link或簽名檔, 只是這個站長時間應該是多得早晚都在數螞蟻, 堅忍不拔的把垃圾link拱到了上萬個...這個網站是目前看過垃圾聯結玩得最過火的

由這個例子可以瞭解, Google的PageRank演算法已經出現了很大的漏洞, 因為他分不出來推薦聯結與垃圾聯結 (但不表示未來不會修補)

但是雖然他把PageRank推到了6, 但是因為網頁幾乎沒有內容, 因此幾乎沒有SERP的表現

這種垃圾link的方式, 在目前屬於有效的黑帽式SEO, 但是卻破壞了該網站的creditability(可信度)

這個可笑的網站在DMOZ ODP的網站目錄中將之分類為 Top: Recreation: Humor: Useless_Pages, 也就是"Basically, pages with no purpose other than to be funny, odd, strange or stupid."

原來笨到極點的網站還可以被收錄來當笑話...哈哈, 只是Google沒注意到這點, 忘了調整PR, 還是它是屬於笑話第六級? 不得而知...

相信該網站如此作法, 應該是想高價賣出網域, 但是如果知道內情, 應該不會有正常的企業會想購買

而且只需簡單幾個步驟就可以知道這個PR6是怎麼來的, 因此雖然目前尚屬有效提高PR的作法, 但是卻很可能鬧得太出名而被搜尋引擎除名

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月17日星期五

SEO觀點 : Google Analytics & PageRank



對於免費提供給網站站長使用Google Analytics, 到底Google打什麼如意算盤? 其背後的目的早已經被許多人懷疑, 因為這些工具在一般的網路公司都非屬於免費服務, 使用或不使用Google Analytics對於PageRank或SERP是否有任何影響?

Google在近年推出許多大部頭的免費服務, 當然天下沒有白吃的午餐, 既然是免費的, Google當然希望從中取得除了金錢之外的東西, 或者從third party取得其他的利益

這兩篇文章就談到了這些議題:

Why Google Analytics might be bad for your PageRank
Google's Gain in Google Analytics

Google在提供Analytics的背後獲得了什麼?

(1)了解網站的流量/來源, 這些資料就成了分析線上廣告的最好資料
(2)透過這些資料可以精準的定義PageRank, 讓SERP更加符合使用者需求

這兩項資料是所有網路業者夢寐以求的, 而Google就是具有先天優勢來取得, 目前Yahoo正朝著同樣的方向前進

因此, 如果您的網站並非大流量, 而您正在進行系列的SEO作業, 就必須思考是否要使用Google Analytics, 因為可能會曝露您網站的缺點, 如果您的網站流量不小, 那就趕緊使用Google Analytics, 讓您的PageRank/SERP更符合實際狀況

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年10月1日星期三

SEO策略: PR5+PR4=PR6?

許多網站會碰到一個類似的網址問題, 就是網址前面有無WWW都可以連到同樣的站台, 更有些網站使用多個網址指向同一個站台, 當這樣的狀況產生時對於網頁的評分,backlink的計算及SERP的結果到底有哪些影響呢?

有些專家指出, 若您有兩個網址(如www.dns.com.tw與dns.com.tw)都指向同一個網站, 而其PR各為5與4的話, 如果您把這兩個整合為一, 將可獲得一個PR6的站台...真的假的?

我們實際測試的結果, 答案是否定的, 但是 ... 裡面還有許多值得思考的地方

不同網址指向同一個網站, 有幾種情況:

(1)使用DNS Server的A Record或CNAME來指向同一個Server(IP), 並在Apache或IIS設定允許該URL(或沒設定禁止, 當然太開放會引發另外問題, 他文再談)

如果該Server有www.dns.com.tw/blog, 則也有dns.com.tw/blog, 或有www.another-domain-name.com/blog

(2)使用DNS Cloaking Redirect來轉址

當使用虛擬主機與third party DNS Service時, 可能就無法使用DNS Server的A Record或CNAME來指向同一個Server(IP), 這時候DNS Cloaking Redirect就可能被使用

(3)使用302 Redirect與301 Redirect, 及meta refresh

302 Redirect又有on-domain/off-domain之分

所謂on-domain 302 Redirect例如將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.dns.com.tw/prog1, 或反向轉

off-domain 302 Redirect則是將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.another-domain-name.com, 或反向轉

301 Redirect與302 Redirect的分別是: 301 Redirect為"永久轉址", 302 Redirect為"暫時轉址", 兩者對使用者沒有差別, 但是對於search engine的差別是, 被301 Redirect的page就不被index

如http://athletics.mlb.com被302 Redirect到http://oakland.athletics.mlb.com/index.jsp?c_id=oak, 如果您使用"oakland a’s"當關鍵字在Google Search, 會看到athletics.mlb.com

根據Yahoo與Google的文件, 說明基本原則如下

Yahoo在處理301,302,meta refresh上, 其處理方式為:

- 使用301, 302由domain A->domain B, 則index domain B
- 使用302由domain A URL->domain A其他URL, 則index前者
- 使用301由domain A URL->domain A其他URL, 則index較上層的URL
- Yahoo處理meta refresh為301 redirect

Google在處理301,302,meta refresh上, 其處理方式為:

- Google處理meta refresh為302 redirect
- 使用302 redirect, 則index source, 也就是index來源頁
- 使用301 redirect, 則index destination, 也就是index目的頁

但實際上, Google可能會處理off-domain 302 Redirect與301 Redirect為相同, 也就是URL A->URL B的話, URL A就不index, 而以URL B為目標

因此這麼多的狀況下, PR與backlink的轉移就不是redirect就會轉嫁, 不同的search engine在處理這些問題上也有不同的作法, 所以PR5+PR4=PR6? 答案是Yes and NO, 必須以長期與短期效益來仔細分析才能獲得最佳狀態

參考工具: Redirect Checker

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月27日星期六

Google PageRank 於9/27陸續更新

上次最近的Google PageRank Update在2008/7/24左右, 當時本部落格由零變四, 現在Google的各Data Center又陸續開始更新PageRank, 目前看到本部落格內頁的PR部分已經由零到三, 是否最後更新會有什麼驚喜...

Google每次更新PageRank都會造成不小的震盪, 如去年對於paid link的處罰, 讓許多大站都應聲倒地, 甚至於還有一些重量級人士說要出來抗議抵制, 最後都是沒有下文

本站也是無辜受到牽連, PR由五被降到三, 原因也是被Google判定為銷售link, 後來經過說明後Google又將本站PR調回原值, 因此不管是PR升值或降值, 其實一定有許多都可能與事實不符的情事

也曾經看到許多網站在某些SERP的表現優秀, 但一經檢驗就發現許多黑帽SEO的證明, 有些明明內容精彩卻又排在SERP非常後面的位置, Google的演算法顯然還有很多不完善的地方

但是不管如何, 大家就靜候PageRank的最後更新結果吧, 預計應該在幾天到一週的時間會完成所有更新

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月26日星期五

什麼是PageRank Hijack?

顧名思義"PageRank Hijack"就是PageRank綁架, 也就是所謂的Fake PageRank

再說清楚一些就是利用黑帽方式來欺騙search engine, 在PageRank的評分上創造出假的數值

例如您手上有一個網域your-domain-name.com, 原本站台www.your-domain-name.com其PageRank為零, 但利用search engine的演算法漏洞, 把www.your-domain-name.com快速提升到零以上

這樣的手法有何目的? 我們如何辨別Hijacked PageRank或Fake PageRank?

在說明整個內容之前, 我先舉一個發生在今年七八月間的實例 (詳細人名等資料就不公開)

話說有一個可能缺錢缺到發慌的人, 他去註冊一個過期的網域名稱 (Domain Name), 這個網域名稱在2002年到2005年被使用, 2005年三月之後就不再營運, 後來就被這位仁兄在2008年七月註冊起來, 他利用URL Redirect的方式把該URL的PageRank造假到PR=7, 剛好因為Google PR Update在2008年七月底左右進行全面更新, 所以這位仁兄很快就讓該URL達到PR7, 在短短幾天就讓他幸運的把PR0->PR7, 還在網路引起許多不熟悉search engine的人稱羨

透過URL Redirect到別人的網站後, 等待Google PR Update後, 再把URL Redirect回自己的網站, 此時就看似擁有一個高PR的網站, 目的就是要高價銷售網域名稱

這位仁兄得逞之後, 在DNForum就張貼廣告開始大吹特吹, 說他有一個特好的網域名稱要割愛, 結果被DNForum的專業級人士吐槽

為什麼會被吐槽? 因為手法太兩光了, 兩光在哪裡?

(1)對search engine有點了解的人都知道, PR0->PR7在不到一個月的時間完成是不可能的
(2)Google在2005年以後已經修改演算法在處理PageRank Hijack的問題
(3)Wayback Machine可以把網站歷程記錄, 該網站中間兩年斷掉, 不可能快速恢復PR
(4)使用Google搜尋技巧就可以破解Fake PageRank

雖然網路上有一些PageRank Validation Tool, 但大多不好用, 其實Google本身就可以確認(如下)

在輸入欄打入 info:URL-to-Check

URL-to-Check就是指要查詢的URL



如果經上面方式查不到資料或上圖中的(1)(2)的URL不是同一個, 就是經過URL Redirect, 而URL 2的PageRank就會被URL 1所綁架

但是因為Google演算法的改版後, 已經對Fake PageRank做篩選, 因此URL Redirect並不保證能夠綁架PageRank

也就是說, URL Redirect不一定能綁架PageRank, 就算你綁架了別人的PageRank, 也會輕易的被辨識出來

況且當綁架別人網站的PageRank後, 等於向search engine說你的網站是不存在的, 因此所有內容就不會被index

最後一句話

好好做人, 不要使用詐欺的手段來造假, 魔高一尺 ... 道高一丈

後續再找時間來聊Fake PageRank Detecting Algorithm ...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月22日星期一

SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗

當您在網頁上瀏覽資料時, 眼光到底聚焦在什麼地方, 一直是科學家有興趣的題目, 如果能夠統計出一個可靠的資訊, 不僅對網路廣告商是一大福音, 對於研究SEO的人也可以有不少的助益, 我們就來研究看看這些結果與您的習慣有哪些差異 ...

這篇"Distribution of Clicks on Google’s SERPs"文章, 實驗認為網路搜尋結果(SERP, Search Engine Results Page)的前幾個項目(約是第一到第三名)會佔用大部分的目光, 依序往後遞減, 但最後一個項目卻反常的會被瀏覽者注目, 而在點選率而言, 中間部分項目(第七項)的點選大多在瀏覽整頁後才進行點選

當然以上的數據一定會有差池, 但是說明了一個趨勢:

-- 排名在SERP頁面的前三名, 被注目的比例較高
-- 排名在SERP頁面的中段, 反而會在最後才被點選

其實以上數據還牽涉到顯示項目的Title與Description, 大部分人瀏覽SERP時, 會先看Title, 在螢幕上可以看到的Title看完, 再往下滑(Scroll)看其他內容, 有些情況看到該Title剛好就是您要的就進行Click, 如果Title不太清楚, 再去讀Description, 而上面的趨勢顯示的是: 大家都不太有耐心, 因此看完前幾項就會往下滑, 至於是否能夠概括所有使用者行為, 就見仁見智了 ...

另外一個Eye Tracking的研究是Microsoft的"An eye-tracking study of information usage in Web search:Variations in target position and contextual snippet length", 這個研究與上述結果大同小異, 也是SERP前幾項較容易被注意, 但稍有不同的是實驗顯示, Description太短的比較不會被點選, 而另一個特別的是"第七項" ...

當SERP頁面被來回瀏覽後, 第七項目被點選的機率又逐漸高出後面項目, 真的是Lucky Seven ...

另外一篇"F-Shaped Pattern For Reading Web Content"則研究不同類型的網頁, 來看使用者目光的聚焦度, 該研究認為使用者在瀏覽網頁時會因網頁類別的不同而有差異

網友在瀏覽一般文章與電子商務內容時會有呈現類似"F"形狀的聚焦(如下圖1,2), 而瀏覽網路查詢頁面時會呈現"E"形狀的聚焦(如下圖3), 所以使用者幾乎不太觀看一般文章與電子商務內容的下半部, 但網路查詢頁面(SERP)反而是中間部分常會被忽略, 這個結果與上兩個實驗有異曲同工之妙

(圖1)


(圖2)


(圖3)


這篇"Google’s Golden Triangle"也提及類似的聚焦結果, 不過這種結果似乎不同年代會或多或少有差異, 如這篇在2005年與2008年的資料顯示, 使用者越來越沒耐心看完所有資料了 ...

這篇"Eye tracking and online search: Lessons learned and challenges ahead"更具體的說明了一些數字, 96%的查詢結果, 只有第一頁會被瀏覽, 並且只有前幾個項目會被點選, 如果前幾個點選沒有意義, 則使用者會放棄該查詢結果, 並且在Google與Yahoo的搜尋行為分析中顯示, Google的使用者會花較多時間在閱讀查詢結果內容

最後總結是: SERP的結果如果不能在前三名, 倒不如列在該頁底部, 並且頁面的Title文字敘述應該更加清楚明瞭, 以增加被點選的機率


標籤: , , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月17日星期三

SEO : inception date的意義

所謂inception的意思是初始, inception date就是初始日期, 一個網頁文件的初始日期對SERP(Search Engine Results Page)的影響在前文已經討論過, 我們現在來看看Google如何決定網頁文件的inception date ...

根據Google的專利文件US 7,346,839 B2的說明, inception date由好幾個方式來決定

(1)由搜尋引擎抓到該網頁文件的日期
(2)由該網頁文件所在domain之註冊日期
(3)該網頁文件被其他網頁文件關聯的日期
(4)由儲存該網頁文件的伺服器time stamp

找出以上日期後, 依最早的日期或經演算法判定該網頁文件之初始日期, 這個日期就會影響該網頁文件的評分, 新網頁文件有10個backlink, 會比十年前的網頁文件具有100個backlink來得好 ... 但是也有可能會有例外

什麼時候會出現例外? 當演算法由初始日期與backlink的計算中, 發現異常數字時, 會將之歸類為spam, 這個時候就會降低原本的評分

而什麼是異常數字? search engine會由正常的網頁文件中的inception date與backlink, 算出一個參考值, 如果某網頁文件的backlink成長率超出一個範圍, 就是異常, 至於正常成長率是多少? 超出的範圍是多少? 這個資料並沒有揭露, 但是我們可以由幾個方式了解

(1)一些PR同等級而且值得信賴的網頁的backlink平均成長率
(2)自己網頁的成長率曲線 (參考)

由他站的成長曲線可以知道曲度(slope), 由自己網頁的成長曲線可以知道是否平滑, 如果往上成長的曲度合理並且平滑, 大致就沒麼問題, 但是一定會有被誤判的情況, 不過如果時間拉長, 以上的計算不失為蠻精準的演算法


標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月16日星期二

SEO : SERP的影響公式探討

在之前文章"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"談到時間因素會對SERP (Search Engine Results Page)有所影響, 到底是怎麼個影響法呢? 我們由Google的專利資料中來研究一下 ...

第一個公式:


其中
H: History-adjusted link score
L: Link score given to the document (也就是PageRank U.S. Pat.No. 6285999)
F: elapsed time measured from the inception date associated with the document
(詳細關於inception date, 後續再來談)

由以上的公式可以知道, 剛開始link score會放大, 然後慢慢以平滑曲線遞減
L=5, F=1, H=10.47
L=5, F=2, H=8.30
L=5, F=3, H=7.15
L=5, F=4, H=6.42
...
L=5, F=59, H=2.80
L=5, F=60, H=2.79

但是某些SERP data set的average date並無太大差異的情況下, 新產生的網頁就未必有優秀的SERP,所以你會看到某些查詢結果幾乎不太變動, 但某些查詢結果卻一日數變, 就是這個因素

第二個公式:


其中
U: Update score
f: a function, such as a sum or weighted sum
UF: Update frequency score
UA: Update amount score

也就是網頁的更新頻率與更新量會來決定U, 同樣的如果SERP data set的average date-of-change並無太大差異的情況下, 以上公式就不會去影響SERP

至於search engine如何知道哪個網頁有更新呢? 更新量如何呢? 基本上search engine不可能把所有頁面都全部cache, 某些頁面就以signature來判斷(例如在頁頭抓一個字,頁中抓一個字,頁尾抓一個字,如此就能產生該頁面的signature), 當signature變動時, 就知道本頁已經update

至於update amount就可以用多個signature來判斷, 例如一個頁面中的10個signature有3個已經變動, 就比10個signature中有2個變動有較多的update amount, 當然不一定精準, 但平均而言差異不大

所以根據你下的關鍵字所產生的SERP, 其特性到底是哪個種類?

是否會因時間而影響? 如果不會的話, 新網頁就很難打破這個SERP

是否會因更新頻率與更新量而影響? 如果不會的話, 你再如何時常更新也於事無補

因此瞭解了以上的公式, 對您網頁的SEO多少有些助益

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年9月5日星期五

SEO for Dummies : SEO白癡手冊

許多經營部落格的人, 常常剛開始充滿熱情, 但寫到最後因為幾乎沒有人看而退出江湖, 其中不乏有許多精彩內容的部落格, 為何沒有人看? 因為經營部落格的方式錯誤, 並且沒有做到基本的SEO (Search Engine Optimization)

這篇文章來談談以非技術觀點下, 您可以輕易運用的SEO方式, 因為連白癡都看得懂, 故名為"SEO for Dummies : SEO白癡手冊", 所以沒有任何特別誣蔑的意涵 ...

由於本篇文章定位為入門, 所以必須把SEO先做最簡單的解釋

SEO(Search Engine Optimization)就是指運用一些方式, 把您的網頁調整成搜尋引擎喜歡的方式, 一但被搜尋引擎喜歡以後, 就比較容易被網友找到, 當然流量就會增加

談到流量, 我們先談談網友到訪您的部落格的三種方式 :

(1)在瀏覽軟體打入您部落格的網址, 或由他們的"我的最愛"進入您的部落格
(2)透過別人的網頁上的連結, 點選後進入您的部落格
(3)透過搜尋引擎打入您部落格的名稱或關鍵字, 由搜尋引擎連到您的部落格

另外一種是搜尋引擎或網路機器人, 透過指令式方式進入您的部落格, 這點與本文無關, 我們就不談

因此以上三種方式就決定了您的部落格的流量

所以建議剛剛成立部落格的人, 最好先使用大型入口網站的部落格服務, 等流量到達一個程度後, 再另外擁有自己網址(註一)的部落格 (如本站 : http://www.dns.com.tw/blog), 這樣才能累積自己網址的信用度(註二)

(註一:以上姑且以網址代替網域名稱, 以方便入門者瞭解)
(註二:所謂信用度就是搜尋引擎信任您的部落格網址的程度, 當擁有自己網址, 這個信用度才屬於您的)

為何要先使用大型入口網站的部落格服務? 因為您的部落格文章至少會出現在他們網頁(如最新部落格文章...), 也就藉由上面三種流量來源的(2), 會漸漸增加您的流量, 而您的內容如果不錯, 被別人收入他的"我的最愛", 就有了(1)的流量

所以內容不錯以後, (1)(2)的流量就會自然產生

但是上面三種流量來源的(3), 就必須靠自己的調整了, 這個調整的動作就是在做SEO

哪些動作要做呢? 整理如下:

(1)談大家可能有興趣, 但是經過網路搜尋後, 大家比較少談的主題
這點困難度稍高, 但如果能就自己專業範圍內, 盡量比別人早一步談這個主題, 可以建立權威性, 並且內容新鮮度高, 可以容易被搜尋到, 如果有興趣看細節, 詳細內容在: "Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"

(2)最重要的關鍵字一定要出現在"主題(title)"上, 並且如果長度允許, 最好中英文都有, 如本篇的主題:"SEO for Dummies : SEO白癡手冊"

(3)在內文中, 認為有可能可當關鍵字的字串, 以<h1>...</h1>, <h2>...</h2>等tag夾起來, 會顯示如下

SEO for Dummies : SEO白癡手冊

... 但是不要用得太離譜

(4)使用Social bookmark (如funP, Hemidemi ...), 把您的文章自我推薦上去

(5)將您的部落格網址推薦到DMOZ, Google Directory, Yahoo Directory

(6)與朋友較優質的部落格互相交換連結
與其他網站交換連結時必須慎重, 因為根據Google的判定, Bad page會連到Good page, 但是Good page不會連到Bad page, 因此如果您連到一個被Google判定為Bad page的話, 您也會被受到牽連

(7)使用其他的社交網路工具 (如部落格觀察...)

(8)使用PageRank checker貼紙, 可以隨時觀察自己部落格的頁面PR值變化, 當有不錯PR值時, 可以適度在該頁面增加連到自己其他相關內容 (但是如果內容是八竿子打不著的就不必了)

關於PageRank (PR) 如果有興趣可以參考 : Pagerank 演算法研究

(9)使用Counter (如http://www.shinystat.com/), 可以觀察詳細的流量狀況, 或稍微進階者可以使用Google Webmaster管理員工具

(10)Anchor link策略
不管建立Forward link(往別人頁面的連結)或Backlink(連回自己頁面的連結), 在建立連結時最忌諱使用以下的樣子:

<A Href="http://www.dns.com.tw">這一篇可以參考</A>

因為以上"這一篇可以參考"這個字串, 與連往的站台一點都不相關, 這個字串就好像向搜尋引擎介紹一樣, 這個介紹詞就成了此互連網頁的關聯, 不管是Forward link或Backlink都要仔細編輯這個字串

(11)使用NoFollow
在一個頁面中雖然可以有無數的Forward link(往別人頁面的連結), Google也都可以抓到, 但是一個頁面的Forward link最好在數目100以下, 並且如果您不希望Google把某些Forward link也算下去, 您可以使用如下的語法

<A Href="http://www.yahoo.com" rel="NoFollow">Yahoo</A>

減少一個頁面中的Forward link數目, 可以防止被不必要的頁面去瓜分評分

當然以上的方式如果要效果明顯, 前提是您的部落格或網站必須要有好的內容, 如果沒有好的內容, 神仙都沒辦法 (之前文章有提到過 : "網路行銷/網路營銷 -- 內容為王"), 但是除了有好的內容外, 如果能夠依照上述方式好好調整, 相信對於流量會有不錯的改善

以上盡量以比較淺顯的方式, 來說明如何讓不懂技術的人來進行SEO, 如果有任何意見或建議, 歡迎多多指教啦 ...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Query Deserves Freshness (QDF) : 由內容新鮮度談SERP

什麼是Query Deserves Freshness?

就是在搜尋時SERP會因為內容的age而出現不同的結果, 也就是說, 新的頁面在某一段時間內, 其SERP會比舊資料更有優勢, 那到底這段時間多長? 這種現象是否合理? 與其他SERP規則有無牴觸?

我們先撇開所有既有的想法, 純粹由使用者觀點來看的話, 使用者當然希望找到最新的資料, 並且要找到最正確的資料

如果所有的網路文章撰寫者都是很負責任的話, 當然最新的資料等於最正確的資料是可以成立的, 但是 ... 網路文章撰寫者都是很負責任的嗎? 所以很有可能新資料有可能是不成熟的

如果您看過之前文章, 應該會同意我的看法, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

話說回來, 另外有些資訊是不會變的, 這時反而舊資料是可能比較權威的, 例如許多wikipedia上的資料初始日期是很早的, 並且後續還有許多更新

到底Google在處理這些資料時, 如何判斷哪個頁面是fresh(新鮮)? 哪個頁面是stale(陳舊)?

在Google的專利資料顯示了許多影響SERP的因素: "Information retrieval based on historical data", 對於想要研究SEO的人應該好好閱讀, 這裡面就隱含了所有影響SERP與PageRank的因素

如果能夠把Google近期的專利都讀完, 大概您對search engine就能有更深一層的瞭解了, 以下是相關資料(html與pdf), 如果您沒有時間讀那麼多密密麻麻的資料, 我在後續文章會再說明這些內容

DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE
Publication number: US 2007/0094254 A1
Filing date: Nov 20, 2006

DOCUMENT SCORING BASED ON DOCUMENT CONTENT
Publication number: US 2007/0100817 A1
Filing date: Nov 21, 2006

DOCUMENT SCORING BASED ON QUERY ANALYSIS
Publication number: US 2007/0088692 A1
Filing date: Nov 22, 2006

DOCUMENT SCORING BASED ON LINK-BASED CRITERIA
Publication number: US 2007/0094255 A1
Filing date: Nov 30, 2006

DOCUMENT SCORING BASED ON TRAFFIC ASSOCIATED WITH A DOCUMENT
Publication number: US 2007/0088693 A1
Filing date: Nov 30, 2006

Personalizing anchor text scores in a search engine
Patent number: 7260573
Filing date: May 17, 2004
Issue date: Aug 21, 2007

Information retrieval based on historical data
Patent number: 7346839
Filing date: Dec 31, 2003
Issue date: Mar 18, 2008

光從上面的專利標題, INCEPTION DATE, DOCUMENT CONTENT, QUERY ANALYSIS, LINK-BASED CRITERIA, TRAFFIC ASSOCIATED WITH A DOCUMENT, anchor text, 您大概就可以知道Google在對網頁評分的標準了, 這些因素在之前一系列SEO文章也都提過

話題扯遠了 ... 我們回到主題, 本篇只談文章的新鮮度

現在假設有一篇熱呼呼的文章剛被Google抓取, 姑且稱網頁A其初始時間(INCEPTION DATE)為2008.09.05 12:00:00, 這篇文章會不會出現在SERP的第一頁, 就完全取決於query analysis後, 網頁A內容與keyword的相關性緊密度評分, 如果評分後有其他網頁更優勢, 當然網頁A就被排擠下來

如果相關性緊密度評分相等或相近, 並且這個SERP set中的其他頁面, 其他評分並不顯著優勢(如backlink), 這時網頁A就可能出現在SERP的第一頁, 但是這個優勢會隨著時間因素而遞減(公式後續再談)

網頁A如果在因時間因素遞減下, 但增加了自然的backlink, 就可能繼續存在SERP第一頁

網頁A如果在因時間因素遞減下, 沒有增加自然的backlink, 若其他頁面也同樣沒有增加自然的backlink, 網頁A也可能繼續存在SERP第一頁

對於Google而言, 網頁A如果在一週內有10個自然的backlink, 其link analysis評分當然比存在一年的網頁B具有30個backlink要優秀, 但是這裡強調的是"自然的backlink", 非自然的backlink就可能會被演算法抓出, 以人為的方式降級或列入sandbox中

這也就是為什麼一些很新的網頁會出現在SERP第一頁的原因, 但是別太高興, 如果內容不好, 就會被其他相關文章擠下去

有興趣的話, 請期待後續文章啦 ...

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月29日星期五

Semantic Ranking : Search Engine 的另一扇窗

由前文"Pagerank 演算法研究"與"SERP v.s. PageRank : PR值與搜尋排前的關係", 我們瞭解了影響網路搜尋結果的幾個因素

但是網頁的互相連結並無法表示支持的程度, 目前PageRank計算一概以均分的方式, 而網頁互相連結也無法表示網頁間的關聯, 如科技類的網頁A連接到科技類的網頁B, 對於網頁的重要度評比, 當然應該比生活類的網頁C連接到科技類的網頁B要來的重要

而使用網頁結構與keyword的關聯性來產生SERP的結果, 也有可能出現錯誤的狀況, 比如keyword為"SERP PageRank" 與 "PageRank SERP", 就可能產生不同的SERP結果, 同義與相近詞也無法透過搜尋有效率的尋找

這些都是由於PageRank與SERP目前都尚未真正融入Semantic語意技術, 沒有語意技術實在很難以分析這麼多看似不相關的資料 ...

"Context-Aware Semantic Association Ranking", "Ranking Complex Relationships on the Semantic Web", "Ontology-Driven Semantic Ranking for Natural Language Disambiguation in the OntoNL Framework" ... 等等文章就提出了Semantic Ranking的概念, 希望以語意的關聯來建立網頁間的關係, 如果您希望看更多訊息, 可以用"semantic ranking"去進行搜尋

什麼是Semantic Ranking? 就是用語意技術去評比網頁, 當您下一個關鍵字, 網頁就可以用semantic ranking的大小來依序顯示, 不像現在只是純粹比對字串

當網頁間存在Semantic Connectivity (語意連接性) 或Semantic Similarity (語意相似性), 就是存在Semantic Association (語意關聯性)

例如: 當網頁A的內容討論車子的性能, 網頁B的內容討論重型機車的性能, 網頁C的內容討論BMW汽車的性能, 網頁D的內容討論寶馬汽車的性能, 則網頁A-C,A-D互相具有Semantic Connectivity, 網頁C,D互相具有Semantic Similarity, 而網頁B則可透過另外網頁與網頁A產生另外一個Semantic Connectivity

不過可惜的是以舊有的網頁語法, 如果沒有使用RDF (Resource Description Framework), 比較困難建立這些關係, 如何在既有的HTML語法下, 或簡化使用RDF的方式來改善PageRank與SERP是Search engine的一個困難的難題

如果這個問題可以解決的話, Search engine的市場就可能重新洗牌, SEO的方式可能就全面改觀了, 拭目以待吧 ...

標籤: , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SEO : Honesty is the best policy (誠實是SEO最佳策略)

如果您去搜尋引擎尋找SEO (Search Engine Optimization) 的資料, 大概讓您一個月不吃不喝也看不完, 但是大多內容都把SEO弄得很複雜, 我在如本站一系列的SEO探討文章中, 盡量以淺顯的說明來讓您瞭解

也許您會問 : 為啥你把別人拿來吃飯的傢伙都抖出來了? 其實主要的目的是導正一些不正常的現象, 相信大家都不希望找到一堆垃圾, 我每天都需要找資料研究, 如果找到的資料都不是需要的, 浪費的時間是很可觀的, 本身就會變成受害者

除此之外, 還有更重要的原因 ... 一個真正的原因 ...

各Search engine持續的在修正演算法, 現在的SEO理論當然過一陣子就會失效, 因此目前把一些SEO不能說的秘密說出來, 並不會影響正派經營SEO或持續研究探討SEO的業者, 而且讓更多人瞭解SEO, 還能讓大家重視SEO, 因此披露SEO的正確知識, 一來可以讓search engine抓到該抓的資料, 二來還可以擴大SEO業者的大餅

所以並沒有抖出別人吃飯傢伙的問題

前面文章一直在談 -- 內容與結構, 如果大家都能稟承"誠實是SEO最佳策略", 針對內容與結構好好審視的話, 那結果對所有網路使用者都是好事一樁

因此不要再把SEO當成很神秘的話題, 讓SEO成為一個研究網站正確的結構提升網站品質的一個議題, 將是網路發展的一個正確方向

也許某一天本站PR/SERP會變很差, 也許這些文章都沒人看, 反正已經在網路上盡力貢獻一己之力了, 結果就讓他自然產生了, Honesty is the best policy ... 共勉之

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

SERP v.s. PageRank : PR值與搜尋排前的關係

許多搞SEO (Search Engine Optimization) 的人一定都有一個困惑:為什麼許多搜尋結果, 反而PR值低的會排在前面?

在前文"SERP : Search Engine Results Page"已經提到, PR值與SERP不一定成正比, 也許您會問 : 那花那麼多功夫把PR值提高, 不是白費功夫了嗎? 有那麼多的backlink不也是如夢一場了嗎?

大家真的都被Google耍弄了嗎? 事實真像如何呢? 繼續往下看就能解開您的疑惑了 ...

首先解釋一下, 我們由前文"Pagerank 演算法研究"知道, PR值完全看有多少網頁投票給您, 這些投票給您的網頁其本身的質量與該頁的連結數目決定了您的PR值, 這個值跟keyword無關 (真的無關嗎?我們後續會來研究)

而SERP主要由哪些因素決定呢?

(1)keyword在您頁面的密度相關性
(2)您頁面被Google index的時間
(3)PR值

在說明以上因素之前, 我先用近日文章的SERP來說明:

"WREL : Wireless Resonant Energy Link 未來的無線電力傳輸"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Wireless Resonant Energy Link"為keyword, SERP=第一頁位置5, 中文SERP=第一頁位置1

"DPR : Dynamic Physical Rendering 未來的變形金剛"
2008.08.28刊登, 於2008.08.28被Google index
在Google search以"Dynamic Physical Rendering"為keyword, SERP=第一頁位置7, 中文SERP=第一頁位置1

"PageRank, BrowseRank, AlexaRank"
2008.08.26刊登, 於2008.08.26被Google index
在Google search以"BrowseRank"為keyword, SERP=第一頁位置2, 中文SERP=第一頁位置1

"使用手機或PDA離線瀏覽Google Map"
2008.08.12刊登, 於2008.08.12被Google index
在Google search以"mgmaps"為keyword, SERP=第一頁位置4, 中文SERP=第一頁位置2

(以上資料可能會因時間等因素而顯示不同結果)

由以上例子看, 為什麼這麼新的網頁能夠有優秀的SERP? 因為該文就是以keyword為title或tag, 談的內容就是keyword完全相關的

在以上提的SERP三個主要決定因素中, (1)是最重要的, 其次是(2), 最後是(3)

除此之外, 據觀察結果, 還可能與TrustRank有關係, 不過這點尚無法詳細證明, 但根據一份PageRank/SERP統計資料顯示結論: SERP與PR有關, 但隨著時間PR會逐漸減少對SERP的影響

因此如果您看到某些頁面的PR比較低, 但SERP比您的頁面好, 原因就是: keyword比較有關連或被index的時間比您早

Google處理SERP的方式, 以上面的觀察來看, 其實是很符合使用者需求的, 因為網路上不斷出現新的優秀內容, 如果光是以PR順序來顯示資料, 也許根本找不到要的資料, 況且目前一堆黑帽SEO, 不符合網頁的PR值也很多, 因此Google把PR的影響遞減, 其方向大致沒什麼問題

另外由以上的觀察, 也覺得台灣在新科技相關的研究內容實在少得可憐, 提到DPR(Dynamic Physical Rendering)的中文內容竟然屈指可數, 不過就因為如此, 只要您能夠在內容與結構上好好耕耘 (如本站一系列的SEO探討文章所說的), 您的高品質內容也會有出頭的一天, 其他亂七八糟的黑帽SEO就忘了他吧 ...

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月26日星期二

SERP : Search Engine Results Page

前幾篇文章談了一堆關於Ranking的技術, 最後也就是最重要的就是SERP (Search Engine Results Page), 不管您的PageRank, TrustRank ... 等等指標多好, 如果使用者在搜尋時無法出現在前幾頁, 也就是有較好的SERP的話, 所有的指標都只是白費功夫, 空有好的內容, 但搜尋引擎並不認識你, 可說是非常可惜的事情, 如何才能夠讓您的網頁有優秀的SERP表現呢?

SERP與keyword及網頁結構關係最密切, 而高的PageRank不能保證有好的SERP, 高的流量也不能保證有好的SERP, 如果能夠有好的內容再加上優秀的SERP, 那才是網站成功的保證

當使用者下了一個keyword, 哪些重要因素影響SERP的結果呢?

(1)網頁title

例如本文章的重點在談SERP, 而title就是"SERP : Search Engine Results Page"
如果您的內容無法表現在title tag上, 當然SERP就無法有好的表現, 這也就是上次談到: SEO 三大建議, 希望能夠使用blog結構的原因, 因為可以不需額外功夫就讓內容的title顯示出來

(2)網頁meta data

meta data中的keyword, 與內容中的heading處理, 也可以讓search engine特別注意, 這個在上文Semantic HTML也提到過, 使用正確的tag, 可以讓search engine瞭解您的內容

(3)網址與目錄

如果您的網址或目錄中含有keyword, 如http://www.serp.com/serp-pagerank/serp.html, 如此也可以讓您針對SERP這個keyword有較好的結果, 並且就網址後綴來說, 一般org/net/com 也比ccTLD (Country Code Top Level Domain, 如org.tw/net.tw/com.tw)要好

(4)網頁內容

當然在您文章的內容一定要出現該keyword, 並且真的就是關於該keyword的文章, 否則使用者找到您的網頁也就沒啥意思了

(5)Refresh rate

什麼是Refresh rate? 就是您網站的更新頻繁度, 如果您的網站內容時常更新, 除了能夠讓search engine加快抓取頻率外, 也能夠讓SERP有更好的結果

也許有人會問:到底search engine會多久來抓我的資料? 除了使用http://www.google.com/webmasters/可以讓您上傳sitemap來告知之外, search engine也會自動根據您更新頻繁度來修正抓資料的頻率, 也就是如果每次search engine來抓資料都發現您已經更新, 他會修正縮短抓資料的區間, 如果來抓資料時發現您的網站沒有更新, 則放慢抓資料的區間

因此當您的網頁如果已經被indexing後, 並且您的網站屬於Trust那個區塊, 其實search engine抓資料的頻率有很大因素決定在您手上

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

TrustRank, PageRank, SERP

許多站長常常問一個問題 : 為何我的網頁已經建置很久了, 但一直沒被Google index? 另外一個問題也常常被問到 : 為何許多PageRank值比我低的網頁, 搜尋時出現在我的網頁前面?

第一個問題的答案是 : TrustRank, 而第二個問題的答案是 : SERP (Search Engine Result Page)與PageRank不一定成正比

本部落格的網頁最快約10~30分鐘就會被Google抓走, 最慢也在一天內就被Google抓走, 原因是TrustRank

什麼是TrustRank? 詳細資料請看 : Combating Web Spam with TrustRank

由於全球的網頁數目太龐大, 因此Google的Sandbox, TrustBox技術會將網頁區分為兩大區塊-被排除的區塊(Sandbox)與信任的區塊(TrustBox)

哪些網站會被信任? 被Dmoz list的網站, 被Social bookmark熱門推薦的網站, 被TrustRank/PageRank高的網站所連結的網站 ... 這篇文章也提到一些成為TrustBox區塊的方式

另兩篇文章 : What is Google TrustRank (TR)?, The Social Side Of Trustrank 也提出許多提高TrustRank的方式, 本站之前的文章也都提到過

當TrustRank較好時才會快速被抓取, 被抓取後才可能有好的SERP, SERP就與網頁結構有很大的關係, 但是真正決定SERP的因素, 現在還是只能由結果來猜測, 尚無真正能夠證明哪些因素來決定SERP (SERP的研究倒是不錯的研究題目)

不過不管如何, 研究了一堆PageRank, TrustRank, SERP ... 之後, 其實最重要的還是老話一句 - 內容與結構! 就把一些指標暫時放一邊, 好好研究如何產生好的內容與正確使用Semantic HTML比較實在吧!

標籤: , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

PageRank, BrowseRank, AlexaRank

在八月初的SIGIR (Special Interest Group on Information Retrieval)研討會上, 出現了BrowseRank: Letting Web Users Vote for Page Importance

這個微軟研究中心的BrowseRank演算法, 大抵是想跟Google的PageRank一別苗頭, 到底這個BrowseRank是否能夠比PageRank來得好呢? 我們來研究一下

大略瀏覽了上述的論文, 發現BrowseRank只是Page-level的AlexaRank, 他的data set來自於瀏覽軟體的使用者資料, AlexaRank由Alexa toolbar所得到的資料來分析, 而BrowseRank由微軟的IE所得到的資料來分析

AlexaRank只是Domain-level ranking, BrowseRank比較仔細一些, 進到Page-level Ranking, Website-level Ranking, 而PageRank是透過link-analysis來取得頁面的重要度

論文題目說: Letting Web Users Vote for Page Importance, 其實是值得商確的, 網友到訪了一個網頁, 未必就認為該頁是重要的, 可能看完後幹聲連連 ...

因此我們可以粗略的說AlexaRank標示了網域的熱門度, BrowseRank標示了網頁/網站的熱門度, PageRank標示了網頁的重要度

到底哪個比較精準, 就牽涉到幾個問題:

(1)比較熱門的網站是否就比較重要?
(2)link數目多就代表比較重要?
(3)不同階層的使用者, 熱門度如何參考?
(4)廣度網站與深度網站, 熱門度如何參考?

當然上面問題沒有正確答案, 學術研究的網站一般不能跟入口網站比熱門度(AlexaRank與BrowseRank), 而新興網站一般不能與歷史悠久的網站比重要度(PageRank), 但是也可能會有例外 (而且例外還不少)

所以也很難去比較AlexaRank,PageRank,BrowseRank到底哪個好, 後續有更多資料再來分享啦...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月25日星期一

Pagerank 演算法研究

Larry Page在1996年間發明了Pagerank的演算法, 爾後又與Sergey Brin在Stanford發表了"The Anatomy of a Large-Scale Hypertextual Web Search Engine", 這個Web Search Engine就是現在使用的Google, Pagerank詳細內容到1998年才發表, 並且直到2001年才取得專利

Page Rank公式如下



(以上公式圖形由http://www.sitmo.com/latex/產生)

以上d指damping factor, 其值在0~1, 一般設為0.85
PR(Vi)為Vi這個頁面的PR值
In(Vi)為連進Vi這個頁面的link數目
Out(Vj)為Vj這個頁面連出去的link數目

也就是說如果有3個頁面A,B,C

A如果連到B,C
B如果連到C

如果A的PR=4
則PR(B)=(1-0.85) + 0.85 * 4/2 = 1.85

而PR(C)=(1-0.85) + 0.85 * (4/2 + 1.85) = 3.4225

B,C會平均繼承A的PR值, 但C會單獨繼承B的PR值

Pagerank是一種link-analysis algorithm, 是根據citation analysis而來, 原本使用在學術期刊論文被引用次數的技術

在Pagerank之後, 1999年Kleinberg發表了HITS algorithm(Hyperlink-Induced Topic Search), HITS決定兩個值: authority value & hub value, 並且是在query time計算, 而不是像Pagerank是在indexing time計算, Teoma就是使用HITS (目前被Ask.com收購)

相對於link-analysis algorithm的content-analysis algorithm, 於另外文章再討論

不管是Pagerank或是HITS, 都是iterative ranking algorithm, 非常耗費演算時間及資源, 因此許多研究者提出了不同的方式來加速計算時間:

1999年 Efficient Computation of PageRank(Haveliwala and et al.)

2002年 Pagerank Computation and the Structure of the Web:Experiments and Algorithms(Arasu and et al.)

2002年 I/O Efficient Techniques for Computing PageRank(Chen and et al.)

2003年 Scaling Personalized Web Search(Jeh and et al.)

2003年 Exploiting the Block Structure of the Web for Computing PageRank (Kamvar and et al.)

2003年 Extrapolation Methods for Accelerating PageRank Computations (Kamvar and et al.)

2004年 Parallel PageRank computation on a gigabit PC cluster (Manaskasemsak and et al.)

2006年 Parallel adaptive technique for computing PageRank (Rungsawang and et al.)

2007年 Improvement of Pagerank for Focused Crawler (Yuan and et al.)

但是不管怎麼加速演算法, 其iterative ranking algorithm的特性不會改變, 但可能會加入content-analysis algorithm的一些特性來走向semantic web

而Pagerank公式內的Out(Vj), 使得一些做SEO的人注意到HTML中的nofollow特性, 來進行一些link quality的改善

深入探討:
PageRank Algorithm : 別說你懂PR演算法

相關訊息:
什麼是PageRank Hijack?
善用PageRank指標提升企業競爭力
Google Analytics & PageRank
SERP vs PageRank : PR值與搜尋排前的關係

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月20日星期三

網路行銷/網路營銷 : SEO 三大建議

在許多網站上可以看到諸如: "如何快速提升Pagerank", "Pagerank 7的快速捷徑" ...等等的文章或影片, 但是仔細去看這些網站的Pagerank竟然都是低於3或甚至降到0, 他們教您購買軟體, 他們教您快速增加backlink, 他們教您如何以短短幾分鐘的作業去提升PR值, 但是經事實證明, 不但無法達成目的, 還可能造成反效果, 在本篇文章中, 我們很誠實的告訴您真正被Google認可的方式 ...


在前幾篇文章已經提出許多觀念, 您可以去回顧一下:

Internet大破譯(五): 看不見的網路行銷戰場
善用PageRank指標提升企業競爭力
搜尋引擎的運作背後
網路行銷 : SEO 五大要素
網路行銷 : SEO 十大守則
網路行銷/網路營銷 -- 內容為王

除了以上一些觀點之外, 我們再提供三項實務的建議, 當然這些不管是五大要素, 十大守則, 或是三大建議, 最後回歸的都是 Content (內容), 沒有價值的內容創造不出有價值的網站

但是有價值的網站需要讓search engine瞭解, 並讓讀者可以搜尋到您的內容, 這也是所有搜尋引擎希望所有webmaster能夠協助的地方: 在search engine還不夠智慧的情況下, 讓search eninge能夠真正反應讀者想要尋找的內容

哪三項實務的建議呢?

(1)建立部落格

以目前的網頁結構來說, blog是最適合search engine抓資料的, 因為tag/category/publish date等等要素, 讓文章與文章之間會自然產生關聯, 這些關聯會讓片段的文章形成一串互相有關的內容, 這些關聯可以讓search engine知道如何index這些片段, 也可以讓讀者去一層層找到需要的資料, 因此如果您的網站沒有blog的結構, 應該盡快構思如果組織您的內容去建立有價值的blog

(2)善用網路社交工具

什麼是網路社交工具? network bookmark (網路書籤)就是一個例子, 建立部落格後僅是在您的內容上建立關聯, 而使用網路書籤可以讓blog間串聯起來, 並且讓更多人來看到您的內容, 並且網路書籤的tag可以將這些關係標準化, search engine可以很輕易的index相關內容

(3)使用Semantic HTML

什麼是Semantic HTML? 根據wikipedia的Semantic HTML解釋, Semantic HTML不是一般webmaster能夠瞭解的, 但是有另外一篇比較淺顯的說明您可以參考: Writing Semantic HTML

Semantic HTML的目的就是讓您的內容可以清楚呈現給search engine, 因為search engine並不瞭解您的內容, 但是透過HTML tag, 他可以知道這段文字是屬於哪個類別

總而言之, 其實以上三大建議, 是希望您的網站在結構關聯上, 能夠替search engine做更清楚的描述, 如此一來search engine瞭解您的網站, 也同時讓讀者知道搜尋到的是否是需要的內容

真正的Search Engine Optimization (SEO)是在協助search engine, 而不是在欺騙search engine


許多人都說做SEO要偷偷做, 不要讓search engine知道您的作法, 其實只要是正確的SEO作業, search engine反而是鼓勵的, 因為您可以改善他們的搜尋效能

在內容上提升, 在結構與關聯上修正, 才是真正在進行SEO, 請大家光明正大的進行, 如此一來才可以讓讀者找到需要的資料而不是一堆不相干的垃圾

標籤: , , , , , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年8月1日星期五

網路行銷/網路營銷 -- 內容為王

數位網路社群已經走過近十年的時間, 距離上次改版也已經六年的時間, 但到今年四月才驚覺沒有獨立建立部落格架構已經無法符合市場需求

當初在2008.04剛建立部落格時, 當然PageRank=0, 並且完全沒有讀者, 但是到2008.07底, PageRank已經由0翻到4, 雖然部落格流量仍然未見起色, 但靠著文章被引用次數的增加, 已經逐漸被網友知道 ... 喔, 原來數位網路社群還有blog啊!

到底如何在3個月的時間, PageRank由0到4呢? 以下是一些觀念 ...

其實標題已經很清楚的告訴您了 -- 內容為王

您還在使用一些黑帽式的軟體或技巧, 增加您的backlink嗎? 這些方式能讓您的SERP從30幾頁上升到前3頁嗎? 這些方式能讓您的PR在3個月內由0到4嗎?

當然答案應該很清楚!

那應該如何做呢? 只需遵照SEO五大要素, SEO十大守則, 好好規劃您的SEO策略與內容耕耘, 保證能夠有好的成果

也許您會問: 那沒有啥內容怎麼辦?

如果您是搞藝術, 但偏要弄個科技網站, 那就Sorry啦, 當然不能產出好成果 (除非外包找代筆), 因此弄個您真正專長的方向, 並一步一腳印的去驗證上述的SEO五大要素/SEO十大守則, 必定可以馬到成功

也許您又會問: SEO五大要素/SEO十大守則太大方向了, 有沒有Step-by-Step的做法?

SEO不是1+1=2的問題, 因此實在很難寫出Step-by-Step, 光是一個要素可能可以寫一本書, 實在沒辦法詳細告訴您 ... 除非等筆者享受退休生活的時候吧!?

不管如何, 要提供經驗給各位的是: 不要再相信不重視內容的SEO方式, 沒有好的內容...神仙都沒辦法

也許您又會問: 那有不錯的SERP或PR能幹啥?

答案是如果您的網站不是營利型網站, SERP或PR實在沒啥意義, 但是如果您的網站是營利型網站, 就能夠快速的讓網友找到您的站台, 增加交易的機會

並且如果您有幾個SERP/PR不錯的站台, 就可以很輕易的繼續拉抬您其他的新網站邁向成功之路

因此持有優良的SERP/PR的站台或與該類站台保持良好互動, 是非常重要的事情啦

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年7月30日星期三

網路行銷 : SEO十大守則

SEO人人會變, 但各有巧妙不同, 有些手法可以讓您乍看來有效, 但時間一過卻比以前還慘, 有些手法根本無效, 卻口沫橫飛的說得讓您誤以為真, 提供SEO十大守則讓您建立正確的觀念, 以餉網友 ...


守則1: 不要為Rank而Rank
許多網站很熱衷於改善Rank, 但是卻忽略了...網站是給人看的, 不是給搜尋引擎看的, 遵守搜尋引擎的遊戲規則是很重要的, 如果search engine已經很明白告誡的作法, 就千萬不要以身試法, 除非您建立某些站台是用來測試search engine的algorithm, 因此切記...該進行的合法SEO動作以後, 一切就交給search engine啦,如果有SEO廠商告訴您, 讓您的網站在十天內PR值變成5 ... 忘了他吧, 肯定會讓您得不償失, 就好像唸書一樣, 得獎狀不能保證您能獲得高報酬的工作, Rank之外還有更重要的事情等著您 ...

守則2: Ranking只是一個過程,不是目的
Ranking只是一個指標, 更重要的是由這個指標去改善您的網站, 不是獲得好的Ranking就能高枕無憂, Ranking起起落落只是在提醒您是否忘記該進行哪些事項, 建立任何網站重要的是否達成您的目的 ... 有時候忘掉Ranking, 好好耕耘內容反而是比較健康的事情, 沒有一年半載的時間, 成果是看不出來的, 從事網路服務提供已經十餘年, 看到太多網站轟轟烈烈開站而草草了結, 沒耐心的人來搞網路行銷會讓您得憂鬱症的 ...

守則3: 瞭解您的對手
SEO的成果不是絕對的, 它是比較的結果, 十幾年前隨便搞個站, 幾天SERP (Search Engine Result Page)就明列前茅, 現在競爭者多了, 越來越困難, 但是您不是要跟Yahoo比, 您不是要跟YouTube比, 只需要鎖定您的對手, 就能清楚規劃出SEO的策略 ...

守則4: 讓搜尋引擎瞭解您的網頁
網站不是為Search engine而設立, 但是要讓它瞭解, 如此才能妥善的抓取您的內容來indexing, 瞭解最新的W3C規則, 健全您的網站結構, 清楚的sitemap, 都能讓您的SEO策略事半功倍...

守則5: 選擇適合的關鍵字
思考您的客戶可能使用哪些Keyword, 進而使用一些工具來分析來客傾向與導引, 是非常重要的, 對於關鍵字的focus不要一次太貪心, 剛開始選擇一兩個關鍵字, 效果出來了再慢慢增加關鍵字, 例如本站在近期才將"網路行銷"加入關鍵字策略, 並且相近簡體字"網路營銷"亦加入, 目前已經從Google SERP 30幾頁的位置, 提升到前三頁

守則6: 內容至上
沒有內容就一切免談, 胡說八道或到處亂抄只能暫時讓您的網站看似豐富, 但最後除了會被Search engine封殺之外, 也會被網友拋棄, 所以還是回歸最重要的原點 -- 內容, 好內容總有出頭的一天, 何況search engine掃瞄的速度之快, 一定可以讓您的網站浮出抬面的...

守則7: 使用正確的鏈結策略
一堆無用的backlink可能讓您的Ranking緩慢提升, 但高品質的backlink可以讓您的Ranking快速改善, 但是如何呢? 前面文章已經說太多次了, 就不再贅言

守則8: 撰寫正確而適合的Meta內容
除了網站正確的結構之外, meta內容是否真的符合您的網站也是很重要的, 您明明沒有賣相機, 但meta內容卻會讓網友透過"相機"找過來, 這些無效搜尋對Ranking的提升是毫無助益的, 只是浪費大家的時間

守則9: 與相關link站在一起
在一些Open Directory的適當類別可以找到您的網站, 在類似的網站能夠link到您的網站, 您自己網站的相關內容能夠link在一起 ... 都是search engine的最愛, 為啥有人說search engine喜歡blog的結構? 因為blog的特性 : 文字多/RSS/tag ... 這些都讓內容相近的文章可以互相串聯

守則10: 如果需要的話, 還是要向專家諮詢
SEO看似簡單, 大家都可以做, 但卻是非常技術性的工作 (也是很勞力的工作), 因此多多向專家諮詢以獲得量身訂做的SEO策略也是非常重要的, 更重要的是您自己要具備正確的SEO觀念, 如此一來才能讓您的網站常久經營下去, 並且日漸茁壯 ...

標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月22日星期四

搜尋引擎的運作背後



相信大部分人都不太清楚到底搜尋引擎如何運作, 就算是SEO專家或是技術高手, 對於Google的PageRank也都只能由觀察來推論實際運作的可能性, 現在我們就幾個關鍵人物的說法來探究 ...

近日Google的官方部落格刊登了Udi Manber(VP Engineering, Search Quality)的這篇文章: Introduction to Google Search Quality, 並且透露Google將定期公告關於搜尋引擎的訊息

Udi Manber在2006年前是負責Amazon的A9搜尋引擎, 因此雖然只加入Google兩年, 但是已經算是搜尋引擎的老鳥了

在談Udi Manber的文章前, 我們先來看Blekko的Rich Skrenta, 他敘述關於search engine:

Step 1 is to copy the internet onto your cluster. Step 2 is to analyze it..

Search is like 7 hard problems wrapped into a stack. Distributed systems, html analytics, text analytics/semantics, anti-spam, AI/ML, frontend/UI. And scale...

Plus there is always something fresh and new every day mining through the vast sordidness of the many billions of pages on the web. You expect to be amazed at the endless varieties of crazy porn domains and new approaches to webspam.

Rich Skrenta說到, 搜尋引擎就是把全球的頁面複製一份到你的叢集裡, 然後進行七項苦工(分散式系統,HTML分析,文字與語意分析,反垃圾,人工智慧與機器學習,使用界面,彈性的系統規模)...然後每天都會驚訝發現許多的色情與垃圾網站...(僅就意思翻譯,請多包涵)

他的最後一句透露了兩個重點...取巧的網頁會被抓出來,以及人類在整個過程中會介入資料的判斷

其實從上次Google的PR調整來處罰Paid link, 大概就清楚人為干擾search engine algorithm的例子 ,但由Rich Skrenta的說法就更明白, 非自然的網頁行為是被嚴密的監控的, 也許您會認為上億頁的資料中不會被發現, 那您就低估了人工智慧與機器學習的可能性 ...

SitePro列出的SEO十大守則

Commandment 1: There are No Rank Guarantees
Commandment 2: Ranking is Not the End, It's the Means
Commandment 3: Know Your Competition
Commandment 4: Use Search Engine Friendly Design
Commandment 5: Select Keywords that are Worthy
Commandment 6: Write Great Content
Commandment 7: Use Good Hyper Linking Strategy
Commandment 8: Write Relevant and Original Meta Content
Commandment 9: Acquire Relevant Links
Commandment 10: Consult Experts, If You Need To


也可以很清楚的知道: 好好耕耘內容, 不需要太在意評分, 自然可以呈現好結果

我們現在再回來看看Udi的文章 ...

PageRank is still in use today, but it is now a part of a much larger system. Other parts include language models (the ability to handle phrases, synonyms, diacritics, spelling mistakes, and so on), query models (it's not just the language, it's how people use it today), time models (some queries are best answered with a 30-minutes old page, and some are better answered with a page that stood the test of time), and personalized models (not all people want the same thing).

顯示PageRank只是"Part-of", 由許多觀察也發現, PR與SERP不如以前關係緊密, 因此許多追求PageRank的作法應該有所調整, 並且以後可能搜尋結果可能會因人而異(您看到自己頁面的搜尋結果很好,不要太高興啦...)

In 2007, we launched more than 450 new improvements, about 9 per week on the average...we made significant changes to the PageRank algorithm in January.

去年Google就進行了450次以上的調整, 並於2008.01做了PageRank algorithm重大調整, 跟一些專家所說的數字差距真的太遠啦

There is a whole team that concentrates on fighting webspam and other types of abuse. That team works on variety of issues from hidden text to off-topic pages stuffed with gibberish keywords, plus many other schemes that people use in an attempt to rank higher in our search results. The team spots new spam trends and works to counter those trends in scalable ways; like all other teams, they do it internationally.

如Rich Skrenta所說的, Udi也提到非自然的取巧作法是被嚴格觀察的...尤其當您在網頁上看到某些取巧的作法時, 就趕緊停止吧, 因為Gooogle早晚也會知道的...

我們就密切注意Udi Manber後續的文章吧, 如果您懶得看英文, 隨時回來這裡交流吧 ...

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月21日星期三

Blekko:下一個Google?



如果跟您說Blekko這家公司創於2007年六月, 並且已經募集了數百萬美金, 而他的網站在這裡, 不知您做何感想?

但是如果再跟您說, 他的創辦人是Rich Skrenta:撰寫第電腦病毒Elk ClonerDMOZ ODP創辦人之一、Topix線上新聞創辦人之一, 並且他的夥伴是早期Google的人David DesJardinsJeremy Wenokur(Jeremy也是ODP的早期創辦人之一), 大概您就不會那麼驚訝了

不過一堆有頭有臉的人搞出一個Blekko這樣的公司, 到底葫蘆裡是賣什麼藥呢?

據Skrenta表示, Blekko主力在indexing,query serving的後端, 將會讓使用者有全然不同的搜尋經驗, 但是真正宣佈prototype應該不會早於2009年, 因此可以預知2009年後以Google PageRank為主的SEO會有一個不小的改變

也許您會說:幾個人加上幾百萬美金, 可能憾動Google在搜尋上的地位嗎? 如果您仔細瞭解他們在Google、DMOZ上扮演的角色, 也許您就不會太懷疑Skrenta所說的

除了Blekko之外, 還有TwinePowersetFreebaseKartooizitoujikohakia ... 緊追其後, 2008年到2009年之間, 搜尋引擎還有一場大戰, Sit back & Enjoy it !

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年3月20日星期四

善用PageRank指標提升企業競爭力

處於網路資訊時代,如果無法在全球資訊網上建立網路身份,將喪失未來與對手競爭的能力。這絕對不是危言聳聽的言詞,因為許多事實已經很明顯的呈現。

舉個最常見到的例子,我們如果想要計畫一個旅遊行程,通常會在網路先搜尋前往地點的一些資訊,如景點、食宿、交通等。藉由這些資料的取得與呈現結果,會大半決定了旅遊路線與到訪地點,如果旅遊相關業者在網路上沒有訊息或是極少訊息,可以吸引旅客前往的機率便會相對減少。

實體企業的競爭力會影響企業網站的重要性,而企業網站的重要性也會影響實體企業的競爭力,兩者互為因果。我們由Google的PageRank來觀察,IBM (PR 9/10)、Apple (PR 9/10)、HP (PR 9/10)、NOKIA (PR 9/10)、Dell (PR 8/10)、SONY (PR 8/10)、ASUS (PR 6/10)、Acer (PR 6/10),與實際企業的市場規模完全吻合 (參考: PageRank查詢工具)。

再看看學術單位的PageRank指標,台大 (PR 8/10)、交大 (PR 7/10)、清華 (PR 7/10)、政大 (PR 7/10)、中山 (PR 6/10)、成大 (PR 6/10)、中央 (PR 6/10)、師大 (PR 6/10)、逢甲 (PR 6/10)、淡江 (PR 6/10)、台北科大 (PR 5/10)、雲林科大 (PR 5/10),跟webometrics學校全球排名結果也幾乎一致。

因此除了提升實體競爭力之外,對於網路上PageRank指標的重視也是企業很重要的議題。因為較高的PageRank可以讓企業網路上的資訊可以較為容易被網友取得,詳細內容已經在"看不見的網路行銷戰場"說明過,就不再贅述。

什麼是 Google PageRank? PageRank 是以 Google 公司創辦人拉里·佩奇(Larry Page)命名,剛好也表示網站頁面的等級指標。是一種由搜索引擎根據網頁之間相互的超鏈接來計算的網頁排名。PageRank 跟流量不一定成正比(Alexa Rank與流量比較相關,其他文章再談),但能夠表示頁面內容的重要性,Google 把從 A 頁面到 B 頁面的鏈接解釋為 A 頁面投票給B頁面,一個頁面的「得票數」由所有鏈向它的頁面的重要性決定。 (詳細說明可以參考 : Wikipedia)

因此高的PageRank表示較多網站對於該頁面的認同,但是網海茫茫,該頁面的內容豐富度並不一定會被發現進而認同,所以除了網頁內容的豐富度之外,隨時觀察PageRank與進行SEO (Search Engine Optimization, 搜尋引擎最佳化) 是相關重要的課題。

您可以使用本網提供的PageRank工具來查詢,或把HTML碼複製到您的網頁,瀏覽時就可以隨時瞭解網頁被認同的指標,來調整網站內容的方向。例如,如果您發現某些頁面的PR值比其他頁面高,表示該內容已經被其他網頁連接與認同。有了這個工具,您就不需安裝其他的軟體,也不需時常去搜尋引擎查詢被聯結的狀態。

如何把HTML碼複製到您的網頁來顯示PageRank呢?
(1)瀏覽PageRank工具
(2)由Style#1~10中,選一個較適合的圖案
(3)將該Style的HTML碼複製
(4)放置在您的網頁適當地方 (在<BODY>與</BODY> tag內)

完成以上程序,就可以顯示出該頁面的PageRank。而如果在Style#1~10中都沒有適合的圖案,也歡迎跟我們聯絡,提出您的色系與大小需求,將另外免費製作適合您網頁的圖案。

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院