2008年12月5日 星期五

Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)



延續之前文章

"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"
"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

我們繼續來談其他問題...

Q: I have a website in 5 languages (and I cannot buy 5 different localized domains), which option is the best? To have different subdirectories (domain.com/en) or to have different subdomains? (en.domain.com)
如果網站有五種不同語言的內容, 網址應該如何取捨? 子目錄或子網域?

A: both versions are fine. I personally generally recommend using a subdomain when the sites are completely different and using subdirectories when it's more or less a shared site, but it's up to you.
當網站是完全獨立的可以用子網域, 若共用則使用子目錄


以上回答如果有聽沒有懂, 請參考:

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory

Q: If my sub domain got high Page Rank, how far it will contribute to the main domain?
次頁的PR是否會貢獻給主頁?

A: PageRank is on a page-by-page basis. The PageRank of a page (on a subdomain or not) is based on the links to it.
不會


雖然PageRank是以頁面來計算, 不會貢獻給上層網頁, 但是如果適當調整link, 可將link的PR貢獻給上層或其他網頁, 因此監看各頁的PR還是必須進行的

Q: Recently you posted on the webmaster central blog that you would suggest to not rewrite dynamic urls to static. Is there penalties for sites that rewrite? Would you suggest changing if a site has 5+ years history? Can you discuss further? Thanks.
將動態URL改寫成靜態URL影響如何?

A: great question. If your site is already doing well and you have rewrites, then you're probably doing them properly so please don't worry about it.
Feel free to spend time on your content and business! Yay! :)
In our blog post, we wanted to discourage new sites, or less experienced webmasters, from feeling they HAD to use rewrites. We've improved our processing of dynamic URLS, so there's no need for newer webmasters to be afraid of them any longer.
沒有必要


在以往靜態URL的SERP比動態URL要好, 但是目前已經沒有差異

Q: Sub-Domains are considered as a new site for Search Engines, if a 5 years old site which uses forums.domain.com, www.domain.com now plans to add shop.domain.com and download.domain.com will this take another few years for both new domains to get rank?
舊站的PR是否能夠貢獻給新的子網域站台

A: PageRank is purely at a page level, so if you forums.domain.com has a high PageRank and links to new urls such as download.domain.com, that PageRank will flow immediately.
如果舊站有高PR, 並且指向新站, 新站很快就會有影響


不管子網域或次目錄等, 應該善用高PR的頁面, 逐步培養新的頁面

Q: Will it make any difference between a shared IP and a dedicated IP on SEO or search results, as opinions are divided on this aspect?
共用IP與獨立IP對於SEO有何影響?

A: most of the web is on shared IP addresses, so it doesn't make much sense for us to give those on dedicated IP addresses any advantages. That said, if your server is struggling with the load of your website, it might make sense to move to a dedicated server that helps to make sure that your users are happy when visiting your website.
沒有


PageRank與SERP並不會以IP來ranking, 只會以IP來判斷區域

Q: If I 301 redirect a well-ranked page to a new domain with the exact same content, will all of the rankings be replaced with the new domain once it has been indexed? How long after indexing can we expect the swap? And is the same thing true for 302s?
301 redirect是否會轉移PR, 那302呢?

A: If you're moving from one URL to another (even if it's on a different domain), ranking signals can be passed via a 301. A 302 is used for temporary redirects, so this is less likely to transfer ranking signals.
301 redirect可用於網站轉移, 302只是暫時


詳見 : SEO策略: PR5+PR4=PR6?

Q: Google takes 200 signals for ranking a query and PR is one among those. If that is the case, why is it still showed prominently on toolbar. Any possibility of seeing PR info dropped from Google toolbar?
之前說過Google使用200個因素來判斷SERP, 為何toolbar要顯示PR...

A: PageRank is just one signal that we use, but it's also one of the easiest metrics to show to users and an easy one to understand where the metrics come from. So I think it's something that still provides value to users and still makes sense to show to them in the Google Toolbar.
因為是一個最早也最簡單說明的因素...


本站文章已經就各種不同因素說明, 200個因素要說好久...慢慢再說明啦

Q: How often does your search algorithm change?
Google多常修正演算法?

A: We change the algorithms all the time - last year we had over 450 changes.
經常, 去年修正了超過450次


參考前文"SEO觀點 : SEO面對的是巨變的環境"

Q: Should I be using hyphens instead of underscores in my URLs to improve a page's rank?
我應該在URL使用底線還是中線?

A: For the time being, I would recommend still using hyphens instead of underscores. If you're already using underscores and that's working fine for you and your rankings, it's not worth switching. But if you're doing a new site, then I would go with hyphens.
中線較好


參考: SEO策略 : 如何產生更多的backlink?

Q: Does link: gives exactly the number of back links to a site?
link:這個指令是否列出所有backlink資料?

A: The link: operator only shows a sampling of links to a site, so it may not show all of the links that Google knows about. To find more information about backlinks to your own site, we give verified site owners more information about backlinks in Webmaster Tools:
http://www.google.com/support/webmasters/bin/answer.py?answer=55281
非也, 只是列出代表性, 並非所有backlink, 可以參考上述連結


只有在Webmaster Tools中的資料才是完整資料

Q: If my website "A", linking to website "B", and "B" linking back to "A" - am I going to be penalized? Does linking strategies still work?
如果A頁連到B, 然後B又連回A, 是否會被懲罰?

A: Participating in linking schemes to impact ranking is not advised it's against the webmaster guidelines.
http://google.com/support/webmasters/bin/answer.py?answer=66356
The best linking strategy is to create a site with unique content or services that people want to link to. Then publicize it.
想要影響ranking的話...是的


link schemes需要好好想想, 並非都不行, 但某些狀況不行, 請詳讀上述link

Q: Are you going to focus more on personalised search? If so, these results we currently look at won't really matter, as different sites will be at #1 for different people, right? - thank you :)
是否某人看到的SERP會異於他人看到的?

A: that's right -- with personalized search it's possible that each user sees slightly different search results. We try to make those search results unique and compelling enough to make the user go visit and stay on the sites listed -- so if your site is really awesome, chances are high that we'd be recommending it to users as well :-).
是的


參考 : "Personal search is coming : 個人化搜尋將全盤改變SEO"

(全文完)

標籤: , , , , , , ,

繼續閱讀

Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)



延續"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", "Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)", 我們繼續來談其他問題...

Q: In addition to a XML sitemap, does it make any sense to have also an HTML sitemap on the same website? Does HTML sitemap helps improve the rating?
除了XML的sitemap外, 有HTML的sitemap對於rating有幫助嗎?

A: A HTML sitemap file can help search engines, especially those that don't use XML Sitemap files. Also, the 404 widget in Webmaster Tools (which you can place on your 404 pages) will use "/sitemap.htm" and similar files to help users to find the content they're looking for. So yes, I would recommend making HTML sitemap files, however I'd focus on the user and not the search engines.
是的, 但是是指對使用者有幫助


HTML sitemap可與Webmaster Tools 404 pages結合(也就是當找不到網頁時), 可以指向HTML sitemap, 此舉可以讓讀者繼續停留在網頁上

Q: Recently went through a rebranding of our company name. The old domain name was successful in page ranking, however the new domain name has terrible page ranking. Do 301 redirects transfer the site equity from the old domain to new domain?
當移動網站時, 301 redirect可否轉移ranking?

A: This is a pretty common question, so we actually did a blog post about it recently. In short, 301's are the best way to retain users and search engine traffic when moving domains. You can find the full post here: http://googlewebmastercentral.blogspot.com/2008/04/best-practices-when-moving-your-site.html
移動網站時可參考上述連結


這個問題我們在"SEO策略: PR5+PR4=PR6?"也已經談過

Q: Is the bounce rate and speed taken into account when ranking a page? i.e. if you see a searcher click on a result then return very quickly and choose another result, is the first page ranked lower?
Bounce Rate是否會影響SERP?

A: assuming that users will be jumping out of a site like that, there's a high probability that they won't be willing to recommend it to others (or come back themselves). So yes, indirectly at least, if a site is made in a way that users run away right away, then chances are that we might not be recommending it as much as other sites that users like (and recommend to others).
間接來說, 是的


我們在"BounceRate是否影響SERP?"也談過啦

Q: Many believe that to rank well, you simply need "quality" backlinks. But how important is having your keywords in the , and throughout your site? Is keyword density of any importance to show what the page is about? What % is suggested?
有人認為高品質的backlink是重要因素, 並且關鍵字密度比例應如何?

A: Links are just one factor involved in Google's ranking of pages. We look at both on-page and off-page content, so what you have on your page can be an essential part of ranking. However, there is no recommended "keyword density." Your content should be high quality and written for users. If you try writing for search engines, the language can become very unnatural, which may end up hurting you more than it helps.
on-page與off-page都是重要因素, 沒什麼關鍵字密度比例問題, 只需產生高品質的內容...


請參考之前"SEO策略 : OnPage & OffPage SEO"

Q: Does inconsistent capitalization of URLs cause duplicate content issues and dilution of page rank? For example www.site.com/abc vs www.site.com/Abc. On Windows hosts, these are the same page, but are different pages on Unix hosts.
URL上的大小寫是否造成不同的URL?

A: based on the existing standards, URLs are case-sensitive, so yes, these would be seen as separate URLs. Since the content on the URLs is the same, we'll generally recognize that and only keep one of them. However, we'd recommend that you try to keep all links going to one version of the URL. Keep in mind that this also applies to robots.txt files.
是的, 如果出現大小寫不同的URL指向同一內容, 我們只留其一


在使用英文大小寫需注意, 在UNIX類的機器是大小寫不同, 而windows是大小寫視為相同, 最好在網址與robots.txt上都保持一慣性

Q: Does appearing high in image searches help improve the host sites PR and appearance on standard searches?
影像可被搜尋是否對PR有幫助?

A: Thanks for the question Andy. Well-optimized, relevant images could definitely help increase traffic to your site, especially with the introduction of Universal Search, where we mix images, videos, and more into the web search results.
是的, 影像可被搜尋可以增加流量


在網站的影像影音檔應注意檔案名稱與alt的內容, 以便能夠被搜尋

Q: Is there a META tag we can use to tell Google the geotarget (country) of a particular webpage?
在meta可否標示地區?

A: we don't have META geotargeting capability at this time.
沒有


要讓網頁能夠有地區或語文區分, 可參考
http://googlewebmastercentral.blogspot.com/2008/08/how-to-start-multilingual-site.html
http://googlewebmastercentral.blogspot.com/2007/10/better-geographic-choices-for.html
http://googlewebmastercentral.blogspot.com/2008/04/where-in-world-is-your-site.html

繼續閱讀"Search Engine Optimization 搜尋引擎最佳化的幾個問題(4)"


標籤: , , , , , , ,

繼續閱讀

Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)



延續上一篇"Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)", 我們繼續來談其他問題...

Q: Do inbound links from other sites owned by the same company help or hurt rank? 自己公司的自我連結是否有益或有害於ranking?

A: I've see SEOs have 1000 or 2000 different domains and cross-link them. I definitely would not recommend that... if you run a sporting goods site, and you link to your sister companies for camping and tailgating equipment, that's good for the user...Put yourself in the user's seat, and do what makes sense for these links. Good luck! SEO式的胡亂連結並不推薦, 但合理的連結可以接受, 只要站在讀者的角度有意義的連結都算OK


最後那句Good luck...有點毛骨悚然吧, 有些好自為之的意涵, Google並非全然沒發現non-sense link, 只是要不要處理的問題, 如果被處理到...就全盤皆輸了...還是Good luck...保重吧, 合理的連結可以接受, 但是如果是無意義的大量連結就盡量避免吧

Q: Will Webmaster Tools ever give us an option to "disassociate" from sites that link to us? This feature exists in Yahoo's Site Explorer, but not Webmaster Tools. 是否在Webmaster Tools提供拒絕對方連結的功能?

A: So far because we work really hard to make it so that one site can't hurt another site, we haven't really offered this...So that's a challenge, and since we haven't seen a need for it yet, that's why we haven't offered it yet. 對方的連結並不會影響, 目前沒看出有這個需求


Google的演算法中, 他站的連結並無法去搞亂另外站台的ranking, 真的如此嗎?

Google的假設是壞站可能會連到好站, 但好站不會連到壞站, 但是如果你有透過交換連結, 你如何知道對方何時會變成壞站? 更多詳細內容, 我們後續再討論

Q: Does Google plan to let us see rankings/positions of keywords in the webmaster tool? 是否會在webmaster tool工具中, 可以查詢關鍵字的ranking?

A: We already do, for a limited number of keywords, in the "Top search queries" section of Webmaster Tools. While we generally don't comment on future features or plans, expanding this functionality is certainly an idea that's been suggested to us. 已經如此做了, 增強的功能也進行中


Google Webmaster Tool中的查詢關鍵字ranking, 目前功能並不完善, 顯示的排名也似乎與實際資料有落差

Q: Until recentley (the last six months or so) a high ranking was achievable by submitting articles to article directories (providing they were 40%-60% unique), it no longer seems to be the case. Have links from article sites been de-valued at all?
目前一些文章目錄網站的效果是否降低?

A: In my experience, not every article directory site is high-quality. Sometimes you see a ton of articles copied all over the place, and it's hard to even find original content on the site. The user experience for a lot of those article directory sites can be pretty bad too. So you'd see users landing on those sorts of pages have a bad experience.
If you're thinking of boosting your reputation and getting to be well-known, I might not start as the very first thing with an article directory. Sometimes it's nice to get to be known a little better before jumping in and submitting a ton of articles as the first thing.
有些文章目錄網站品質並不高, 並不建議利用文章目錄網站來提高曝光度


文章目錄網站品質不一, 所以在把文章丟到文章目錄網站前, 應先好好審視品質, 否則只是白費功夫, 但是優秀的文章目錄網站還是具有一定的效果

Q: For SEO, I'd like to improve my rankings by removing technical obstacles (starting with dynamic URL parameters), what are the most important site fixes to make and how can I document before and after success metrics using the Google Webmaster Tool?
如何有效找出網站技術缺失並修改?

A: To check the crawlability of your site, I would recommend crawling your site with a crawler like Xenu's Link Sleuth (freeware, for Windows). Doing that gives you a rough look at how search engines view your site and can point you towards areas where crawlers get stuck in a loop or start crawling duplicates based on the URL parameters.
應先了解搜尋機器如何抓取你的站台


以搜尋引擎的角度來審始自己的網站是很重要的, 可以利用Google工具或一些免費工具來看哪些抓取會有困難, 然後修正

Q: Are .gov and .edu back links still considered more "link juice" than the common back link?
如果有被政府或教育單位連接, 是否比一般連結有效?

A: This is a common misconception--you don't get any PageRank boost from having an .edu link or .gov link automatically.
沒有分別


常常有人認為被政府或教育單位連接, 其PageRank/SERP表現會更好, 其實不是, 只是可能因為能導入流量而引起效果, 與gov/edu並沒有直接關係

後續問題分析還有很多內容, 容後再續...繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(3)"

標籤: , , , , , , ,

繼續閱讀

2008年12月4日 星期四

Search Engine Optimization 搜尋引擎最佳化的幾個問題(1)



Google搜尋引擎真正的運作機制一直是一個黑盒子, 但在Live Chat Q&A當中, 可以透過一些對話來了解大家關心的重點及解答, 我們來研究這些對話並且解析出到底哪些才是搜尋引擎最佳化的真正核心問題...

Questions and answers from the third online Webmaster Chat from October 22, 2008記載了所有詳細的對話, 但是光是看這些對話只是一些公式化的官方回答, 我們一一來解析中間的奧妙
Q: What weight does the age of a site and the amount of time a domain is registered for have on it's search placement? 網域名稱的註冊時間與長短是否影響搜尋排名?

A: In the majority of cases, it actually doesn't matter ... I try never to rule a signal out completely, but I wouldn't obsess about it. 大部分情形, 這個因素並不太重要 ... 我認為沒有單一因素

從這個回答中, 我們可以知道網域名稱的註冊時間與長短是"其中"一個因素, 只是Matt Cutts認為還有許多因素互相影響...這有點廢話, 不過Matt Cutts並未否認網域名稱的註冊時間與長短的重要性就是了

網域名稱的註冊時間與長短是搜尋引擎最佳化的一個因素
Q: Recently, you removed this suggestion: "Submit your site to relevant directories such as the Open Directory Project and Yahoo!" from your guidelines. Is there any chance that you will be discounting these kinds of links for ranking value in future? 是否將網址送到開放目錄已經不再重要了?

A: There's always the chance that we'll discount directory links in the future...Right now we haven't changed how we're weighting directory links--we've only removed the directory suggestion from the webmaster guidelines. 以後一定會減低這些目錄的重要性, 但目前並未如此做

也就是將網址送到DMOZ等較有公信力的開放目錄還是有效果的
Q: Can you explain how the use of sub-domains helps / hurts a sites ranking? 次網域是否會減損或加強ranking?

A: Good question--do mean in terms of subdomains vs. subdirectories? Maybe we can talk through this one after the official presentations? 沒有正面回答

這個問題被評為好問題, 表示已經觸及了一些重點了, 到底是次網域好?還是子目錄好?哪個可以對於ranking有正面效果呢? 這篇文章"Advice on Subdomains vs. Subdirectories for SEO"可以參考, 以往sub-domain也許可以得到一些效果, 但現在sub-domain與sub-directory似乎已經具備相同效果, 但是有一點值得研究的是site-1.example.com與site-2.example.com到底算同一個site嗎?其ranking的分配與sub-directory如何取捨? 你可以參考以下文章

搜尋引擎最佳化 : subdomain 與 subdirectory
搜尋引擎最佳化 : subdomain OR subdirectory
Q: Since Google is against using ranking software (ie:WebCeO) to monitor SERP rankings, is there any plans on Google creating an approved, in-house rank check application that webmasters can use? Google是否會提供rank check軟體?

A: It's something that we've talked about. My concern is that sometimes people get too worried with paying attention to their "trophy phrase" and want to rank for that even if that's not the best phrase for them, or concentrating on one phrase to the exclusion of all the other stuff they rank for isn't the best idea. I think paying attention to server logs or analytics data gets you a really nice array of keywords that are practical to work on. But this is feedback that we've heard, and personally I think it would be nice if we offered this for some reasonable size of keywords. 回答得好長, 希望不要把重點放在ranking (廢話, 沒Google大家就不會計較ranking啦), 但是重點是可能會提供...以後吧

Google對於PageRank Checker大抵是不鼓勵、不反對, 當然最好的方式是使用Google Toolbar上的PageRank Display, 但因為還要安裝軟體, 所以並不是很方便, 我們提供的PageRank貼紙是一個不錯的選擇

而Google對於SERP的Ranking則是反對的態度, 不過有一些免費工具可以尋找SERP Ranking, 我們整理完後再陸續提供, 其他問題的解析, 我們後續也會繼續探討...

繼續看"Search Engine Optimization 搜尋引擎最佳化的幾個問題(2)"


標籤: , , , , , , ,

繼續閱讀

2008年11月19日 星期三

Personal search is coming : 個人化搜尋將全盤改變SEO



各位不知是否在近期的Google Search上發現SERP有異於往常的結果? 第一個是Google Dance的頻率較為頻繁, 第二個是在不同的電腦搜尋可能出現不同的SERP, 這就是我們在之前文章"Search Engine Optimization 六大心法", "SEO觀點 : SEO面對的是巨變的環境"都提過的, 如果沒有隨時掌握趨勢及使用對的方法, 在SEO上可能面對全盤皆輸的局面...

Bruce ClayPubCon上提出了他的看法, 認為明年第一季Google的搜尋技術將有重大的改變, 這個改變就是個人化的搜尋, 而此改變將連帶影響SEO的技術

語意搜尋(Semantic Search)尚未完全成熟前, 個人化搜尋 (Personalized Search)是改善搜尋的一個方式, 也就是您的IP, Cookie以及搜尋歷史資料來決定SERP, 當使用"java"來搜尋時, 有可能是要尋找程式資源, 可能是要尋找渡假資料, 也可能是要尋找咖啡資料, 若使用目前的ranking方式, 並無法讓使用者快速找到訊息, 因此讓不同的SERP出現在使用者面前, 是Google明年即將進行的大工程

這個變革將改變了什麼? Pagerank不再只以backlink為主要依據, 因此黑帽式的SEO將喪失優勢, SEO的技術勢必會有一個全面洗牌

除了個人化搜尋之外, Google在明年還將有其他重大技術改革, 因此持續觀察並調整策略是SEO的重要課題, 在明年結束前應該就會有確定的答案, 如果無法隨時跟上Google或其他搜尋業者的腳步, 可能就會在這波趨勢上滅頂...

參考: System and method for providing preferred language ordering of search results

標籤: , , , , , , ,

繼續閱讀

2008年11月5日 星期三

SEO策略 : 如何產生更多的backlink?



前文"SEO實例 : 請大家都去撞牆"舉出了一個黑帽式的link策略, 也是目前SEO業者最常用的策略, 這個方式雖然目前有用, 但卻是走在鋼索上的作法, 也非常容易被任何人識破, 並且對於網站的信賴度會大幅降低

如果SEO業者只會使用這類策略, 會逐漸失去客戶的信任, 除了這個方式之外, 還能夠有哪些方式產生更多的link呢...

談到link generation, 可以分成兩大類: 自我頁面的link與外部頁面的link

(1)自我頁面的link就是當你的某篇文章談到某個主題, 而跟你之前文章關係密切, 你就可以在本文中去建立自我頁面link (如前段文章舉出先前文章提過的內容)

這樣的link策略可以讓各篇文章形成關聯, 但是前提是必須真正有關聯, 這種自我連結在計算PageRank及連結數也是有幫助的, 並且可以將相關文章串聯起來

(2)另外自我頁面的link就是部落格結構的tag(標籤), 這些tag也可以讓各個不同篇幅形成關聯

前者(1)自我頁面的link, 切記要注意anchor text, 盡量不要用"這一篇文章", "這裡"...一些無意義的文字, 最好使用很中肯的關鍵字或使用該篇文章的title, 這樣可以加強link的效果, 我們在"SEO策略 : OnPage & OffPage SEO"已經提過

後者(2)自我頁面的link也就是部落格結構的tag(標籤)

儘量不要使用如

"WebsiteOptimization" 或
"Website_optimization"

而要使用

"Website Optimization" 或
"Website-optimization"

因為前者tag搜尋引擎不一定能夠正確解析(parse)成兩個字

Website optimization不一定等於WebsiteOptimization或Website_optimization

但後者搜尋引擎可以解析

Website optimization等於Website Optimization或Website-optimization

也就是空格與中線("-")是搜尋引擎比較能夠清楚分隔英文的方式

再來談外部頁面的link, 就是指其他網站連結到你網頁的link, 方式敘述如下

(3)Social bookmark

這裡指的是社交網路上的link, 如網路書籤, 部落格社群, web2.0回覆, 論壇簽名檔...等

進行這類的link活動, 需要特別注意, 因為稍不留意會由白帽變成灰帽或黑帽

黑帽與灰帽式就是大量毫無意義的自我增加link, 或大量製造相同或類似的link, 白帽,灰帽或黑帽的界線對於電腦而言很難畫分, 但可以用人工方式去判讀這些link是否惡意製造

(4)再來就是跟內容息息相關的, 如果你能夠提供資訊性的、新聞性的、幽默性的、另類性的、工具性的、插件性的內容的話, 也可以引起其他人爭相link你的網頁

但是說起來容易, 不同類型的網站要提供以上的內容方式不盡相同, 其難度也相當高

舉個例子, 本站提供了本土化的PageRank貼紙, 就在短短三個月的時間增加了兩萬多個backlink, 並且許多網站都相繼推廣, 因為他可以隨時監控各頁面的PR值, 讓您瀏覽網頁時就可以注意PR變化而採取不同的SEO策略...

雖然只是一個小小的工具, 但是卻能夠發揮不小的作用

資訊性的、新聞性的、幽默性的、另類性的、工具性的、插件性的內容不能是普遍大家都知道的, 必須具備獨特性, 這些內容的產生除了必須時常注意網路上相關網站的動向之外, 最重要的就是多讀紙本的書籍

許多人由於網路上瀏覽習慣養成後, 可能已經不再買書看書了, 但是許多正確而有用的資訊還是必須不斷大量的透過傳統的閱讀來取得的...

如果您能夠依照以上的SEO策略來進行, 相信可以用白帽式的方法來產生不少有用的backlink

標籤: , , , ,

繼續閱讀

2008年10月21日 星期二

SEO實例 : 請大家都去撞牆

現在談一個讓大家都想去撞牆的實例, 您猜猜如下面這樣頁面的網站他的PageRank到底有多少? 您沒有看錯...頁面就是只有一個畫面加上一個唸經式的音樂, 完全沒有內容或者連結...




以上這個垃圾網站的PageRank竟然高達6...

經過PageRank Hijack的觀察, 其PageRank也是真的...

再來透過Google與Yahoo的backlink資料, 其Google的backlink有812個, Yahoo的backlink有18,779個

再經過這些link的連結往下看...

原來就是透過SEO業者最喜歡使用的, 在各網站張貼垃圾link或簽名檔, 只是這個站長時間應該是多得早晚都在數螞蟻, 堅忍不拔的把垃圾link拱到了上萬個...這個網站是目前看過垃圾聯結玩得最過火的

由這個例子可以瞭解, Google的PageRank演算法已經出現了很大的漏洞, 因為他分不出來推薦聯結與垃圾聯結 (但不表示未來不會修補)

但是雖然他把PageRank推到了6, 但是因為網頁幾乎沒有內容, 因此幾乎沒有SERP的表現

這種垃圾link的方式, 在目前屬於有效的黑帽式SEO, 但是卻破壞了該網站的creditability(可信度)

這個可笑的網站在DMOZ ODP的網站目錄中將之分類為 Top: Recreation: Humor: Useless_Pages, 也就是"Basically, pages with no purpose other than to be funny, odd, strange or stupid."

原來笨到極點的網站還可以被收錄來當笑話...哈哈, 只是Google沒注意到這點, 忘了調整PR, 還是它是屬於笑話第六級? 不得而知...

相信該網站如此作法, 應該是想高價賣出網域, 但是如果知道內情, 應該不會有正常的企業會想購買

而且只需簡單幾個步驟就可以知道這個PR6是怎麼來的, 因此雖然目前尚屬有效提高PR的作法, 但是卻很可能鬧得太出名而被搜尋引擎除名

標籤: , , ,

繼續閱讀

2008年10月17日 星期五

SEO觀點 : Google Analytics & PageRank



對於免費提供給網站站長使用Google Analytics, 到底Google打什麼如意算盤? 其背後的目的早已經被許多人懷疑, 因為這些工具在一般的網路公司都非屬於免費服務, 使用或不使用Google Analytics對於PageRank或SERP是否有任何影響?

Google在近年推出許多大部頭的免費服務, 當然天下沒有白吃的午餐, 既然是免費的, Google當然希望從中取得除了金錢之外的東西, 或者從third party取得其他的利益

這兩篇文章就談到了這些議題:

Why Google Analytics might be bad for your PageRank
Google's Gain in Google Analytics

Google在提供Analytics的背後獲得了什麼?

(1)了解網站的流量/來源, 這些資料就成了分析線上廣告的最好資料
(2)透過這些資料可以精準的定義PageRank, 讓SERP更加符合使用者需求

這兩項資料是所有網路業者夢寐以求的, 而Google就是具有先天優勢來取得, 目前Yahoo正朝著同樣的方向前進

因此, 如果您的網站並非大流量, 而您正在進行系列的SEO作業, 就必須思考是否要使用Google Analytics, 因為可能會曝露您網站的缺點, 如果您的網站流量不小, 那就趕緊使用Google Analytics, 讓您的PageRank/SERP更符合實際狀況

標籤: , , ,

繼續閱讀

2008年10月1日 星期三

SEO策略: PR5+PR4=PR6?

許多網站會碰到一個類似的網址問題, 就是網址前面有無WWW都可以連到同樣的站台, 更有些網站使用多個網址指向同一個站台, 當這樣的狀況產生時對於網頁的評分,backlink的計算及SERP的結果到底有哪些影響呢?

有些專家指出, 若您有兩個網址(如www.dns.com.tw與dns.com.tw)都指向同一個網站, 而其PR各為5與4的話, 如果您把這兩個整合為一, 將可獲得一個PR6的站台...真的假的?

我們實際測試的結果, 答案是否定的, 但是 ... 裡面還有許多值得思考的地方

不同網址指向同一個網站, 有幾種情況:

(1)使用DNS Server的A Record或CNAME來指向同一個Server(IP), 並在Apache或IIS設定允許該URL(或沒設定禁止, 當然太開放會引發另外問題, 他文再談)

如果該Server有www.dns.com.tw/blog, 則也有dns.com.tw/blog, 或有www.another-domain-name.com/blog

(2)使用DNS Cloaking Redirect來轉址

當使用虛擬主機與third party DNS Service時, 可能就無法使用DNS Server的A Record或CNAME來指向同一個Server(IP), 這時候DNS Cloaking Redirect就可能被使用

(3)使用302 Redirect與301 Redirect, 及meta refresh

302 Redirect又有on-domain/off-domain之分

所謂on-domain 302 Redirect例如將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.dns.com.tw/prog1, 或反向轉

off-domain 302 Redirect則是將www.dns.com.tw/prog.php?sessionid=5553666717176266362671轉到www.another-domain-name.com, 或反向轉

301 Redirect與302 Redirect的分別是: 301 Redirect為"永久轉址", 302 Redirect為"暫時轉址", 兩者對使用者沒有差別, 但是對於search engine的差別是, 被301 Redirect的page就不被index

如http://athletics.mlb.com被302 Redirect到http://oakland.athletics.mlb.com/index.jsp?c_id=oak, 如果您使用"oakland a’s"當關鍵字在Google Search, 會看到athletics.mlb.com

根據Yahoo與Google的文件, 說明基本原則如下

Yahoo在處理301,302,meta refresh上, 其處理方式為:

- 使用301, 302由domain A->domain B, 則index domain B
- 使用302由domain A URL->domain A其他URL, 則index前者
- 使用301由domain A URL->domain A其他URL, 則index較上層的URL
- Yahoo處理meta refresh為301 redirect

Google在處理301,302,meta refresh上, 其處理方式為:

- Google處理meta refresh為302 redirect
- 使用302 redirect, 則index source, 也就是index來源頁
- 使用301 redirect, 則index destination, 也就是index目的頁

但實際上, Google可能會處理off-domain 302 Redirect與301 Redirect為相同, 也就是URL A->URL B的話, URL A就不index, 而以URL B為目標

因此這麼多的狀況下, PR與backlink的轉移就不是redirect就會轉嫁, 不同的search engine在處理這些問題上也有不同的作法, 所以PR5+PR4=PR6? 答案是Yes and NO, 必須以長期與短期效益來仔細分析才能獲得最佳狀態

參考工具: Redirect Checker

標籤: , , ,

繼續閱讀

2008年9月27日 星期六

Google PageRank 於9/27陸續更新

上次最近的Google PageRank Update在2008/7/24左右, 當時本部落格由零變四, 現在Google的各Data Center又陸續開始更新PageRank, 目前看到本部落格內頁的PR部分已經由零到三, 是否最後更新會有什麼驚喜...

Google每次更新PageRank都會造成不小的震盪, 如去年對於paid link的處罰, 讓許多大站都應聲倒地, 甚至於還有一些重量級人士說要出來抗議抵制, 最後都是沒有下文

本站也是無辜受到牽連, PR由五被降到三, 原因也是被Google判定為銷售link, 後來經過說明後Google又將本站PR調回原值, 因此不管是PR升值或降值, 其實一定有許多都可能與事實不符的情事

也曾經看到許多網站在某些SERP的表現優秀, 但一經檢驗就發現許多黑帽SEO的證明, 有些明明內容精彩卻又排在SERP非常後面的位置, Google的演算法顯然還有很多不完善的地方

但是不管如何, 大家就靜候PageRank的最後更新結果吧, 預計應該在幾天到一週的時間會完成所有更新

標籤: , ,

繼續閱讀

2008年9月26日 星期五

什麼是PageRank Hijack?

顧名思義"PageRank Hijack"就是PageRank綁架, 也就是所謂的Fake PageRank

再說清楚一些就是利用黑帽方式來欺騙search engine, 在PageRank的評分上創造出假的數值

例如您手上有一個網域your-domain-name.com, 原本站台www.your-domain-name.com其PageRank為零, 但利用search engine的演算法漏洞, 把www.your-domain-name.com快速提升到零以上

這樣的手法有何目的? 我們如何辨別Hijacked PageRank或Fake PageRank?

在說明整個內容之前, 我先舉一個發生在今年七八月間的實例 (詳細人名等資料就不公開)

話說有一個可能缺錢缺到發慌的人, 他去註冊一個過期的網域名稱 (Domain Name), 這個網域名稱在2002年到2005年被使用, 2005年三月之後就不再營運, 後來就被這位仁兄在2008年七月註冊起來, 他利用URL Redirect的方式把該URL的PageRank造假到PR=7, 剛好因為Google PR Update在2008年七月底左右進行全面更新, 所以這位仁兄很快就讓該URL達到PR7, 在短短幾天就讓他幸運的把PR0->PR7, 還在網路引起許多不熟悉search engine的人稱羨

透過URL Redirect到別人的網站後, 等待Google PR Update後, 再把URL Redirect回自己的網站, 此時就看似擁有一個高PR的網站, 目的就是要高價銷售網域名稱

這位仁兄得逞之後, 在DNForum就張貼廣告開始大吹特吹, 說他有一個特好的網域名稱要割愛, 結果被DNForum的專業級人士吐槽

為什麼會被吐槽? 因為手法太兩光了, 兩光在哪裡?

(1)對search engine有點了解的人都知道, PR0->PR7在不到一個月的時間完成是不可能的
(2)Google在2005年以後已經修改演算法在處理PageRank Hijack的問題
(3)Wayback Machine可以把網站歷程記錄, 該網站中間兩年斷掉, 不可能快速恢復PR
(4)使用Google搜尋技巧就可以破解Fake PageRank

雖然網路上有一些PageRank Validation Tool, 但大多不好用, 其實Google本身就可以確認(如下)

在輸入欄打入 info:URL-to-Check

URL-to-Check就是指要查詢的URL



如果經上面方式查不到資料或上圖中的(1)(2)的URL不是同一個, 就是經過URL Redirect, 而URL 2的PageRank就會被URL 1所綁架

但是因為Google演算法的改版後, 已經對Fake PageRank做篩選, 因此URL Redirect並不保證能夠綁架PageRank

也就是說, URL Redirect不一定能綁架PageRank, 就算你綁架了別人的PageRank, 也會輕易的被辨識出來

況且當綁架別人網站的PageRank後, 等於向search engine說你的網站是不存在的, 因此所有內容就不會被index

最後一句話

好好做人, 不要使用詐欺的手段來造假, 魔高一尺 ... 道高一丈

後續再找時間來聊Fake PageRank Detecting Algorithm ...

標籤: , , , ,

繼續閱讀

2008年9月22日 星期一

SEO : SERP名列前茅有用嗎? 看看Eye Tracking實驗

當您在網頁上瀏覽資料時, 眼光到底聚焦在什麼地方, 一直是科學家有興趣的題目, 如果能夠統計出一個可靠的資訊, 不僅對網路廣告商是一大福音, 對於研究SEO的人也可以有不少的助益, 我們就來研究看看這些結果與您的習慣有哪些差異 ...

這篇"Distribution of Clicks on Google’s SERPs"文章, 實驗認為網路搜尋結果(SERP, Search Engine Results Page)的前幾個項目(約是第一到第三名)會佔用大部分的目光, 依序往後遞減, 但最後一個項目卻反常的會被瀏覽者注目, 而在點選率而言, 中間部分項目(第七項)的點選大多在瀏覽整頁後才進行點選

當然以上的數據一定會有差池, 但是說明了一個趨勢:

-- 排名在SERP頁面的前三名, 被注目的比例較高
-- 排名在SERP頁面的中段, 反而會在最後才被點選

其實以上數據還牽涉到顯示項目的Title與Description, 大部分人瀏覽SERP時, 會先看Title, 在螢幕上可以看到的Title看完, 再往下滑(Scroll)看其他內容, 有些情況看到該Title剛好就是您要的就進行Click, 如果Title不太清楚, 再去讀Description, 而上面的趨勢顯示的是: 大家都不太有耐心, 因此看完前幾項就會往下滑, 至於是否能夠概括所有使用者行為, 就見仁見智了 ...

另外一個Eye Tracking的研究是Microsoft的"An eye-tracking study of information usage in Web search:Variations in target position and contextual snippet length", 這個研究與上述結果大同小異, 也是SERP前幾項較容易被注意, 但稍有不同的是實驗顯示, Description太短的比較不會被點選, 而另一個特別的是"第七項" ...

當SERP頁面被來回瀏覽後, 第七項目被點選的機率又逐漸高出後面項目, 真的是Lucky Seven ...

另外一篇"F-Shaped Pattern For Reading Web Content"則研究不同類型的網頁, 來看使用者目光的聚焦度, 該研究認為使用者在瀏覽網頁時會因網頁類別的不同而有差異

網友在瀏覽一般文章與電子商務內容時會有呈現類似"F"形狀的聚焦(如下圖1,2), 而瀏覽網路查詢頁面時會呈現"E"形狀的聚焦(如下圖3), 所以使用者幾乎不太觀看一般文章與電子商務內容的下半部, 但網路查詢頁面(SERP)反而是中間部分常會被忽略, 這個結果與上兩個實驗有異曲同工之妙

(圖1)


(圖2)


(圖3)


這篇"Google’s Golden Triangle"也提及類似的聚焦結果, 不過這種結果似乎不同年代會或多或少有差異, 如這篇在2005年與2008年的資料顯示, 使用者越來越沒耐心看完所有資料了 ...

這篇"Eye tracking and online search: Lessons learned and challenges ahead"更具體的說明了一些數字, 96%的查詢結果, 只有第一頁會被瀏覽, 並且只有前幾個項目會被點選, 如果前幾個點選沒有意義, 則使用者會放棄該查詢結果, 並且在Google與Yahoo的搜尋行為分析中顯示, Google的使用者會花較多時間在閱讀查詢結果內容

最後總結是: SERP的結果如果不能在前三名, 倒不如列在該頁底部, 並且頁面的Title文字敘述應該更加清楚明瞭, 以增加被點選的機率


標籤: , , , , , , , , , ,

繼續閱讀

2008年9月17日 星期三

SEO : inception date的意義

所謂inception的意思是初始, inception date就是初始日期, 一個網頁文件的初始日期對SERP(Search Engine Results Page)的影響在前文已經討論過, 我們現在來看看Google如何決定網頁文件的inception date ...

根據Google的專利文件US 7,346,839 B2的說明, inception date由好幾個方式來決定

(1)由搜尋引擎抓到該網頁文件的日期
(2)由該網頁文件所在domain之註冊日期
(3)該網頁文件被其他網頁文件關聯的日期
(4)由儲存該網頁文件的伺服器time stamp

找出以上日期後, 依最早的日期或經演算法判定該網頁文件之初始日期, 這個日期就會影響該網頁文件的評分, 新網頁文件有10個backlink, 會比十年前的網頁文件具有100個backlink來得好 ... 但是也有可能會有例外

什麼時候會出現例外? 當演算法由初始日期與backlink的計算中, 發現異常數字時, 會將之歸類為spam, 這個時候就會降低原本的評分

而什麼是異常數字? search engine會由正常的網頁文件中的inception date與backlink, 算出一個參考值, 如果某網頁文件的backlink成長率超出一個範圍, 就是異常, 至於正常成長率是多少? 超出的範圍是多少? 這個資料並沒有揭露, 但是我們可以由幾個方式了解

(1)一些PR同等級而且值得信賴的網頁的backlink平均成長率
(2)自己網頁的成長率曲線 (參考)

由他站的成長曲線可以知道曲度(slope), 由自己網頁的成長曲線可以知道是否平滑, 如果往上成長的曲度合理並且平滑, 大致就沒麼問題, 但是一定會有被誤判的情況, 不過如果時間拉長, 以上的計算不失為蠻精準的演算法


標籤: , , , , , , , , ,

繼續閱讀

2008年9月16日 星期二

SEO : SERP的影響公式探討

在之前文章"Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"談到時間因素會對SERP (Search Engine Results Page)有所影響, 到底是怎麼個影響法呢? 我們由Google的專利資料中來研究一下 ...

第一個公式:


其中
H: History-adjusted link score
L: Link score given to the document (也就是PageRank U.S. Pat.No. 6285999)
F: elapsed time measured from the inception date associated with the document
(詳細關於inception date, 後續再來談)

由以上的公式可以知道, 剛開始link score會放大, 然後慢慢以平滑曲線遞減
L=5, F=1, H=10.47
L=5, F=2, H=8.30
L=5, F=3, H=7.15
L=5, F=4, H=6.42
...
L=5, F=59, H=2.80
L=5, F=60, H=2.79

但是某些SERP data set的average date並無太大差異的情況下, 新產生的網頁就未必有優秀的SERP,所以你會看到某些查詢結果幾乎不太變動, 但某些查詢結果卻一日數變, 就是這個因素

第二個公式:


其中
U: Update score
f: a function, such as a sum or weighted sum
UF: Update frequency score
UA: Update amount score

也就是網頁的更新頻率與更新量會來決定U, 同樣的如果SERP data set的average date-of-change並無太大差異的情況下, 以上公式就不會去影響SERP

至於search engine如何知道哪個網頁有更新呢? 更新量如何呢? 基本上search engine不可能把所有頁面都全部cache, 某些頁面就以signature來判斷(例如在頁頭抓一個字,頁中抓一個字,頁尾抓一個字,如此就能產生該頁面的signature), 當signature變動時, 就知道本頁已經update

至於update amount就可以用多個signature來判斷, 例如一個頁面中的10個signature有3個已經變動, 就比10個signature中有2個變動有較多的update amount, 當然不一定精準, 但平均而言差異不大

所以根據你下的關鍵字所產生的SERP, 其特性到底是哪個種類?

是否會因時間而影響? 如果不會的話, 新網頁就很難打破這個SERP

是否會因更新頻率與更新量而影響? 如果不會的話, 你再如何時常更新也於事無補

因此瞭解了以上的公式, 對您網頁的SEO多少有些助益

標籤: , , , , , , , , ,

繼續閱讀

2008年9月5日 星期五

SEO for Dummies : SEO白癡手冊

許多經營部落格的人, 常常剛開始充滿熱情, 但寫到最後因為幾乎沒有人看而退出江湖, 其中不乏有許多精彩內容的部落格, 為何沒有人看? 因為經營部落格的方式錯誤, 並且沒有做到基本的SEO (Search Engine Optimization)

這篇文章來談談以非技術觀點下, 您可以輕易運用的SEO方式, 因為連白癡都看得懂, 故名為"SEO for Dummies : SEO白癡手冊", 所以沒有任何特別誣蔑的意涵 ...

由於本篇文章定位為入門, 所以必須把SEO先做最簡單的解釋

SEO(Search Engine Optimization)就是指運用一些方式, 把您的網頁調整成搜尋引擎喜歡的方式, 一但被搜尋引擎喜歡以後, 就比較容易被網友找到, 當然流量就會增加

談到流量, 我們先談談網友到訪您的部落格的三種方式 :

(1)在瀏覽軟體打入您部落格的網址, 或由他們的"我的最愛"進入您的部落格
(2)透過別人的網頁上的連結, 點選後進入您的部落格
(3)透過搜尋引擎打入您部落格的名稱或關鍵字, 由搜尋引擎連到您的部落格

另外一種是搜尋引擎或網路機器人, 透過指令式方式進入您的部落格, 這點與本文無關, 我們就不談

因此以上三種方式就決定了您的部落格的流量

所以建議剛剛成立部落格的人, 最好先使用大型入口網站的部落格服務, 等流量到達一個程度後, 再另外擁有自己網址(註一)的部落格 (如本站 : http://www.dns.com.tw/blog), 這樣才能累積自己網址的信用度(註二)

(註一:以上姑且以網址代替網域名稱, 以方便入門者瞭解)
(註二:所謂信用度就是搜尋引擎信任您的部落格網址的程度, 當擁有自己網址, 這個信用度才屬於您的)

為何要先使用大型入口網站的部落格服務? 因為您的部落格文章至少會出現在他們網頁(如最新部落格文章...), 也就藉由上面三種流量來源的(2), 會漸漸增加您的流量, 而您的內容如果不錯, 被別人收入他的"我的最愛", 就有了(1)的流量

所以內容不錯以後, (1)(2)的流量就會自然產生

但是上面三種流量來源的(3), 就必須靠自己的調整了, 這個調整的動作就是在做SEO

哪些動作要做呢? 整理如下:

(1)談大家可能有興趣, 但是經過網路搜尋後, 大家比較少談的主題
這點困難度稍高, 但如果能就自己專業範圍內, 盡量比別人早一步談這個主題, 可以建立權威性, 並且內容新鮮度高, 可以容易被搜尋到, 如果有興趣看細節, 詳細內容在: "Query Deserves Freshness (QDF) : 由內容新鮮度談SERP"

(2)最重要的關鍵字一定要出現在"主題(title)"上, 並且如果長度允許, 最好中英文都有, 如本篇的主題:"SEO for Dummies : SEO白癡手冊"

(3)在內文中, 認為有可能可當關鍵字的字串, 以<h1>...</h1>, <h2>...</h2>等tag夾起來, 會顯示如下

SEO for Dummies : SEO白癡手冊

... 但是不要用得太離譜

(4)使用Social bookmark (如funP, Hemidemi ...), 把您的文章自我推薦上去

(5)將您的部落格網址推薦到DMOZ, Google Directory, Yahoo Directory

(6)與朋友較優質的部落格互相交換連結
與其他網站交換連結時必須慎重, 因為根據Google的判定, Bad page會連到Good page, 但是Good page不會連到Bad page, 因此如果您連到一個被Google判定為Bad page的話, 您也會被受到牽連

(7)使用其他的社交網路工具 (如部落格觀察...)

(8)使用PageRank checker貼紙, 可以隨時觀察自己部落格的頁面PR值變化, 當有不錯PR值時, 可以適度在該頁面增加連到自己其他相關內容 (但是如果內容是八竿子打不著的就不必了)

關於PageRank (PR) 如果有興趣可以參考 : Pagerank 演算法研究

(9)使用Counter (如http://www.shinystat.com/), 可以觀察詳細的流量狀況, 或稍微進階者可以使用Google Webmaster管理員工具

(10)Anchor link策略
不管建立Forward link(往別人頁面的連結)或Backlink(連回自己頁面的連結), 在建立連結時最忌諱使用以下的樣子:

<A Href="http://www.dns.com.tw">這一篇可以參考</A>

因為以上"這一篇可以參考"這個字串, 與連往的站台一點都不相關, 這個字串就好像向搜尋引擎介紹一樣, 這個介紹詞就成了此互連網頁的關聯, 不管是Forward link或Backlink都要仔細編輯這個字串

(11)使用NoFollow
在一個頁面中雖然可以有無數的Forward link(往別人頁面的連結), Google也都可以抓到, 但是一個頁面的Forward link最好在數目100以下, 並且如果您不希望Google把某些Forward link也算下去, 您可以使用如下的語法

<A Href="http://www.yahoo.com" rel="NoFollow">Yahoo</A>

減少一個頁面中的Forward link數目, 可以防止被不必要的頁面去瓜分評分

當然以上的方式如果要效果明顯, 前提是您的部落格或網站必須要有好的內容, 如果沒有好的內容, 神仙都沒辦法 (之前文章有提到過 : "網路行銷/網路營銷 -- 內容為王"), 但是除了有好的內容外, 如果能夠依照上述方式好好調整, 相信對於流量會有不錯的改善

以上盡量以比較淺顯的方式, 來說明如何讓不懂技術的人來進行SEO, 如果有任何意見或建議, 歡迎多多指教啦 ...

標籤: , , , , , , , ,

繼續閱讀

Query Deserves Freshness (QDF) : 由內容新鮮度談SERP

什麼是Query Deserves Freshness?

就是在搜尋時SERP會因為內容的age而出現不同的結果, 也就是說, 新的頁面在某一段時間內, 其SERP會比舊資料更有優勢, 那到底這段時間多長? 這種現象是否合理? 與其他SERP規則有無牴觸?

我們先撇開所有既有的想法, 純粹由使用者觀點來看的話, 使用者當然希望找到最新的資料, 並且要找到最正確的資料

如果所有的網路文章撰寫者都是很負責任的話, 當然最新的資料等於最正確的資料是可以成立的, 但是 ... 網路文章撰寫者都是很負責任的嗎? 所以很有可能新資料有可能是不成熟的

如果您看過之前文章, 應該會同意我的看法, 如果還沒看過的話, 不妨由以下連結去瀏覽一下

"你在看誰的部落格? 是誤解還是事實?"
"他們不會知道你是一條狗"
"你在看誰的部落格? 一個目前沒有答案的問題"

話說回來, 另外有些資訊是不會變的, 這時反而舊資料是可能比較權威的, 例如許多wikipedia上的資料初始日期是很早的, 並且後續還有許多更新

到底Google在處理這些資料時, 如何判斷哪個頁面是fresh(新鮮)? 哪個頁面是stale(陳舊)?

在Google的專利資料顯示了許多影響SERP的因素: "Information retrieval based on historical data", 對於想要研究SEO的人應該好好閱讀, 這裡面就隱含了所有影響SERP與PageRank的因素

如果能夠把Google近期的專利都讀完, 大概您對search engine就能有更深一層的瞭解了, 以下是相關資料(html與pdf), 如果您沒有時間讀那麼多密密麻麻的資料, 我在後續文章會再說明這些內容

DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE
Publication number: US 2007/0094254 A1
Filing date: Nov 20, 2006

DOCUMENT SCORING BASED ON DOCUMENT CONTENT
Publication number: US 2007/0100817 A1
Filing date: Nov 21, 2006

DOCUMENT SCORING BASED ON QUERY ANALYSIS
Publication number: US 2007/0088692 A1
Filing date: Nov 22, 2006

DOCUMENT SCORING BASED ON LINK-BASED CRITERIA
Publication number: US 2007/0094255 A1
Filing date: Nov 30, 2006

DOCUMENT SCORING BASED ON TRAFFIC ASSOCIATED WITH A DOCUMENT
Publication number: US 2007/0088693 A1
Filing date: Nov 30, 2006

Personalizing anchor text scores in a search engine
Patent number: 7260573
Filing date: May 17, 2004
Issue date: Aug 21, 2007

Information retrieval based on historical data
Patent number: 7346839
Filing date: Dec 31, 2003
Issue date: Mar 18, 2008

光從上面的專利標題, INCEPTION DATE, DOCUMENT CONTENT, QUERY ANALYSIS, LINK-BASED CRITERIA, TRAFFIC ASSOCIATED WITH A DOCUMENT, anchor text, 您大概就可以知道Google在對網頁評分的標準了, 這些因素在之前一系列SEO文章也都提過

話題扯遠了 ... 我們回到主題, 本篇只談文章的新鮮度

現在假設有一篇熱呼呼的文章剛被Google抓取, 姑且稱網頁A其初始時間(INCEPTION DATE)為2008.09.05 12:00:00, 這篇文章會不會出現在SERP的第一頁, 就完全取決於query analysis後, 網頁A內容與keyword的相關性緊密度評分, 如果評分後有其他網頁更優勢, 當然網頁A就被排擠下來

如果相關性緊密度評分相等或相近, 並且這個SERP set中的其他頁面, 其他評分並不顯著優勢(如backlink), 這時網頁A就可能出現在SERP的第一頁, 但是這個優勢會隨著時間因素而遞減(公式後續再談)

網頁A如果在因時間因素遞減下, 但增加了自然的backlink, 就可能繼續存在SERP第一頁

網頁A如果在因時間因素遞減下, 沒有增加自然的backlink, 若其他頁面也同樣沒有增加自然的backlink, 網頁A也可能繼續存在SERP第一頁

對於Google而言, 網頁A如果在一週內有10個自然的backlink, 其link analysis評分當然比存在一年的網頁B具有30個backlink要優秀, 但是這裡強調的是"自然的backlink", 非自然的backlink就可能會被演算法抓出, 以人為的方式降級或列入sandbox中

這也就是為什麼一些很新的網頁會出現在SERP第一頁的原因, 但是別太高興, 如果內容不好, 就會被其他相關文章擠下去

有興趣的話, 請期待後續文章啦 ...

標籤: , , , , , ,

繼續閱讀

2008年8月29日 星期五

Semantic Ranking : Search Engine 的另一扇窗

由前文"Pagerank 演算法研究"與"SERP v.s. PageRank : PR值與搜尋排前的關係", 我們瞭解了影響網路搜尋結果的幾個因素

但是網頁的互相連結並無法表示支持的程度, 目前PageRank計算一概以均分的方式, 而網頁互相連結也無法表示網頁間的關聯, 如科技類的網頁A連接到科技類的網頁B, 對於網頁的重要度評比, 當然應該比生活類的網頁C連接到科技類的網頁B要來的重要

而使用網頁結構與keyword的關聯性來產生SERP的結果, 也有可能出現錯誤的狀況, 比如keyword為"SERP PageRank" 與 "PageRank SERP", 就可能產生不同的SERP結果, 同義與相近詞也無法透過搜尋有效率的尋找

這些都是由於PageRank與SERP目前都尚未真正融入Semantic語意技術, 沒有語意技術實在很難以分析這麼多看似不相關的資料 ...

"Context-Aware Semantic Association Ranking", "Ranking Complex Relationships on the Semantic Web", "Ontology-Driven Semantic Ranking for Natural Language Disambiguation in the OntoNL Framework" ... 等等文章就提出了Semantic Ranking的概念, 希望以語意的關聯來建立網頁間的關係, 如果您希望看更多訊息, 可以用"semantic ranking"去進行搜尋

什麼是Semantic Ranking? 就是用語意技術去評比網頁, 當您下一個關鍵字, 網頁就可以用semantic ranking的大小來依序顯示, 不像現在只是純粹比對字串

當網頁間存在Semantic Connectivity (語意連接性) 或Semantic Similarity (語意相似性), 就是存在Semantic Association (語意關聯性)

例如: 當網頁A的內容討論車子的性能, 網頁B的內容討論重型機車的性能, 網頁C的內容討論BMW汽車的性能, 網頁D的內容討論寶馬汽車的性能, 則網頁A-C,A-D互相具有Semantic Connectivity, 網頁C,D互相具有Semantic Similarity, 而網頁B則可透過另外網頁與網頁A產生另外一個Semantic Connectivity

不過可惜的是以舊有的網頁語法, 如果沒有使用RDF (Resource Description Framework), 比較困難建立這些關係, 如何在既有的HTML語法下, 或簡化使用RDF的方式來改善PageRank與SERP是Search engine的一個困難的難題

如果這個問題可以解決的話, Search engine的市場就可能重新洗牌, SEO的方式可能就全面改觀了, 拭目以待吧 ...

標籤: , , , , , , , , ,