2009年2月26日星期四

Canonical link element : 標準鏈結元素


Google, Yahoo!, Microsoft Live在二月12宣佈支援標準鏈結元素(Canonical link element), 目的在解決內容重覆的問題, 啥是標準鏈結元素? 網頁內容重覆又會造成啥問題?

如上圖簡單解釋標準鏈結元素, 眾多不同的外部連結可能都進到一個相同的網頁

如:
http://www.domain.com/index.html
http://www.domain.com
http://domain.com
http://www.domain.com/index.html?sessionid=hfjsklahdf7678234681
...等等

以上Link對於搜尋引擎來說, 可能都視為不同的URL

造成這種情況, 可能是無意也可能是故意, 但是這樣會造成搜尋引擎浪費時間與空間在做同樣的事情

標準鏈結元素(Canonical link element)就是要解決這個問題

如果這些URL內有以下這個宣告, 也就是Canonical link element
< link rel="Canonical" href="http://www.domain.com/index.html" >

告訴所有由不同URL進入的搜尋引擎, "http://www.domain.com/index.html"是這個URL的統一標準進入點

如此一來搜尋引擎就只需index一份資料

但是這個標準鏈結元素(Canonical link element)宣告, 對於一般blogger來說, 並沒有太大意義, 因為blogger並無法自己去宣告, 這個完全控制在blogger framework或CMS(Content Management System)上, 所幸陸續這些系統會把標準鏈結元素加入他們的系統中

以下是Matt Cutts對於Canonical link element的解釋


相關訊息:
http://www.mattcutts.com/blog/canonical-link-tag/
http://www.webpronews.com/topnews/2009/02/25/googles-matt-cutts-on-canonical-again
http://www.bretteleben.de/lang-en/joomla/canonical-url-modul.html
http://seoblogspot.com/canonical-url-tag-most-important-advancement-seo-practices-sitemaps
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html
http://blogs.msdn.com/webmaster/archive/2009/02/12/partnering-to-help-solve-duplicate-content-issues.aspx
http://ysearchblog.com/2009/02/12/fighting-duplication-adding-more-arrows-to-your-quiver/

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月25日星期三

Copy-Paste and Done?


最近受到IEEE的國際研討會之邀, 替他們review稿件, 看這些投稿的文章是否符合國際水準在研討會發表, 看了這些來自各國的所謂高級知識份子的文章後, 赫然發現了一般學生常發生的"COPY-PASTE"竟然也在這些教授學者間發生了...

當個審稿者(Reviewer)最頭痛的就是無法精通各種領域, 就算是在某個領域精通, 當你看到一篇應該是你精通領域的文章, 但你竟然看不太懂某篇看似很有條理的文章時...你會有點遲疑: 這篇文章到底是超乎水準, 所以才看不懂?...還是真的是狗屁不通才讓你看不懂?

有時真的會很怕誤人前途, 把別人嘔心瀝血之作退稿, 更怕的是把扯爛的文章讓他流傳出去, 讓後面可憐的博碩士生去K這些垃圾

話說看到一篇旁徵博引的文章, 裡面數學公式更是證明詳細, 但是看完之後總覺得數學式表示得怪怪的, 並且談的內容似乎應該是五六年前的東西, 但是因為論文的格式實在四平八穩...因此卡在退與不退之間徘徊, 就這樣遲疑了一個星期

後來實在難以決定, 因此使用了Docoloc(如上圖)

Docoloc主要是用來判斷文章是否為剽竊之作, 他可以跟網路上百萬多篇文章作比較, 計算出剽竊的比例

結果...BINGO, 果然是抄襲別人多年前的論文, 剽竊比例竟然高達50%以上, 而數學公式的上下標因為COPY-PASTE的關係, 沒有正確出現上下標的格式, 難怪總覺得怪

再來使用Docoloc來檢查其他各篇的論文, 雖然不算是完全剽竊, 但竟然也出現許多是整段文字的COPY-PASTE, 大概是引用別人觀點時, 懶得自己再敘述, 不敢置信的是一般學生常發生的"COPY-PASTE"竟然也在這些教授學者間發生

技術日新月異, 不管是學術論文還是網路上的創作, 不要以為抄得神不知鬼不覺, 現在的fuzzy search, similarity check...等技術, 已經讓抄襲不再像以前一樣那麼容易了, 應引以為戒...停止COPY-PASTE的習慣吧

標籤: , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月24日星期二

No Space, No Liberty


啥是"No Space, No Liberty"? 就是指沒有自己的空間, 就沒有自在的活動自由, 這裡說的空間指的是網路上儲存資料與程式的空間, 也就是說沒有自己可以完全掌控的空間, 你就只能在別人的主宰下, 奢享別人給予你的局限的自由, 此話怎講?

在虛擬空間裡, 目前一般人好像有很多空間, 用不完的email space, 塞不完的影音與部落格space, 想要forward啥就forward啥, 想要貼啥就貼啥, 想要屁啥就屁啥...看起來好自由, 不是嗎?

但是這是用你的『時間』與『隱私』換來的...你的時間造就了Google, 造就了一堆Web 2.0網站, 你的隱私讓這些網站可以進行置入性行銷, 當他們賺得飽飽的, 卻沒有太多回饋...只好給你更多的space, 讓你繼續付出你的『時間』與『隱私』

OK, 那我自己買空間自己架站好了, 這總有自主權了吧!?

這個自主權的控制者只是由Google或Web 2.0網站, 轉到了Hosting業者...前陣子想安裝某個程式, hosting業者說該平台為舊版本OS, 無法安裝...需要另外申請轉移....如何如何

就因為可能需要服務中斷, 作業又太麻煩了而作罷

OK, 那我自己買伺服器來架站好了...這個自主權的控制者又由Hosting業者轉到了域名註冊商與寬頻網路提供者...當你斷訊後可能又需要承受更多的痛苦...因為你不是A咖, 斷訊並不是那麼重要

所以不管如何, 使用者永遠是待宰的羔羊, 如果你並不覺得如此, 只是因為你需要的自由度太小了, 你要求的隱私權太小罷了...

No Space, No Liberty, 就算有了space, 還是沒有liberty, privacy, 在Internet裡想要談liberty與privacy, 好像是很遙遠的事情...


標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月20日星期五

Yahoo的新廣告利器 : Rich ADs in Search


Yahoo將在今天(2/20)宣佈推出整合影片及圖片的Rich ADs in Search, 讓使用者在搜尋時不再只是出現文字式的廣告聯結, 目前只在英文版的Yahoo進行測試 ...

在英文版Yahoo如果以Pedigree來查尋, 將會看到如上的畫面, 這樣的畫面希望能夠吸引使用者多注意到廣告並且點選

根據市調公司eMarketer的資料,Yahoo在搜尋廣告方面的市佔率已經從04年的13.8%下滑至今年的10.5%;而同時期,Google則從32.8%躍升至67.7%

Yahoo宣稱這個Rich ADs in Search將提高25%的點選率, 但據廣告代理商Razorfish則表示,他們協助客戶進行的測試效果並不是特別明顯,只比一般純文字廣告的點選率高出5%-10%

相關訊息:
ZDNet:Yahoo將推整合影片、圖形的關鍵字廣告
WebProNews:Yahoo Introduces Rich Ads In Search

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年2月10日星期二

Springer AuthorMapper告訴你什麼?



Springer是一個全球性的科學及商業學術出版商, 於今年二月初推出了AuthorMapper服務, 可以用不同於以往搜尋引擎的介面取得出版文章外, 還可以取得各種相關的統計資料, 目前已經有三百萬篇期刊學術論文, 未來將包含Springer以外更多的出版內容, 這個AuthorMapper除了提供了瀏覽模式的搜尋外, 亦可以用關鍵字來搜尋, 從這個服務我們看到了什麼呢...

從下面資料來看 (2007/1/1~2009年至今在Computer Science主題的出版文章)


中國大陸以1625篇佔第二名, 其他名次為Japan(439篇)居第八, South Korea(184篇)居15, Singapore(146篇)居18, 而台灣則有81篇領先香港的74篇

雖然這個只是Springer一個出版商的資料, 未必能夠代表全貌, 但就統計觀點來看, 台大13篇與新加坡南洋大學的52篇來比較...實在有些離譜了

而就institution來看, 中國以三個單位囊括了前三名(中國科學院,武漢大學,上海交大), 對照台大之前的口號"八十臺大,前進百大", 就又有些諷刺了, 進不進百大並不代表什麼, 但連這些數據都矮別人一大截, 還能搞啥名堂呢??

也許有人會說: 數量並不代表水準, OK, 那我們的品質表現數據拿得出去乎?

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院