2010年1月25日星期一

框計算是什麼? What is box computing?



Cloud Computing (雲端運算)是已經被大家喊到出汁的名詞, 百度大概是要跟雲端運算互別苗頭, 百度CEO李彦宏在2009年8月提出了Box Computing (框計算), 這個到底是什麼東西呢 ...

根據百度的框計算資料:
框計算為用戶提供基於網際網路的一站式服務,是一種最簡單可依賴的網際網路需求交互模式,用戶只要在框中輸入服務需求,系統就能明確識別這種需求,並將該需求分配給最優的應用或內容資源提供商處理,最終返回給用戶相匹配的結果

框計算的實現過程:
1、 首先,用戶的任意一個需求被提交到“框”里;
2、 經過一系列復雜的需求分析,包括語義分析、行為分析、和智能人機交互技術分析,和海量計算,用戶的需求被分發給框後台的某個或某幾個應用所響應;
3、 框背後的應用平臺是開放的,框計算平臺提供了大量即插即用的介面,各種應用可以主動與框計算平臺對接,使自己有機會來響應框所收集到的需求。
再由資料中如下的架構圖來看:



只能說中國對於技術概念的描述, 還真是...難懂

「框計算」這個名詞是硬生生被瞎扯出來的; 李彦宏所謂的「框」就是指網友在搜尋資料輸入資料的那個框, 也就是「輸入框」; 也就是當你在輸入框中輸入問題, 這個系統就會給你所需要的答案;

也就是不要給我搜尋的資料, 而是給我答案 (這個不是在Google, Bing都已經在做的嗎?)

比如你輸入 「我應該在幾歲結婚」, 然後系統就會告訴你應該如何如何 ... (當然這個例子是筆者特別瞎扯的), 所以把整個架構用「框計算」來描述, 有些讓人搞得滿頭霧水, 這個框怎麼會計算呢?

筆者來來回回從去年看完後, 到今年再拿出來看 ... 終於搞懂框計算是要說什麼; 其實百度CEO李彦宏所說的「框計算」就是雲端運算的一部份, 大概是為了噱頭而搞出一個什麼「框計算Box Computing」 ... 這個名詞主要是刻意要讓人肅然起敬的啦 ... 或者故意讓人搞不清楚的 (你有雲計算;咱有框計算 ... 厲害吧)

為什麼說「框計算」就是雲端運算的一部份呢? 或者根本跟雲端運算就是一個樣呢?

李彦宏就是希望百度搞出一個核心架構, 這個架構可以接受外界接進來提供服務, 當外界提供的服務夠多, 能夠解答的範圍就更廣, 能夠回答的正確性就更高, 而這些外界的服務會影響最後的答案 ... 很像Web Services吧!

就軟結構來說, 「框計算」應該就是服務導向架構的Web Services; 就硬結構來說, 「框計算」應該就跟雲端運算一樣; 也可以說「框計算」就是不同功能目的的「雲端運算」

而上面所說的百度核心架構就是阿拉丁計畫, 近期的樣貌就是百度搜索開放平台, 當然百度搜索開放平台還沒能真正做到框計算的功能, 僅在於資料的提供

百度框計算就是指網友在搜尋引擎輸入問題後即時獲得所需要的答案, 這個答案的背後就是由許多提供服務的來源所回應

只是百度所說的「開放接口」會多開放? 如果「開放接口」會影響最後的答案, 以中國的「開放」程度, 能夠符合「開放接口」要求的服務不知道能夠有幾個?

百度框計算是否真的能夠如所說的神奇? 還是只是服務導向計算的簡易版? 還是只是雲端計算的中國分身? 目前尚很難定論, 只能持續觀察看看百度的後續服務來判斷了...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2010年1月14日星期四

搜尋引擎在中國 : Baidu , Google



搜尋引擎基本上跟語言文字的關係密切, 如果再加上國情、文化、政治...等等因素的影響, 搜尋引擎想進入中國市場, 是一件很大的挑戰, 目前谷歌(Google)就面對了這樣的局面

上圖是2009年iResearch的統計資料, 谷歌Google市佔約為27%, 百度Baidu市佔約為63%

根據"iResearch:09Q2 China Search Engines Market Size Reached 1.72 Billion Yuan"顯示搜尋引擎市場在2009Q2比去年同期成長35.7%到達十億七千兩百萬人民幣的規模

根據"iResearch最新資料", 2009年中國搜索引擎市場規模達六十九億五千萬元人民幣,其中百度和谷歌中國兩家市場份額之和超百分之九十六點三,基本壟斷中國搜索引擎市場。其中百度占據百分之六十三點一的市場營收份額,谷歌中國占百分之三十三點二。

根據"China Search Engine – Behind the Great Wall", 到2008年底止, 中國的搜尋引擎使用人口達兩億五千萬人

再根據"Google Gained Market Share in China in Last Six Months - StatCounter", 顯示到2009年底, 百度Baidu市佔56%, 谷歌Google市佔43%

(註: ComScore資料顯示的是2009/8, 谷歌Google市佔14%, 百度Baidu市佔64%, 由於資料比較舊就不加以參考)

不管是iResearch的數字正確, 還是StatCounter的估計準確, 谷歌Google都佔有約中國1/3的市場, 而且這個市場是一直往上攀升的, 而2009/01的StatCounter資料更顯示Baidu市佔58.67%, Google市佔38.85% ... Yahoo看起來是躺平 (如下圖)



佔有中國這麼大市場的百度Baidu與谷歌Google剛好在前幾天都無獨有偶的發生了幾件大事:

百度首席營運官(COO)葉朋離職
百度被攻擊癱瘓
Google可能停止中國的運作
百度癱瘓擺逾 去年底twitter也遭同集團襲擊

葉朋雖然宣稱是個人因素離職, 但大多被解讀為百度將大幅調整營運策略, 而這個調整當然就是要針對Google而來, 不把Google趕出中國豈能鬆懈? 就在這麼緊張的混戰中 ... Hacker也來湊熱鬧了

我們來談談Baidu與Google先後被黑的過程及Google的心路歷程探討; Baidu被宣稱是「Iranian cyber army」的組織搞了一手移花接木; 而Google則是宣稱被某組織滲入民運人士的Gmail

百度被攻擊癱瘓, 主要是DNS(Domain Name Server)被挾持, 根據中國電子商務研究中心搜索引擎分析師卜梓琴全程跟蹤分析: (來源)
1、2010年1月12日上午約6點起,百度域名DNS伺服器被劫持更換,同時主域名已經被解析到一個荷蘭的IP;
  2、域名被更換後,訪問百度時頁面自動跳轉到一租用雅虎伺服器的空間;該IP的網站實際使用英文yahoo下的租用空間,因此訪問百度旗下網站時,會出現英文yahoo的出錯資訊頁面。
  3、由於頁面請求數量過於龐大導致雅虎伺服器癱瘓或者流量超限,伺服器癱瘓;
  4、伺服器癱瘓後,訪問百度的網民頁面自動跳轉到雅虎的提示頁面;
  5、在超限之前,部分網民伊朗網軍的駭客頁面,攻擊者在百度首頁自稱是Iranian Cyber Army的組織承認篡改了百度主頁,並留下阿拉伯文字;
  6、2010年1月12日上午,國內大部分城市用戶和海外用戶只能通過未被劫持的備用域名www.baidu.com.cn訪問;
  7、2010年1月12日上午近10點,百度相關人士出面表示,故障還在查,目前原因不知,此前均表示不知情或拒接電話;
  8、2010年1月12日上午約11點起,部分地區陸續恢復正常訪問;
  9、下午起,百度正在陸續恢復域名解析,所以也出現了各地逐漸恢復訪問的情況;
  10、根據解析速度,如不出意外,全世界將在48小時內全部恢復訪問。

分析師卜梓琴指出, 這次百度的安全事件顯示出百度並沒有充分的應變機制, 並且衝擊了所有網路的流量, 如騰訊、新浪預計流量將下降大約在5%左右, 而搜狐和網易預計流量將會下降10%左右, 並且網域名稱的安全性將再次被關注(不知Register.com是否會因這個事件而被求償?), 這篇"專家聊百度大面積故障實錄:企業應重視域名資產"則呼籲企業要重視域名資產

Baidu的這個事件應該會讓中國更體認「控制權」的重要性, 就因為Baidu.com不是掌握在自己手裡, 結果被玩出這場戲 ...

而Google的事件則是「控制權」過了頭 ... Google高級副總裁David Drummond在Google官方Blog發表文章表示由去月中旬, 他們偵測到一次來自中國、針對公司基礎架構發起的非常高技術、有針對性的攻擊, 有證據顯示黑客的主要目的, 是進入中國人權活動人士的Gmail帳戶 ... 而Google則很罕見的大喊不爽, 並不排除退出中國市場

這是許多關於Google可能退出市場的報導:

豁出去?!Google.cn搜到六四
雅虎公司聲援谷歌﹐譴責網絡攻擊行為
首家西方企業翻臉——Google向中國說不
谷歌遭遇網絡攻擊後引入新安全措施
谷歌聲明原文
Google’s China Stance: More about Business than Thwarting Evil
A new approach to China

Google會不會退出中國市場? 官方的說明中:
We have decided we are no longer willing to continue censoring our results on Google.cn, and so over the next few weeks we will be discussing with the Chinese government the basis on which we could operate an unfiltered search engine within the law, if at all. We recognize that this may well mean having to shut down Google.cn, and potentially our offices in China.

公司已經決定不願再對Google.cn上的搜索結果進行內容審查﹐因此﹐未來幾週﹐公司和中國政府將討論在什麼樣的基礎上我們能夠在法律框架內運營未經過濾的搜索引擎﹐如果確有這種可能。我們認識到﹐這很可能意味著公司將不得不關閉Google.cn﹐以及我們在中國的辦公室。

由Google在中國的市佔率逐漸起色及中國搜尋市場的成長, Google當然不願意就此放棄, 但是又不願意扮演審查衛兵的角色, 想必是身心煎熬... 但是Google會不會退出中國市場? 其實決定權不在Google, Google其實還是希望可以談, 但如果中國持續封鎖或要求審查Google相關內容, Google根本無法做生意

如果真的最後讓Google退出中國市場, 那麼將沒有任何阻礙Baidu的能量了, 中國的搜尋市場變成一家獨大, 其實對於中國互聯網的發展是很大的傷害, 這個傷害很可能會陸續感染到其他週邊的外國企業, 長期而言中國將是最大的受害者!

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2009年5月1日星期五

百度與搜尋引擎優化 : SEO and Baidu



很少談到百度搜尋引擎, 但是卻都密切觀察百度搜尋引擎的動向, 百度(Baidu)的演算法與Google/Yahoo並沒有太多差異, 但是由於有其他太多因素, 讓百度有别於其他搜尋引擎

百度搜尋引擎開始於2000年, 其名稱由來是辛棄疾的「青玉案」

東風夜放花千樹 更吹落 星如雨
寶馬雕車香滿路 鳳簫聲動
玉壺光轉 一夜魚龍舞
蛾兒雪柳黃金縷 笑語盈盈暗香去
眾裏尋他千百度 驀然迴首
那人卻在 燈火闌珊處


就在"眾裏尋他千百度"中, 「百度」搜尋引擎這個名字於焉產生

百度在早期資料量不大時, 本站許多關鍵字都名列前茅, 但是突然有一天.....所有index資料在百度搜尋引擎全部消失

由於並不是商業網站也沒有太在意, 但是又在某一天資料又全部回來, 中間隔了約半年的時間

以為就此應該不會再消失了吧! 沒想到在2009/04上旬, 又是在百度搜尋引擎全部消失, 於是這次就跟百度聯絡, 告知資料消失的問題, 並且希望能夠恢復索引

沒想到百度的處理速度相當快, 約不到幾天的時間就又全部恢復正常資料量, 但是好景不常...在幾個星期後又全部消失

想在百度搜尋引擎有不錯的表現, 基本上比Google、Yahoo!奇摩還困難, 因為百度還是以簡體資料為主, 並且中國大陸的網站數量驚人, 想要在百度上做SEO, 除了原本的SEO規則外, 可能必須注意以下事項:

(1)台灣與大陸的用詞差異, 例如:在百度上以"搜尋引擎"關鍵字有不錯的排名是沒有用的, 因為大陸使用"搜索引擎"
(2)是否能夠跟大陸的站台形成關連? 也就是跟大陸的站台互有link往來
(3)是否有使用百度Toolbar?

尤其台灣的網站還有跟中國網路連線的問題, 最近幾天(約在4/26~29左右)透過Hinet連往Baidu就常出現無法連線的問題, 但又不是所有Hinet連線都不通, 應該是中華電信某些海底電纜與中國有局部斷線, 又因為台灣使用百度的用戶不多, 所以沒有引發太多的抱怨

這個連線問題就會讓百度無法抓取台灣的某些網站資料, 你也永遠不知道到底你的網站與百度何時會無法連線, 除非你有辦法隨時偵測所有應該連線的訊號, 一旦斷線的話, 業者是不會主動告知的

如果搜尋引擎幾次抓取資料失敗, 很可能就將網頁資料除名了, 等於就死於非戰之罪而不自知了!

至於台灣用戶連往中國網站的速度問題, 基本上都會較慢, 但是從中國連到世界各地是否也會很慢呢? 曾經在中國實際測試結果, 發現由中國連往台灣或任何地方, 速度都相當快速, 所以問題不是單方面中國資料過濾管控的問題, 而是跟台灣連往的網站到底頻寬是否足夠及穩定性的問題了

百度相關資料
http://baike.baidu.com/view/1047.htm
http://baike.baidu.com/view/7147.htm
http://baike.baidu.com/view/157335.htm

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院