2008-10-22
推薦文章 - Computer Vision的尷尬
先談這篇文章:
過去一段時間我一直想寫寫我對Computer Vision的粗淺看法,但是要寫到值得貼出來,還要再花不少力氣。看到上面這篇文章時就覺得,跟我的看法好類似啊(我當然是差得遠了)。
提一下我的粗淺看法好了:我認識的Computer Vision就是"做機器"(這裡的"機器"的意思就是:它不會做其他的事,只會做你叫他做的事(一般來說,如果做得好,我們就會偷笑了),而一旦超出定義範圍,機器就常常什麼事都幹不了)。每次看到一個新應用,就幾乎需要重新建一台機器,可以重複應用的元件(演算法)都是很基礎的東西,高階一點的元件都要重新做,這導致不容易建造"可擴充"的系統",不容易擴充&累積,就不容易有比較大的成果&應用出現。這也就是為甚麼你會在電腦視覺的書裡看到一大堆基本的東西,卻沒有書會教你如何建立高階一點的東西,因為高階一點的東西,沒有一致的理論,每次都要重新打造之故。而我們對於機器的期望也僅止於:機器在極有限的範圍內可以工作良好我們就心滿意足了。
也是因此,當年讀研究所的時候,有一陣子我把研究的重心放在人類的視知覺&大腦的運作上面,原因是我感受不到拼裝出視覺機器的成就感(當然,做出會動作良好的機器是不錯,但我這個人比較好高騖遠一點)。期間有將近一年的時間,我無論開車,走路,坐著都在研究我是怎麼看的,市面上找得到的視知覺&大腦的書,也幾乎被我買完,看完。我後來發現,問題的根源不在底層的訊號(影像訊號)處理,而在於高階的記憶與運算。這需要我們對生物的思考機制有更深入瞭解與建模,對整個流程(機制)做通盤的考量,建立理論架構,然後在上面架床疊屋,建立應用。這就是為甚麼我當年研究做到一半,偷閒看 《On Intelligence》有豁然開朗的原因。
談一下這個部落格:
只提一件事,這個作者之前有另一個部落格,因故關掉了,但是裡面的CV/PR/ML研究資料豐富,記在這裡,免得忘了。網址是 http://dahua.spaces.live.com/
PS:上面寫的粗淺看法都是現在臨時寫的,之前寫到一半的東西,不知放那去了,要是有機會補完,在貼上來好了。
2008-02-05
Face Recognition Technology: Polar Rose

這是同事傳來的技術網頁,蠻有意思的,研究了一下。
===== 以下是網路上的介紹 =====
新創公司Polar Rose準備在明年初推出可提高照片搜尋準確度的新科技。
這家瑞典業者先將2D照片推算至3D模式,再由電腦利用3D模式在網路和Flickr等公共照片網站上,搜尋相符的照片。該公司19日宣布,將自明年元月起進行實際測試,並在第一季推出公眾測試版。
3D模式雖是虛擬的,仍可讓電腦過濾掉光影、攝影角度,和物件對鏡角度等相關差異。Polar Rose創辦人兼技術長Eric Solem表示,過濾掉這些差異,搜尋結果將會更準確。即使是正面大頭照,該公司的搜尋引擎都能算出3D輪廓。
Solem說:「我們可以從一張照片製作出3D影像,臉部特徵通常會因為光線和姿勢而難以確認,3D影像可以解決這一點。」Polar Rose正在開發一項自串流影片中搜尋臉孔的工具。
影像搜尋逐漸引起業者和研究員的興趣,尤其是網路上的照片和影片數量大幅成長。許多照片搜尋服務,如Google的影像搜尋,其實完全沒有搜尋影像內的資 料。這類搜尋只針對照片的附加資料。假如你要搜尋夜間脫口秀主持人Jay Leno,結果將不只是這位喜劇演員的照片,還包括任何以Jay Leno為名的家庭寵物照。
其他公司,如EverNote,開發出可辨識影像內文字的軟體。IBM與3VR Security則提供串流影片之影像搜尋技術。今年稍早,另一家新創公司Riya也推出照片辨識服務。
雖然Riya與Polar Rose都針對同一目標,其辨識和搜尋比對的基礎方法卻不同。Riya採用情境辨識—其軟體「觀察」人的面孔,但也會考量服裝、髮型和照片中的其他特徵, 其原則是某人在一張照片中顯示的許多線索,也會在下一張照片出現。Riya也設立一個附屬網站Like.com,幫助民眾搜尋類似外觀的產品。
Polar Rose的運算法不以特定的臉部特徵為主。相反地,他們檢視每個臉部重要特徵的相對位置,再對照3D模式(該公司的名稱取自一種花狀的數學曲線,而非瑞典在地球上的位置)。Solem表示:「只要你各張照片之間的差異性小於你和其他人的照片,(軟體)就會找到你。」
===== 網路上的介紹完畢 =====
Face recognition technology (就是讓機器認人的技術) 有很多的用途,911之後,這樣的技術需求隨著安全監控產業的蓬勃發展而大增,相關的研究也變得很多。過去,face recognition 有三個不容易克服的地方: Pose,lighting and occlusion (另外,當然維度詛咒(Curse of Dimensionality)是所有appearance-based recognition 技術要克服的基本問題),Polar Rose 這項技術很聰明地靠建立3D模型及利用後續的模型比對來避掉前兩個問題(第三個問題要做到好很難,有遮蔽的人臉,連人都要認很久,這表示這不是在低階的視覺機制就可以認出來的東西,需要有高階的意識參與判斷)。我的感想:
- 很多看起來很難的東西,事實上應該沒有想像中那麼難啦! 不要一直跟著別人的腳步,才會有創新的機會。
- 人臉事實上是很相似的東西(這句話還蠻怪的)。因此,從影像對人臉建立模型時,自由度不那麼大,有一個大致上的粗模可以套用(限制)。把這個技術用在建模與搜尋上,都相對容易。這是對我來說,在技術上的一個啟發。(這個技術可以辨識出象人嗎? 我猜不行! 我猜連一開始的 face detection 都偵測不出來了吧, 更別談不符合對人臉的prior knowledge了)。
- 有優異的技術,將產品做成網站,加上瀏覽器plugin,強化易用性及使用率是個好方法。
- 報導上說,這家公司已經得到510 萬美元的創業基金(真好!)。
這裡過年前應該不會再更新了~
在這裡先預祝大家
新年快樂~ 賭博贏錢~ 萬事順利~
更重要的是
寒流到了~ 衣服穿多~ 別感冒啦~