2008-10-22

推薦文章 - Computer Vision的尷尬

這個部落格&這篇文章是今天中午不小心 google 到的。

先談這篇文章:
過去一段時間我一直想寫寫我對Computer Vision的粗淺看法,但是要寫到值得貼出來,還要再花不少力氣。看到上面這篇文章時就覺得,跟我的看法好類似啊(我當然是差得遠了)。

提一下我的粗淺看法好了:我認識的Computer Vision就是"做機器"(這裡的"機器"的意思就是:它不會做其他的事,只會做你叫他做的事(一般來說,如果做得好,我們就會偷笑了),而一旦超出定義範圍,機器就常常什麼事都幹不了)。每次看到一個新應用,就幾乎需要重新建一台機器,可以重複應用的元件(演算法)都是很基礎的東西,高階一點的元件都要重新做,這導致不容易建造"可擴充"的系統",不容易擴充&累積,就不容易有比較大的成果&應用出現。這也就是為甚麼你會在電腦視覺的書裡看到一大堆基本的東西,卻沒有書會教你如何建立高階一點的東西,因為高階一點的東西,沒有一致的理論,每次都要重新打造之故。而我們對於機器的期望也僅止於:機器在極有限的範圍內可以工作良好我們就心滿意足了。
也是因此,當年讀研究所的時候,有一陣子我把研究的重心放在人類的視知覺&大腦的運作上面,原因是我感受不到拼裝出視覺機器的成就感(當然,做出會動作良好的機器是不錯,但我這個人比較好高騖遠一點)。期間有將近一年的時間,我無論開車,走路,坐著都在研究我是怎麼看的,市面上找得到的視知覺&大腦的書,也幾乎被我買完,看完。我後來發現,問題的根源不在底層的訊號(影像訊號)處理,而在於高階的記憶與運算。這需要我們對生物的思考機制有更深入瞭解與建模,對整個流程(機制)做通盤的考量,建立理論架構,然後在上面架床疊屋,建立應用。這就是為甚麼我當年研究做到一半,偷閒看 《On Intelligence》有豁然開朗的原因。

談一下這個部落格:
只提一件事,這個作者之前有另一個部落格,因故關掉了,但是裡面的CV/PR/ML研究資料豐富,記在這裡,免得忘了。網址是 http://dahua.spaces.live.com/

PS:上面寫的粗淺看法都是現在臨時寫的,之前寫到一半的東西,不知放那去了,要是有機會補完,在貼上來好了。

新書上市 - Learning OpenCV

Learning OpenCV

今天中午不小心搜尋到的新書訊息。

OpenCV ,源自於 Intel 的 電腦視覺函式庫(開放原始碼), 其中包含影像處理,模式辨認,機器學習等支援,幾乎是從事電腦視覺研究者必用的強大的函式庫。

我以前常用OpenCV做研究,開發系統原型,做論文實驗。看到這本書突然想到過去剛學習使用OpenCV的經驗。這套函式庫,因為需要跨平台,加上要配合各式各樣的影像格式&不同色彩深度,核心資料結構多且複雜,加上參考資料很少,沒有專書介紹,一開始使用會比較難以掌握(我當年初使用時已經是入行近10年的工程師)。所以在後來遇到有使用需求的朋友/同學,我都會儘量告知學習這套函式庫的經驗和竅門。

很高興看到有專書的出板,Oreilly的Learning系列,應該是具有相當的品質保證。

下面是書籍的簡介:
Learning OpenCV puts you right in the
middle of the rapidly expanding field of computer vision. Written by
the creators of OpenCV, the widely used free open-source library, this
book introduces you to computer vision and demonstrates how you can
quickly build applications that enable computers to "see" and make
decisions based on the data. With this book, any developer or hobbyist
can get up and running with the framework quickly, whether it's to
build simple or sophisticated vision applications.

"This library is useful for
practitioners, and is an excellent tool for those entering the field:
it is a set of computer vision algorithms that work as advertised."
-William T. Freeman, Computer Science and Artificial Intelligence
Laboratory, Massachusetts Institute of Technology

Learning OpenCV puts you in the middle of the rapidly
expanding field of computer vision. Written by the creators of the free
open source OpenCV library, this book introduces you to computer vision
and demonstrates how you can quickly build applications that enable
computers to "see" and make decisions based on that data.

Computer vision is everywhere-in security systems, manufacturing
inspection systems, medical image analysis, Unmanned Aerial Vehicles,
and more. It stitches Google maps and Google Earth together, checks the
pixels on LCD screens, and makes sure the stitches in your shirt are
sewn properly. OpenCV provides an easy-to-use computer vision framework
and a comprehensive library with more than 500 functions that can run
vision code in real time.

Learning OpenCV will teach any developer or hobbyist to use
the framework quickly with the help of hands-on exercises in each
chapter. This book includes:
  • A thorough introduction to OpenCV
  • Getting input from cameras
  • Transforming images
  • Segmenting images and shape matching
  • Pattern recognition, including face detection
  • Tracking and motion in 2 and 3 dimensions
  • 3D reconstruction from stereo vision
  • Machine learning algorithms

Getting machines to see is a challenging but entertaining goal.
Whether you want to build simple or sophisticated vision applications, Learning OpenCV is the book you need to get started.

2008-10-13

各位同學,請翻到 "第零課"

前一陣子的某一天,七點半左右,我做的夢是這樣子的:
老師:各位同學,把課本拿出來,請翻到第零課。
我心理想?哪裡來的第零課啊?是在上程式語言嗎?又是zero-based.....
然後,老師不斷地重複這句話..... 搞得我心理很煩.....
然後,我起床了,夢結束了。
然後,我知道為甚麼了。
因為,那天我賴床,而鬧鐘就不斷地叫: 鈴鈴鈴鈴鈴鈴鈴鈴鈴鈴鈴鈴鈴鈴......

我怎麼連在睡覺,都在想冷笑話啊~

這個故事,雙十節那天出去玩,同學說還蠻好笑的,趁個空檔,就寫下來了。

2008-10-08

今天在7-11被店員認出來


今天下班,去捷運站旁邊的7-11拿在博客來買的書。
這家7-11還蠻有意思的,因為在捷運站旁邊,每天上下班時間到店裡拿書的客人很多,因此發展出一套標準的機制: 之前先把客人的名字和東西的位置記下來,等到客人報名字後,不用在商品堆裡找,很快就可以找到客人的東西,也因為這樣的緣故,我還蠻喜歡在這家店取貨。
有趣的事情來了: 今天我進到7-11店裡,排隊,輪到我了,我跟店員說: 我要拿博客來的書。
然後.... 店員馬上就說: 是 某某某嗎? 我驚嚇到! 然後說: 是。
原來我在這裡領書領到店員都認識我了....
他在查名單時,我有稍微瞄了一下,領貨的人很多ㄟ,怎麼會這樣。
疑問: 他們有認錯人過嗎?

2008-10-02

10/1 特休一天

10/1 為了慶祝匪慶,不,是為了下面的一堆事情,請了一天特休假。
特休假,一個在過去沒啥用,去年到了現在的公司卻變得很稀有的東西。
在前一家公司待了6年,到了後來,特休幾乎休不完,老闆只管我事情有沒有做完,其他根本不管我。在台大唸書的那段日子,在學校裡重要的演講,研討會我幾乎都沒錯過,越寫越懷念起有人情味的前公司....
在現在的公司,第一年,只有3.5天的年假,好少,要省著點用。

10/1凌晨,發現我的定期車檢過期了,加上原訂晚上要去天瓏書局找資料,乾脆就請一天假公事私辦一番。

所以,早上去保養車,因為過去一年車子很少開,也沒保養,車胎有龜裂的現象,全換掉,一共花了一萬四,好貴....,也把車檢做完,因為過期,多罰了900 >.<。

然後,開著剛保養完的車(車變好開了,每次花大錢保養完都有這感覺,會不會是心理因素),帶老婆小孩去深坑逛逛(以前我們還蠻常去深坑玩)。
第一次非假日去深坑,人很少,天氣很好,陽光不強,風吹起來很舒服。
跟大樹下賣臭豆腐的老闆聊天,他說: 現在景氣不好,很多人都不出門了,遊客比以前少掉2成.....
這次終於吃到廟口的豆腐料理了,以前每次去都人滿為患,每次要等,混亂,減了吃興。這次不用等,點了蒜香豆腐和豆腐羹,好吃。小量也吃了他第一次的深坑豆腐料理。

晚上去重慶南路逛書店,買PMP與軟體專案管理相關的書,在第一站儒林就買了太多書,把背包塞得滿滿的,好重。後面兩家天瓏就買得比較少。順便補了兩套動畫(一大套,一小套)回家。

PS: 今天(10/2)看到新聞,2008.11.1 新版的NDS要出3代了(NDSi),這版加大螢幕,支援SD卡,音樂播放,內建網路瀏覽器,還有最重要的,內外兩個相機。很期待看到上面的新作品。