仿生系列2--誰的視力更出色?
導言:眼睛是人類感知世界的重要感覺器官,然而它們的視力畢竟是有限的。人們一直在努力通過科技的進步打造電子的“千里眼”,但迄今為止這些電子眼仍有明顯的不足。研究人員已經(jīng)在“教”它們彌補弱勢,像人類一樣觀察事物。
博樂機器人表演--機器人演出的開拓者
目前,天文學家通過哈勃望遠鏡觀察到的最遠星系距離地球132億光年,而最先進的電子顯微鏡可以觀察到0.1nm的原子。這組令人印象深刻的數(shù)字可以說明,人們已經(jīng)通過自己發(fā)明的電子眼大大延伸和拓展了視野。
的確,通過機器可以采集到更清晰的畫面,獲得更多的細節(jié)信息。而且,鏡頭捕捉到的所有畫面信息都能被完整地記錄下來,但人眼卻無法做到這些。既然如此,科學家們?yōu)槭裁慈栽诨ㄙM大量時間和精力,研發(fā)仿真人眼的技術呢?這是因為與“盲目”的機器人相比,人類知道自己的目光應該在何時聚焦到何處,即使獲取到的畫面質(zhì)量很低,也可以智能地解析出最需要的答案。
大腦虛構了圖像
人類可以輕松地將視覺的焦點(注意力)集中于目標之上,獲取目標某一部分最清晰、最佳對比度的畫面。但是,人類的視覺焦點范圍非常有限,常常以為自己看到了一切,但是真正能留下印象的,只有幾個細節(jié)。另外,由于人眼對亮度較敏感,而對色度不太敏感,所以我們自己認為看到的圖像就是最完美的,其實只是因為人腦的補償能力很強,色差已經(jīng)統(tǒng)統(tǒng)被我們的大腦忽略了(視頻壓縮就利用了該原理,通常將顏色信息刪減一些之后,經(jīng)色差處理過的圖像與原始圖像的差異仍然很難被察覺)。相比于色差,人眼的生理視覺盲點常常是引起交通事故的關鍵原因,更加可怕。
事實上,在成像質(zhì)量上,鏡頭比人眼更加強大——為了減少錯誤,鏡頭由一組分散透鏡和會聚透鏡組成,由不同類型的玻璃透鏡采集到的畫面,在按下快門的一剎那被整合為一張完美的圖像。但是鏡頭的弱點是可視角度偏弱,普通的鏡頭只能捕捉到面前約90°~100°的圖像,而眼睛的可視角度幾乎達到了180°,但是只有目光聚焦的一些角度是清晰的。另外,眼睛所看到的畫面中,只有視覺中心的部分是全彩色的,因為負責讀取色彩的視錐細胞在視網(wǎng)膜中央分布密集,在周邊區(qū)域則相對較少。
鏡頭可以捕捉到多少細節(jié)以及哪些顏色,由圖像傳感器上的感光元件數(shù)量和紅綠藍組成的色彩過濾層質(zhì)量所決定。需要注意的是,鏡頭的像素數(shù)越高,照片理論上可染色點就越多。但是打印照片沒有必要盲目追求高像素。通常普通的5寸照片(約
綜合來看,眼睛的成像質(zhì)量是無法與鏡頭相比的。眼睛無法獲取現(xiàn)實世界最真實的影像,但是聰明的大腦有選擇地忽略了錯誤,根據(jù)不完整的信息為我們生成了一個完美的世界。相比之下,鏡頭可以采集到更完美的圖像,只可惜鏡頭無法智能地判斷應該將焦點置于何處。
攝像頭要學會思考
自適應三維目標探測相機(Three-dimensional Adaptive Camera with Object Detection and Foveation,簡稱TACO)研發(fā)團隊希望解決攝像頭不會思考的問題,使機器能夠以一種更加自然和類人的方式觀察周圍環(huán)境。該計劃的研究者沒有使用傳統(tǒng)的二維攝像頭,他們致力于研制出比當前激光掃描儀更加快速、廉價、性能優(yōu)越的3D傳感器,據(jù)稱采用這種視頻仿眼處理器的3D傳感器的分辨能力將比現(xiàn)存?zhèn)鞲衅鞯姆直婺芰μ岣?/span>10倍。來自維也納科技大學的工程師、TACO團隊成員皮特向我們解釋了TACO系統(tǒng)如何識別現(xiàn)實世界的3D模型:嚴格來說,我們的攝像頭就像一臺激光掃描儀,它每秒鐘發(fā)射100萬激光脈,激光脈沖射線分別從水平和垂直方向掃描攝像頭前的情景。就像眼睛一樣,TACO攝像頭擁有寬廣的視角,但只生成低分辨率的圖像。只有當它發(fā)現(xiàn)感興趣的目標時,才會準確對焦,采集到最佳質(zhì)量的圖像。拍攝結果就像一個熱成像圖一樣,亮的部分代表重要區(qū)域,暗的部分代表不重要的區(qū)域。
這項正在由歐盟贊助開發(fā)的技術將使機器眼可以應用在更復雜的環(huán)境中。例如,汽車輔助駕駛系統(tǒng)的攝像頭可以協(xié)助用戶控制車頭燈、檢查路面情況以及識別司機容易忽視的道路信號。德國寶馬汽車的駕駛輔助系統(tǒng)和車輛結構專家胡貝爾博士深知設計這一系統(tǒng)的重要性。他告訴我們,由于攝像頭需要負責3個不同的功能,而且每一個都不輕松,所以寶馬集團使用了一項鮮為人知的小技巧——將攝像頭每秒鐘拍攝的45幀圖像分為3份,每個功能都可以獲得15幀圖像。從識別道路信號功能上看,攝像頭需要結合汽車導航系統(tǒng)提供的信息,將攝像頭采集到的即時圖像與數(shù)據(jù)庫中的數(shù)據(jù)進行對比。在這里,圖像質(zhì)量其實無關緊要,一個普通的VGA定焦攝像頭足以勝任。
結論:攝像頭雖然還無法做到像人類一樣自主地觀察周圍的環(huán)境,但是作為人類的視覺輔助系統(tǒng),攝像頭常常在各個領域擔負著重要的使命。科學家們深知簡單地重建人眼是完全沒有必要的,因為對于人類而言,真正在看東西的其實是大腦。他們正在探索配置3D傳感系統(tǒng)的機器人在自主導航和與日常物品互動方面的能力。相信未來,機器人將會在清潔、建設、修理、安全、保健、娛樂和個人援助等領域發(fā)揮重要的作用。