今時今日,即使每個人的手機上都有一個攝像頭,但它們卻很少能像深度相機那樣捕捉到物體的三維輪廓。試想一下,如果將依靠光電技術,具備感知和追蹤外界運動能力的深度相機安裝到手持設備上,讓手機能夠捕捉從街頭到客廳布局的一切事物,那該是多么高大上的事情啊。不僅能讓開發者創造出擁有更贊交互體驗的游戲及應用,還能真正起到幫助和引導視覺障礙人士的作用。
于是乎,在今年的SIGGRAPH大會上,由來自微軟研究院的Sean Ryan Fanello、Cem Keskin和Shahram Izadi組成的科研小組在現場展示了他們研發的新技術,將任何手機上的普通2D相機或網絡攝像頭通過簡單的修改和使用機器學習技術轉換成為3D深度相機,在降低成本和技術門檻的同時,也讓開發3D應用變得更簡單。
首先,他們移除了用于阻止光信號的近紅外線濾光器,并添加了另外一種只允許紅外光通過的過濾器,讓攝像頭只能感應某一亮度范圍的光線。同時,還在攝像頭周圍布置了一圈價格低廉的低功耗近紅外LED,來幫助攝像頭識別目標物體,至此,普通相機也就被成功修改為一款紅外攝像機。
微軟團隊表示,該技術主要利用的是紅外線的反射強度,就像在一個漆黑的房間里,手電筒和聲納信號之間所發生的感應。光線會對周圍物體作出反應,并向傳感器返回相應亮度。當物體靠近時,它們會更加明亮,而當距離更遠時,則會變暗。
在此項目中,微軟研究小組將重點放在了模擬人手和臉上,在建立了包括手的圖像等一系列訓練數據之后,團隊發現個人能夠以每秒220幀的速度移動,也就是說,開發者在開發導航地圖以及游戲等應用時,可以充分利用這一點,比如在虛擬現實環境下玩空中切香蕉。
內容來源:MIT Technology Review、BGR