MIT開(kāi)發(fā)激光“鎖眼成像”技術(shù):給我一個(gè)鑰匙孔,不進(jìn)門我就能“看”到房間內(nèi)的一切
痛苦的周一又開(kāi)始了。
對(duì)每個(gè)合格的“社畜”來(lái)說(shuō),摸魚(yú)可謂是一項(xiàng)必備技能了。
俗話說(shuō),知己知彼才能百戰(zhàn)****。
如果能清楚地看見(jiàn)坐在辦公室里的上司在干什么,準(zhǔn)備什么時(shí)候出來(lái)巡視,那簡(jiǎn)直就是如虎添翼。
還別說(shuō),現(xiàn)在還真有這么一項(xiàng)技術(shù),能幫助“看”清房間里的一切。
這就是非視線(NLOS)成像方法。多年來(lái),研究人員不斷完善這項(xiàng)技術(shù),為了創(chuàng)造出能夠清晰看到角落的相機(jī),由此生成不在視野內(nèi)的物體圖像,或者被障礙物擋住的物體圖像。
如今,斯坦福大學(xué)計(jì)算成像實(shí)驗(yàn)室的研究人員對(duì)該技術(shù)進(jìn)行了擴(kuò)展,現(xiàn)在,只需讓一個(gè)激光點(diǎn)進(jìn)入房間,就可以看到里面可能有哪些實(shí)物。
不過(guò)這可不是拿來(lái)摸魚(yú)用的。未來(lái),該技術(shù)可以與自動(dòng)駕駛等技術(shù)綁定,這樣司機(jī)就能提前發(fā)現(xiàn)隱藏在拐角處的潛在危險(xiǎn),提高安全性和避障能力。
論文鏈接:
https://www.computationalimaging.org/publications/keyhole-imaging/
MIT提出“鎖眼成像方法”
其實(shí)非視線成像由來(lái)已久了,但無(wú)法否認(rèn),這的確是一項(xiàng)聰明的技術(shù)。
此前,該技術(shù)已經(jīng)利用了像地板或墻壁這樣的平面,這些平面一般處于攝像機(jī)和被遮擋物體的視線范圍內(nèi)。然后,一系列來(lái)自攝像機(jī)的激光脈沖,在這些平面的表面上反彈,然后在隱藏的物體上反彈,最終回到攝像機(jī)的傳感器上。算法利用光反射的時(shí)間生成相機(jī)看不到的物體圖像。
遺憾的是,這些物體圖像的分辨率不高,盡管如此還是能一下子確認(rèn)物體是什么。
這次,MIT的研究人員對(duì)其改善后提出了鎖眼成像(keyhole imaging)的方法。
從命名上我們也可以猜到,要“看”清封閉房間內(nèi)的物體,我們只需要一個(gè)小孔,比如鑰匙孔或窺視孔,讓激光束穿過(guò),在里面的墻上形成一個(gè)光點(diǎn)。
與上述過(guò)程類似,激光會(huì)在墻上、房間物體上反彈,無(wú)數(shù)的光子最終通過(guò)小孔口反射回相機(jī),相機(jī)利用一個(gè)單光子雪崩光電探測(cè)器測(cè)量它們返回的時(shí)間。
如果隱藏物體是靜態(tài)的,鎖眼成像無(wú)法得到足夠的信息。為了繞過(guò)這個(gè)問(wèn)題,研究人員發(fā)現(xiàn),他們可以用激光脈沖成像一個(gè)移動(dòng)的物體,這種激光能夠在較長(zhǎng)的曝光時(shí)間內(nèi)產(chǎn)生足夠的可行數(shù)據(jù),從而為算法構(gòu)建物體的圖像提供足夠的信息。
如下圖所示,木制人體模型看起來(lái)像幽靈一樣,但當(dāng)與經(jīng)過(guò)適當(dāng)訓(xùn)練的圖像識(shí)別人工智能相配時(shí),確定房間里有一個(gè)人(或人形物體)倒是非常可行的。
除了自動(dòng)駕駛技術(shù)外,該項(xiàng)研究未來(lái)還可以協(xié)助警方偵破案件。比如,要在破門而入前評(píng)估某個(gè)房間的風(fēng)險(xiǎn),只需利用墻上的一個(gè)小裂縫或窗戶。
同時(shí),這項(xiàng)新技術(shù)還可以為自主導(dǎo)航系統(tǒng)提供新的思路。在以前的無(wú)損檢測(cè)技術(shù)不實(shí)用的情況下,在威脅之前就發(fā)現(xiàn)隱藏的危險(xiǎn)因素。
利用光傳播和陰影也能還原遮擋物
相關(guān)技術(shù)在MIT中也已有先例。
2019年,MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室提出,他們能通過(guò)細(xì)微的陰影和反射重現(xiàn)被遮擋的動(dòng)作。也就是說(shuō),打開(kāi)攝像機(jī)之后,即使是攝像機(jī)視野之外的物體或動(dòng)作,也可以進(jìn)行再現(xiàn)。
MIT的研究員們基于視域外的視頻投射在附近物體上的陰影,預(yù)測(cè)出視域外的內(nèi)容。上面一行顯示的是研究員使用這種方法重現(xiàn)的視覺(jué)元素,下面一行則是原始物體。
通過(guò)觀察陰影和幾何圖形之間的相互作用,新的算法可以預(yù)測(cè)光在場(chǎng)景中的傳播方式,即“光傳輸”。然后,再利用這種傳播方式從觀察到的陰影中估計(jì)被隱藏的內(nèi)容,甚至可以構(gòu)建真人表演的大致輪廓。
該技術(shù)是“被動(dòng)的”,這意味著對(duì)場(chǎng)景沒(méi)有激光或其他干預(yù),整個(gè)過(guò)程需要大約2個(gè)小時(shí)的處理時(shí)間。研究人員表示,該技術(shù)最終有助于重現(xiàn)視線之外的場(chǎng)景,包括但不限于上述應(yīng)用。
“通過(guò)使用非視距成像設(shè)備(例如激光器)可以完成許多任務(wù),但是在我們的方法中,只能使用自然到達(dá)相機(jī)的光線,并嘗試充分利用這些稀缺的信息,”前CSAIL博士后、NVIDIA現(xiàn)任研究科學(xué)家,新技術(shù)首席研究員Miika Aittala表示, “鑒于神經(jīng)網(wǎng)絡(luò)的最新進(jìn)展,這似乎是一個(gè)很好的時(shí)機(jī),可以解決在這個(gè)領(lǐng)域以前被認(rèn)為是無(wú)法解決的一些挑戰(zhàn)?!?/p>
為了捕獲這些看不見(jiàn)的信息,團(tuán)隊(duì)使用了細(xì)微的間接照明提示,例如被觀察區(qū)域雜亂的陰影和高光。在某種程度上,一堆雜物的行為有點(diǎn)像針孔照相機(jī),類似于在小學(xué)科學(xué)課中可能會(huì)制作的東西:它阻擋了一些光線,但允許其他光線通過(guò),并且無(wú)論在何處,它們都描繪出周圍環(huán)境的圖像。
但如果針孔相機(jī)被設(shè)計(jì)為僅允許通過(guò)足以形成可讀圖像的光線,那么一堆雜亂的雜物會(huì)產(chǎn)生無(wú)法識(shí)別的的圖像、(通過(guò)光傳輸)被擾亂的陰影的復(fù)雜運(yùn)動(dòng)。
可以將雜物想像成一面鏡子,使我們可以看到周圍的環(huán)境,尤其是在無(wú)法直接看到的角落。這個(gè)算法所解決的挑戰(zhàn)是要弄清并理解這些照明的提示。
怎么樣,是不是又“學(xué)廢了”?
種種跡象表明,或許,我們離擁有“****眼”的那天真的不遠(yuǎn)了。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。