影像感測(cè)無(wú)所不在 全局快門賦能計(jì)算機(jī)視覺(jué)應(yīng)用
大多數(shù)人每天都正在使用計(jì)算機(jī)視覺(jué)。舉個(gè)例子來(lái)說(shuō),一個(gè)是智能型手機(jī)上的臉部辨識(shí)。如果消費(fèi)者手機(jī)上有這一項(xiàng)功能,平時(shí)也可以用于解鎖屏幕或是電子支付,這表示你正在使用計(jì)算機(jī)視覺(jué)。另一例子,是當(dāng)平時(shí)去超市或者超商付款時(shí),收銀員會(huì)掃描所購(gòu)買的產(chǎn)品條形碼,這類日常生活情境都會(huì)用到計(jì)算機(jī)視覺(jué)。
計(jì)算機(jī)視覺(jué)與光學(xué)感測(cè)
全局快門一次可以拍攝整幅影像,而且拍攝時(shí)間非常短,成像效果非常準(zhǔn)確,因此完全可以用于計(jì)算機(jī)視覺(jué)領(lǐng)域。
意法半導(dǎo)體亞太區(qū)影像事業(yè)部技術(shù)營(yíng)銷經(jīng)理林國(guó)志指出,計(jì)算機(jī)視覺(jué)是人工智能的一個(gè)分支,能夠讓計(jì)算機(jī)和系統(tǒng)從數(shù)字影像、視訊和其它的視覺(jué)所輸入的數(shù)據(jù)中,提取出有意義的信息,并根據(jù)這些信息采取行動(dòng)或提出分析建議。
在臉部辨識(shí)應(yīng)用中,具有意義的信息就是臉,系統(tǒng)會(huì)對(duì)臉進(jìn)行影像采集,然后進(jìn)行信息處理,得出的結(jié)果就是驗(yàn)證使用者身份,接著解鎖手機(jī)。在一般的情況下,計(jì)算機(jī)視覺(jué)都會(huì)產(chǎn)生信息輸入和輸出,就以條形碼掃描機(jī)來(lái)說(shuō),掃描條形碼即是信息輸入,透過(guò)鏡頭采集條形碼的影像,并由系統(tǒng)讀取,最后加以辨識(shí)產(chǎn)品和價(jià)格。
一般來(lái)說(shuō),光學(xué)影像傳感器分為兩種主要的架構(gòu)。除了全局式快門之外,還有卷簾式快門,總共分為這兩種鏡頭架構(gòu)。卷簾快門的設(shè)計(jì)目的,是為了捕捉靜態(tài)影像和視訊拍攝,因此需要非常高的分辨率和色彩處理能力。目前大多數(shù)鏡頭都屬于卷簾快門,例如智能型手機(jī)的主鏡頭、自拍鏡頭、建筑中的監(jiān)控鏡頭,甚至數(shù)字相機(jī)等,都是采用卷簾快門技術(shù)。因?yàn)檫@些應(yīng)用情境都需要捕捉彩色影像,因此需要相當(dāng)高的分辨率。
唯一的問(wèn)題在于,采用卷簾快門的計(jì)算機(jī)視覺(jué)技術(shù),都是逐行拍攝影像。照片采用卷簾快門逐行拍攝的話,整個(gè)影像只有一幀。如果拍攝對(duì)象是車輛這樣的快速移動(dòng)物體,影像可能會(huì)扭曲,無(wú)法顯示拍攝對(duì)象原本的樣子。如果影像扭曲就無(wú)法顯示物體的真實(shí)狀態(tài),也就不能用于計(jì)算機(jī)視覺(jué),無(wú)法判斷影像中的是不是另一輛車。因此,卷簾快門沒(méi)有被應(yīng)用于計(jì)算機(jī)視覺(jué)技術(shù)中。然而,全局快門的原理完全不同,一次可以拍攝整幅影像,而且拍攝時(shí)間非常短。只要被拍攝的對(duì)象不是快速移動(dòng)的物體,成像效果就會(huì)非常準(zhǔn)確,因此完全可以用于計(jì)算機(jī)視覺(jué)。
計(jì)算機(jī)視覺(jué)應(yīng)用情境
圖一 : 全局快門傳感器的適用情境(source:st.com)
計(jì)算機(jī)視覺(jué)的應(yīng)用都會(huì)使用到全局快門感測(cè)技術(shù)。實(shí)際上,計(jì)算機(jī)視覺(jué)的應(yīng)用情境無(wú)處不在,可以將其歸為四大類。第一類叫做深度感測(cè),這項(xiàng)應(yīng)用時(shí)間比較久。透過(guò)使用兩個(gè)全局快門傳感器搭建一組立體視覺(jué)系統(tǒng),或者是使用一個(gè)全局快門傳感器搭建結(jié)構(gòu)光鏡頭系統(tǒng)。通常深度感測(cè)可以用于臉部辨識(shí)和3D掃描這類的應(yīng)用情境。
第二類叫做生物辨識(shí),這項(xiàng)應(yīng)用可以采集人體各個(gè)部位的信息,并將其用于身份辨識(shí)。人臉信息可以用于臉部辨識(shí)或者2D智慧解鎖,體形信息可以用于人的存在偵測(cè),除此之外還有手勢(shì)偵測(cè)、掌紋辨識(shí)、虹膜辨識(shí)等。這些人體信息都是獨(dú)一無(wú)二的,包括人臉、掌紋和虹膜等,皆可用于身份辨識(shí)。另外還有駕駛與車室內(nèi)監(jiān)視,采集司機(jī)與乘客的行為信息進(jìn)行分析,產(chǎn)生的結(jié)果就是系統(tǒng)發(fā)出的各類警示。
第三類就是擴(kuò)增實(shí)境(VR)、虛擬現(xiàn)實(shí)(AR)和混合現(xiàn)實(shí)(MR),這類應(yīng)用涉及了元宇宙的概念。當(dāng)戴上VR頭部顯示設(shè)備之后,使用者看不見(jiàn)周圍環(huán)境,只能依靠光學(xué)傳感器才能知道環(huán)境的變化。通常VR頭戴式顯示設(shè)備在內(nèi)部和外部分別有一個(gè)鏡頭,內(nèi)建鏡頭用于眼球追蹤,并透過(guò)兩個(gè)全局快門傳感器進(jìn)行眼球觀測(cè),因?yàn)樵趯?shí)際應(yīng)用情境中需要感知你的眼睛看哪個(gè)方向,透過(guò)眼球追蹤得到的信息將提供不同的反饋。外置鏡頭則用于外部環(huán)境的追蹤,主要感知外部環(huán)境而非使用者眼球的變化。
這里有兩類重要的應(yīng)用情境。一類叫做6DoF,針對(duì)的是頭部行為。當(dāng)使用者戴上VR頭戴式顯示設(shè)備后,就會(huì)獲得6D感知能力。頭部可以做出左右、上下、前后六個(gè)角度的動(dòng)作,因此被稱為「6DoF」(六個(gè)自由度追蹤)。另一類稱為「SLAM」(同步定位與地圖構(gòu)建),例如使用者需要掌握所處房間的狀況,墻壁在哪里、沙發(fā)在哪里、自己所處在哪個(gè)位置,戴上VR頭戴式顯示設(shè)備走動(dòng)的時(shí)候,如何避免撞墻等。因此在使用AR/VR裝置的過(guò)程中,手勢(shì)偵測(cè)、掌紋辨識(shí)、臉部與情緒追蹤等功能是非常重要的。
除此之外,使用VR/AR裝置還可以進(jìn)行生物辨識(shí),例如手勢(shì)偵測(cè)或者手勢(shì)追蹤。通常在這種情境下,裝置可以透過(guò)用戶一個(gè)手勢(shì)來(lái)辨識(shí)這是哪種行為目的。例如使用者進(jìn)行一場(chǎng)演講,透過(guò)一個(gè)手勢(shì)就可以自動(dòng)翻到下一頁(yè)簡(jiǎn)報(bào)或者翻回到首頁(yè),又或是透過(guò)手勢(shì)告知助理單擊或雙擊鼠標(biāo)。這些應(yīng)用都是透過(guò)手勢(shì)偵測(cè)來(lái)加以實(shí)現(xiàn),裝置無(wú)需揣測(cè)用戶想表達(dá)的信息,只需追蹤手勢(shì)即可。
最后一類應(yīng)用是機(jī)器人與工業(yè)控制。例如無(wú)人機(jī)和掃地機(jī)器人在使用過(guò)程中需要避免相撞,所以要有物體偵測(cè)和情境分析能力,而這些都需要使用全局快門傳感器。此外,前文所提到的條形碼辨識(shí),也屬于工業(yè)控制中的計(jì)算機(jī)視覺(jué)應(yīng)用一環(huán)。
圖二 : 全局快門與卷簾快門的技術(shù)差異(source:st.com)
車內(nèi)傳感器
至于汽車領(lǐng)域的應(yīng)用,車內(nèi)傳感器主要包括四大類:包括車內(nèi)鏡頭,ADAS鏡頭、觀測(cè)鏡頭和售后鏡頭等,主要用于行車記錄器。意法半導(dǎo)體亞太區(qū)影像事業(yè)部資深技術(shù)營(yíng)銷經(jīng)理張程怡表示,2021年底車內(nèi)鏡頭的市場(chǎng)滲透率約為10%,而到2024年就會(huì)達(dá)到50%。因此這一新興市場(chǎng)發(fā)展是十分迅速的,產(chǎn)業(yè)生態(tài)中的相關(guān)廠商正紛紛涌入。
車內(nèi)鏡頭并不只一種,Euro NCAP為車輛評(píng)估標(biāo)準(zhǔn)體系,曾經(jīng)對(duì)車內(nèi)監(jiān)控系統(tǒng)分為兩類:一類叫做駕駛監(jiān)控系統(tǒng)DMS,另一類叫做車內(nèi)乘客監(jiān)控系統(tǒng)CMS或者OMS。駕駛監(jiān)控系統(tǒng)的觀測(cè)對(duì)象就是司機(jī),主要監(jiān)控司機(jī)是否注意力集中,是否有分神或是打瞌睡,因?yàn)檫@些現(xiàn)象會(huì)嚴(yán)重危及行車安全。而車內(nèi)乘客監(jiān)控系統(tǒng)則主要觀測(cè)乘客狀況,特別是兒童,因?yàn)橛行┐中牡氖褂谜呦萝嚭髸?huì)將孩子遺留在車內(nèi)。
駕駛監(jiān)控系統(tǒng)DMS鏡頭安裝在駕駛員面前,觀測(cè)對(duì)象主要是臉,鏡頭必須做得很大,大概50~60度,分辨率約100~230萬(wàn)畫(huà)素。重點(diǎn)之一在于這里必須采用NIR鏡頭,因?yàn)椴粌H需要白天對(duì)駕駛員進(jìn)行監(jiān)控,晚上也是需要,因?yàn)楹芏嗳藭?huì)在夜里開(kāi)車。在這種漆黑的環(huán)境下,必須要有光源投射在駕駛員臉上,但肯定不能使用可見(jiàn)光,所以需要NIR技術(shù)。
車內(nèi)乘客監(jiān)控系統(tǒng)觀測(cè)的是車內(nèi)所有乘員,但不同之處在于,因?yàn)檫@里需要物體探測(cè)和辨識(shí),所以需要彩色影像,而且觀測(cè)范圍比較寬廣,因此鏡頭視角需要更大,分辨率需要更高,才能獲取觀測(cè)領(lǐng)域內(nèi)所有細(xì)部信息。
車內(nèi)乘客監(jiān)控與駕駛監(jiān)控二合一系統(tǒng),是將CMS、OMS和DMS結(jié)合。而車內(nèi)乘客監(jiān)控需要RGB彩色影像,駕駛監(jiān)控則需要NIR影像,因此僅需單一鏡頭就可以同時(shí)支持RGB和NIR,這些都是車內(nèi)鏡頭的設(shè)計(jì)要點(diǎn)。
結(jié)語(yǔ)
全局快門傳感器的應(yīng)用范疇十分廣泛,除了前文所提及的工業(yè)與車用之外,對(duì)于智慧家庭和智慧大樓也是非常適合的應(yīng)用范疇。智慧家庭的應(yīng)用需要考慮周全,使用者不希望家里有個(gè)鏡頭全天候監(jiān)視自己,與此同時(shí)又想要鏡頭和傳感器帶來(lái)的益處,因?yàn)楹芏噍o助功能可以讓用戶的生活變得更加舒適,全局快門傳感器的優(yōu)勢(shì)就是能夠?qū)崿F(xiàn)這一點(diǎn),而透過(guò)計(jì)算機(jī)視覺(jué)開(kāi)發(fā)的功能,還能透過(guò)追蹤技術(shù)來(lái)達(dá)到人機(jī)互動(dòng)的目的。
至于筆電和個(gè)人計(jì)算機(jī)鏡頭,也是全局快門傳感器的應(yīng)用范疇。筆電和PC應(yīng)用全局快門技術(shù)的意義,可以進(jìn)行臉部辨識(shí)、手勢(shì)控制、眼動(dòng)追蹤、舒適度監(jiān)測(cè)和隱私保護(hù)。ToF和ALS(環(huán)境光傳感器)則可進(jìn)行存在偵測(cè)、電池續(xù)航、屏幕亮度自動(dòng)調(diào)整和隱私保護(hù)。以目前各廠商像是意法半導(dǎo)體所提供的影像產(chǎn)品,都可涵蓋上述的所有應(yīng)用,包括全局快門產(chǎn)品、ToF、ALS等等,以及各種參考設(shè)計(jì)。
評(píng)論