為什么雙目自動(dòng)駕駛系統(tǒng)難以普及?
單目的測距和3-D估計(jì)靠什么?是檢測目標(biāo)的Bounding Box(BB),如果無法檢測的障礙物,該系統(tǒng)就無法估計(jì)其距離和3-D姿態(tài)/朝向。沒有深度學(xué)習(xí)的時(shí)候,ME主要是基于BB,攝像頭標(biāo)定得到的姿態(tài)和高度以及路面平直的假設(shè)估算距離。有了深度學(xué)習(xí),可以根據(jù)3-D的ground truth來訓(xùn)練NN模型,得到3D大小和姿態(tài)估計(jì),距離是基于平行線原理(single view metrology)得到的。不久前百度Apollo公布的單目L3解決方案講的比較清楚了,參考論文是“3D Bounding Box Estimation by Deep Learning and Geometry".雙目當(dāng)然可以算視差和深度了,即使沒有檢測出障礙物(因?yàn)橛懈郊拥纳疃刃畔?,檢測器會比單目好),也會報(bào)警。問題是,雙目視覺系統(tǒng)估計(jì)視差沒那么容易,立體匹配是計(jì)算機(jī)視覺典型的難題,基線寬得到遠(yuǎn)目標(biāo)測距準(zhǔn),而基線短得到近目標(biāo)測距結(jié)果好,這里是存在折衷的。目前市場上ADAS存在的雙目視覺系統(tǒng)就是Subaru EyeSight,據(jù)說性能還行。百度推出的阿波龍L4擺渡車量產(chǎn)100臺,就安裝了雙目系統(tǒng)。還有歐盟自主泊車項(xiàng)目V-Charge也采用了前向雙目視覺系統(tǒng),另外自動(dòng)駕駛研發(fā)系統(tǒng)Berta Benz也是,而且和雷達(dá)系統(tǒng)后融合,其中雙目匹配的障礙物檢測算法Stixel很出名。以前Bosch和Conti這些Tier-1公司也研制過雙目視覺解決方案,但沒有在市場上產(chǎn)生影響力,據(jù)說被砍掉了。談到雙目系統(tǒng)的難點(diǎn),除了立體匹配,還有標(biāo)定。標(biāo)定后的系統(tǒng)會出現(xiàn)“漂移”的,所以在線標(biāo)定是必須具有的。單目也是一樣,因?yàn)檩喬プ冃魏蛙圀w顛簸都會影響攝像頭外參數(shù)變化,必須在線做標(biāo)定修正一些參數(shù),比如仰角(pitch angle)和偏角(yaw angle)。雙目在線標(biāo)定就更復(fù)雜些,因?yàn)殡p目匹配盡量簡化成1-D搜索,所以需要通過stereo rectification將兩個(gè)鏡頭光軸方向平行并和基線垂直。所以針對獲得的gain相比,增加的復(fù)雜度和成本,如果不劃算商家就會放棄。最近重提雙目視覺,是因?yàn)楣韫刃酒景舶裕ˋmbarella)在2014年收購意大利帕爾馬大學(xué)的Vis Lab,研制了雙目的ADAS和自動(dòng)駕駛芯片,去年CES之后就開始進(jìn)軍車企和Tier-1。而且,安霸目前正在繼續(xù)研究提升該系統(tǒng)的性能。下圖就是它在車頂安裝6對立體視覺系統(tǒng)的示意圖,其中它們的基線寬度可以不一樣的,相應(yīng)地有效檢測距離也就不同。筆者曾坐過它的自動(dòng)駕駛車,遠(yuǎn)處可以看到200米,近處20-30米。它確實(shí)可以做在線標(biāo)定,隨時(shí)調(diào)整一些雙目視覺的參數(shù)。
立體匹配先說立體匹配,即視差/深度估計(jì)。如圖假設(shè)左右攝像頭焦距f,基線(兩個(gè)光心連線)寬B,3-D點(diǎn)X的深度z,而其視差(投影到左右圖像的2-D點(diǎn),其坐標(biāo)差)即
可見視差能夠反算深度值。但是這里最難的就是左右鏡頭看到的圖像如何確定是同一個(gè)目標(biāo),即匹配問題。匹配方法分兩種,全局法和局部法,雙目匹配的四個(gè)步驟:
- 匹配成本(matching cost)計(jì)算;
- 成本聚集(aggregation);
- 視差(disparity)計(jì)算/優(yōu)化;
- 視差修正(refinement)。
- 1) 空間傳播(Spatial propagation): 每個(gè)像素檢查左邊和上邊鄰居視差和平面參數(shù),如果匹配成本變小就取代當(dāng)前估計(jì);
- 2) 視角傳播(View propagation): 其他視角的像素做變換,檢查其對應(yīng)圖像的估計(jì),如果變小就取代;
- 3) 時(shí)域傳播(Temporal propagation): 前后幀考慮對應(yīng)像素的估計(jì);
- 4) 平面細(xì)化(Plane refinement): 隨機(jī)產(chǎn)生樣本,如果估計(jì)使匹配成本下降,更新。
- 5) 后處理(Post-processing): 左右一致性和加權(quán)中值濾波器去除出格點(diǎn)(outliers)。
在線標(biāo)定再說在線標(biāo)定。
這是一個(gè)利用路上標(biāo)志線(斑馬線)的標(biāo)定方法:已知斑馬線的平行線模式,檢測斑馬線并提取角點(diǎn),計(jì)算斑馬線模式和路面實(shí)現(xiàn)匹配的單映性變換(Homography)參數(shù),得到標(biāo)定參數(shù)。另外一個(gè)方法基于VO和SLAM,比較復(fù)雜,不過可以同時(shí)做基于地圖的定位。采用SLAM做在線標(biāo)定,不適合高頻率操作,下圖是其算法的流程圖:1-4步, 通過立體視覺SLAM獲取全局連續(xù)地圖;第5步給出雙目相機(jī)變換初始估計(jì),第6步把所有立體相機(jī)的地圖聚合成一個(gè)地圖;7-8步獲取多個(gè)相機(jī)之間的姿態(tài)。和單目方法類似,采用車道線平行和路平面這個(gè)假設(shè)可以快速完成在線標(biāo)定,即消失點(diǎn)(vanishing point)理論:假設(shè)一個(gè)平坦的道路模型,清晰的縱向車道線,沒有其他目標(biāo)的邊緣和它們平行;要求駕駛車輛速度慢,車道線連續(xù),左右相機(jī)的雙目配置要左攝像頭相對路面的仰角/斜角(yaw/roll angles)比較小;這樣跟初始化的消失點(diǎn)(與線下標(biāo)定相關(guān))比較可以算出雙目外參數(shù)的漂移量,其算法就是從消失點(diǎn)估計(jì)攝像頭仰角/斜角。
典型的雙目自動(dòng)駕駛系統(tǒng)下面介紹幾個(gè)典型的雙目自動(dòng)駕駛系統(tǒng)。
Berta Benz采用的障礙物檢測算法Stixel基于以下假設(shè):場景中的目標(biāo)描述為列,重心的原因目標(biāo)是站立在地面上,每個(gè)目標(biāo)上的上部比下部的深度大。下圖(a-d) 介紹了SGM視差結(jié)果如何生成Stixel分割結(jié)果:下圖是Stixels 計(jì)算的示意圖:(a)基于動(dòng)態(tài)規(guī)劃的自由駕駛空間計(jì)算 (b) 高度分割中的屬性值 (c) 成本圖像 (灰度值反過來) (d) 高度分割。這是他們加上深度學(xué)習(xí)做視差融合之后再做Stixel的框圖和新結(jié)果:介紹一個(gè)VisLab早期雙目障礙物的算法,Generic Obstacle and Lane Detection system (GOLD)?;贗PM(Inverse Perspective Mapping),檢測車道線,根據(jù)左右圖像的差計(jì)算路上障礙物:(a) Left. (b) Right (c) Remapped left. (d) Remapped right. (e) Thresholded and filtered difference between remapped views. (f) In light gray, the road area visible from both cameras.(a) Original. (b) Remapped. (c) Filtered. (d) Enhanced. (e) Binarized.GOLD system architecture這是VisLab參加自動(dòng)駕駛比賽VIAC (VisLab Intercontinental Autonomous Challenge)的車輛,除了雙目攝像頭以外,車上還有激光雷達(dá)作為道路分類的輔助。這是其雙目障礙物檢測流程圖:視差估計(jì)利用了SGM算法和基于SAD的相關(guān)算法。后處理中加了兩個(gè)DSI(Disparity Space Image)空間的濾波器,見圖5-274,一個(gè)是平滑處理,另一個(gè)是基于慣導(dǎo)(IMU)的運(yùn)動(dòng)軌跡處理。障礙物檢測算法采用了JPL的方法,基于空間布置特性以及車輛的物理特性聚類得到障礙物。物理特性包括最大的高度(車輛),最小高度(障礙物)和最大道路可通過范圍,這些約束定義了一個(gè)空間截?cái)噱F(truncated cone), 如圖所示,那么在聚類過程中凡是落在截?cái)噱F內(nèi)的點(diǎn)劃為障礙物。為加速視差估計(jì)算法,采用了劃分DSI的方法:另外一種經(jīng)典的方法是根據(jù)路面方程(立體視覺)得到路面視差,基于此計(jì)算出路面的障礙物:總的來看,雙目檢測障礙物的方法基本基于視差圖,基于路面視差的方法較多。也許隨著深度學(xué)習(xí)發(fā)展的突飛猛進(jìn),加上計(jì)算平臺的增強(qiáng),雙目自動(dòng)駕駛系統(tǒng)也會普及起來。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。