計算機視覺下一個技術(shù)拐點?前端成像或?qū)㈤_啟“視覺2.0時代”
“在復雜的光線環(huán)境下,AI機器獲取的圖像信噪比會受到極大影響,這是導致市場上AI視覺產(chǎn)品難以落地的最大原因?!敝炖^志認為,要徹底解決這一難題,關(guān)鍵在于做好AI視覺產(chǎn)品的前端成像。
本文引用地址:http://m.butianyuan.cn/article/201803/377234.htm要克服AI機器在復雜光線下的圖像識別,就要首先解決圖像的獲取和前端處理。目前,業(yè)內(nèi)主流的解決方案有3種。
第一種就是我們所熟知的激光雷達,在光線不好的情況下,通過主動發(fā)射激光并利用光線反射來獲取物體的圖像和三維信息。激光雷達的優(yōu)點非常明顯,它可以獲得極高的角度、距離和速度分辨率,同時也具有良好的抗干擾能力。
不過,受限于巨大的體積和昂貴的價格(各類32線、42線、64線等型號產(chǎn)品,價格動輒數(shù)萬數(shù)十萬甚至上百萬,雖然在持續(xù)降低,但依然不親民),它正在被邊緣化。正如馬斯克所說的,“激光雷達就像一根拐杖”。這個比喻很恰當,視覺能力不行的時候,需要依靠激光雷達這樣的拐杖,但拿著拐杖卻是永遠跑不快的。
剩下的兩種方案則都是在相機和成像處理的基礎(chǔ)上加以改進。首先是陣列計算相機技術(shù),原理有點類似于蜻蜓、蒼蠅等多目昆蟲的復眼,通過數(shù)個、數(shù)十個甚至上百個相機組成的陣列,拍攝出擁有億級以上像素的動態(tài)圖像,為AI機器提供視覺支持。
目前,這一技術(shù)尚在研發(fā)階段,受限于體積和供應(yīng)鏈的制約,其產(chǎn)品也還處在落地的早期階段。
第三種方案,即是眼擎科技所做的,AI視覺前端成像引擎芯片eyemore X42。
據(jù)朱繼志介紹說,眼擎所做的這種方式,像人的眼睛一樣,核心是把人的眼睛視力弄好——解決AI機器在各種光線下自動適應(yīng)光線的能力。
“我們堅信,以后AI機器的眼睛應(yīng)該和我們?nèi)祟愐粯?,以后它們的視力一定不會比人眼差,甚至比人眼強。這就是我們創(chuàng)業(yè)的初衷,我們要從根本上解決AI的視力問題?!?/p>
眼擎eyemore X42芯片,視覺2.0時代的AI機器成像引擎
關(guān)于AI視覺,馬斯克曾經(jīng)提出過“全天候被動光學圖像識別”的概念,就是要解決復雜光線,包括弱光、逆光、反光下的精準識別,這也是AI機器要解決的剛需問題。眼擎科技把這種自動適應(yīng)光線的視覺,稱之為“視覺2.0”。
2018年1月19日下午,在2018極客公園創(chuàng)新大會上,國內(nèi)AI視覺成像芯片科技公司眼擎科技正式對外發(fā)布“eyemore X42”芯片。據(jù)悉,eyemore X42是全球第一款完全自主研發(fā)并正式對外發(fā)布的AI視覺成像芯片。
數(shù)據(jù)顯示,eyemore X42成像引擎芯片,擁有比傳統(tǒng)ISP高20倍的計算能力,采用了20多種新的成像算法,集成了超過500種不同場景下的復雜光線數(shù)據(jù)。
eyemore X42芯片有三個特點:首先它是一顆獨立成像芯片。目前各種相機、智能手機、攝像頭里都有成像功能,但都是被集成在主芯片里面的,只能叫集成成像。而eyemore X42整顆芯片只專注于一件事情,那就是成像。這有點像Intel的CPU帶了集成顯卡功能,但我們知道,只有像NVIdia的專用GPU才一定是未來的主流。
評論