手機(jī)廠商叫停像素之戰(zhàn) 攝像頭后千億生意待淘金

作者：時(shí)間：2017-12-07 來(lái)源：第一財(cái)經(jīng)日?qǐng)?bào)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編者按：攝像頭在硬件上碰到天花板后，要讓競(jìng)爭(zhēng)持續(xù)下去，視頻技術(shù)公司開(kāi)始在軟件和視頻數(shù)據(jù)處理優(yōu)化上為手機(jī)公司找到產(chǎn)品新的賣點(diǎn)。

　　上海地鐵的平面廣告，一年四季都在變換，手機(jī)廣告一直是主角之一。2017年的手機(jī)廣告，逆光、夜景拍照成為訴求的焦點(diǎn)，像素的高低之爭(zhēng)慢慢隱退。

本文引用地址：http://m.butianyuan.cn/article/201712/372719.htm

　　手機(jī)配上攝像頭后，在最近十幾年的時(shí)間里，攝像頭的像素從30萬(wàn)到100萬(wàn)、200萬(wàn)、500萬(wàn)到1000萬(wàn)，直至有超過(guò)2000萬(wàn)像素的攝像手機(jī)的出現(xiàn);攝影功能日漸強(qiáng)悍的手機(jī)首先讓傻瓜相機(jī)銷聲匿跡，而家用數(shù)碼相機(jī)的市場(chǎng)也被日漸蠶食，岌岌可危。

　　像素越高，手機(jī)功能越強(qiáng)大，但是在手機(jī)像素越過(guò)2000萬(wàn)門(mén)檻之后，各大手機(jī)廠商比拼像素量級(jí)的游戲玩不下去了。

　　在美國(guó)工作多年的資深視頻處理專家單記章告訴第一財(cái)經(jīng)記者，單個(gè)像素的尺寸從2004年的5.6微米，越做越小，現(xiàn)在已經(jīng)達(dá)到1微米的極限，在手機(jī)有限的物理空間里，靠擴(kuò)充像素提高圖像質(zhì)量基本上走到了盡頭。

　　攝像頭新舊事

　　攝像頭的運(yùn)用最早是在電腦上?，F(xiàn)任黑芝麻智能科技有限公司(下稱“黑芝麻”)CEO的單記章經(jīng)歷了攝像頭從電腦運(yùn)用到手機(jī)的完整周期。

　　“當(dāng)年，我們的產(chǎn)品上市了，從賣得不錯(cuò)到無(wú)人問(wèn)津，不過(guò)短短幾個(gè)月的時(shí)間?！被貞浧?7年前在硅谷的工作經(jīng)歷，單記章很是感慨。

　　彼時(shí)，單記章所在的Omnivision(豪威科技)正在嘗試將攝像頭放入電腦中，以供消費(fèi)者拍照并分享。

　　電腦攝像頭市場(chǎng)卻沒(méi)有預(yù)期的火熱。單記章告訴第一財(cái)經(jīng)記者，PC端攝像頭遭到冷落，主要是因?yàn)楫?dāng)時(shí)的網(wǎng)速太慢，照片無(wú)法傳出去、無(wú)法分享?！八晕覀兛紤]轉(zhuǎn)戰(zhàn)移動(dòng)端。雖然速度也不快，但至少(手機(jī))是能傳出去的?！?/p>

　　2000年9月，日本手機(jī)制造商夏普發(fā)布了世界上第一款帶有攝像頭的手機(jī)J—SH04。而Omnivision正是這款手機(jī)的供應(yīng)商之一，雖然那時(shí)的攝像頭僅有11萬(wàn)像素而已。

　　此后，市場(chǎng)逐漸被打開(kāi)。單記章對(duì)比了當(dāng)時(shí)的出貨數(shù)據(jù)，“之前的市場(chǎng)上，我們的出貨量只有1k+1k;后來(lái)就變成了一天3kk，一年相當(dāng)于十億顆。”(編者注：1k為一千，1k+1k是兩千，1kk是一百萬(wàn))據(jù)介紹，Omnivision曾在全球圖像傳感器市場(chǎng)占有高達(dá)40%的份額。

　　市場(chǎng)研究機(jī)構(gòu)IDC最新預(yù)計(jì)，2017年，全球智能手機(jī)的出貨量將達(dá)到15億部，到2021年，預(yù)計(jì)將增長(zhǎng)至17億部。

　　每一部智能手機(jī)基本上都有幾個(gè)攝像頭，僅僅手機(jī)對(duì)攝像頭數(shù)據(jù)處理的需求，就是一個(gè)無(wú)比龐大的市場(chǎng)，單記章選擇離開(kāi)Omnivision，而當(dāng)年的中學(xué)同學(xué)劉衛(wèi)紅離開(kāi)一家世界500強(qiáng)企業(yè)，選擇與他一起創(chuàng)業(yè)，圖像市場(chǎng)的巨大前景是至關(guān)重要的一個(gè)考慮因素。

　　攝像頭背后的圖像傳感器與應(yīng)用處理市場(chǎng)，并不僅僅是局限于手機(jī)領(lǐng)域。隨著人工智能產(chǎn)業(yè)的發(fā)展，從圖像的獲取、傳導(dǎo)到計(jì)算、理解、反饋，再到應(yīng)用層面的倉(cāng)儲(chǔ)物流、智能駕駛，圍繞在攝像頭身前身后的生意模式正逐漸走來(lái)。

　　所謂的圖像感知，是人工智能的一個(gè)重要細(xì)分領(lǐng)域，是計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解，來(lái)感知并識(shí)別不同的目標(biāo)。

　　第一財(cái)經(jīng)記者梳理發(fā)現(xiàn)，在前端捕捉深度信息，后端處理并理解復(fù)雜數(shù)據(jù)，最后反饋從而進(jìn)行決策，成為圖像感知產(chǎn)業(yè)活動(dòng)中的一個(gè)循環(huán)。

　　正是在這樣一個(gè)循環(huán)流程中，誕生了大量初創(chuàng)企業(yè)，它們以自己掌握的硬件或算法為核心，提供軟件或軟硬一體化的產(chǎn)品，以期撬動(dòng)產(chǎn)業(yè)金礦。

　　平安證券發(fā)布的《人工智能圖像識(shí)別專題報(bào)告》顯示，截至2016年初，在所有AI領(lǐng)域的企業(yè)中，聚焦于圖像感知的公司數(shù)量總計(jì)有185家，僅次于最火的機(jī)器學(xué)習(xí)。而其截至2016年初的累計(jì)融資總額更是超過(guò)了11億美元。

　　和單記章一樣，敏銳的企業(yè)家們小心翼翼地打量著這個(gè)龐大的市場(chǎng)，試圖從各個(gè)垂直領(lǐng)域切入，尋找著更進(jìn)一步的可能。

　　從捕捉到理解

　　刷臉支付、機(jī)場(chǎng)自助通關(guān)、物流自動(dòng)分揀、無(wú)人駕駛等都是圖像感知技術(shù)快速普及的一個(gè)縮影。在這樣場(chǎng)景的背后，是越加成熟的技術(shù)和越發(fā)準(zhǔn)確的識(shí)別率。

　　據(jù)第一財(cái)經(jīng)記者了解，在ImageNet比賽的圖像識(shí)別中，對(duì)象分類項(xiàng)目的準(zhǔn)確率已經(jīng)從2010年的72%提升到了2016年的97%。那么，如此之高的準(zhǔn)確率是如何實(shí)現(xiàn)的呢?

　　無(wú)論是深度攝像頭、AI芯片，還是基礎(chǔ)算法、神經(jīng)網(wǎng)絡(luò)，在圖像感知產(chǎn)業(yè)鏈上，一切都是為了兩個(gè)目的而服務(wù)的：更好地在前端捕捉深度信息，以及更準(zhǔn)確地在后端處理并理解數(shù)據(jù)。

　　“如果前面獲取的圖像壞了，或者糊了，那后方如何針對(duì)圖像進(jìn)行分析呢?”單記章問(wèn)道。

　　的確，在圖像捕捉的過(guò)程中極容易受到外界的干擾與影響，較上述物流領(lǐng)域更為復(fù)雜的情況比比皆是，比如自動(dòng)駕駛：需要應(yīng)對(duì)山洞內(nèi)外的不同光信號(hào)強(qiáng)度、車身抖動(dòng)甚至極端的霧霾及雨雪天氣?！巴砩虾馨?，雨飛來(lái)飛去、雨刷刮來(lái)刮去，這個(gè)時(shí)候怎么看清楚;大太陽(yáng)照在攝像頭上，人眼都看不見(jiàn)，這個(gè)時(shí)候又如何判斷。這些都是圖像捕捉中的難點(diǎn)?！眴斡浾卤硎?。

　　此時(shí)，就需要加強(qiáng)數(shù)據(jù)的預(yù)處理，其目的就是加強(qiáng)有用的信息，改善圖像質(zhì)量，便于對(duì)圖像進(jìn)行后期的處理分析。單記章透露，懸掛的攝像頭容易來(lái)回晃動(dòng)，他們?cè)鲞^(guò)一個(gè)防抖的優(yōu)化方案，不僅增強(qiáng)了畫(huà)質(zhì)，還提高了設(shè)備的使用壽命。

　　另一方面，相比前者捕捉圖像需要應(yīng)對(duì)各種突發(fā)因素，后者的處理分析看似更加簡(jiǎn)單。但往往這種情況下的計(jì)算更為復(fù)雜。

　　單記章告訴記者，刷臉技術(shù)用人工智能、神經(jīng)網(wǎng)絡(luò)來(lái)做，識(shí)別率都能達(dá)到99%以上，很難出錯(cuò)。但是很多技術(shù)無(wú)法抵御蓄意的攻擊，比如讓機(jī)器判斷是真人、照片還是視頻或者模型。這時(shí)候，如何實(shí)現(xiàn)生物特征的判斷非常重要。

　　比如，當(dāng)開(kāi)車遇到前方有物體時(shí)，在判斷該物體的車道、速度、方向等因素之外，還需要判斷這是個(gè)路樁，還是輛車，或者是個(gè)人?！皬?fù)雜環(huán)境下，需要對(duì)場(chǎng)景進(jìn)行理解，是人是車結(jié)果一定是不一樣的?！眴斡浾路Q。

　　超越硬件

　　“如何應(yīng)對(duì)不斷上漲的計(jì)算量是圖像處理中最難的部分之一。”圖漾科技副總經(jīng)理徐韜向記者透露，960P的深度攝像頭如果想要更進(jìn)一步做成1080P的話，換一個(gè)基礎(chǔ)攝像頭其實(shí)并不難，但精度的提高將導(dǎo)致計(jì)算量的大幅上漲，把握如此之高的計(jì)算量才是難點(diǎn)。

　　事實(shí)上，在圖像感知領(lǐng)域，硬件的難以突破由來(lái)已久，即便是在整個(gè)人工智能的發(fā)展歷程中，硬件的計(jì)算能力不足始終是制約其發(fā)展的瓶頸之一。可可資本合伙人李笙凱在接受第一財(cái)經(jīng)記者采訪時(shí)表示，雖然深度學(xué)習(xí)和GPU的利用對(duì)視覺(jué)硬件的處理計(jì)算能力有很大的提高，但怎么進(jìn)一步提高到可用的程度，市場(chǎng)上還始終沒(méi)有明確的解決方案。

　　單記章對(duì)此表示認(rèn)同，他認(rèn)為這是一個(gè)系統(tǒng)工程，一方面要提高硬件的計(jì)算能力，提高算法的適應(yīng)能力，同時(shí)也需要有創(chuàng)新的整體解決方案。他以不同時(shí)間開(kāi)車為例，“在傍晚時(shí)太陽(yáng)平射過(guò)來(lái)，攝像頭需要減少光強(qiáng)和炫光，而晚上又需要盡可能接受最多的光，還要解決對(duì)面大燈的照射問(wèn)題，這里就需要結(jié)合光學(xué)、攝像頭和圖像處理技術(shù)，在此基礎(chǔ)上采用機(jī)器學(xué)習(xí)的方法，才能從系統(tǒng)的角度更有效地解決端的計(jì)算能力不足的問(wèn)題”。

　　另一方面，單記章認(rèn)為，現(xiàn)階段的很多硬件在物理上已經(jīng)達(dá)到極限，難以升級(jí)，比如圖像傳感器?！坝捎谳d體本身的大小限制，攝像頭需要做得很小，這就導(dǎo)致傳感器的感光點(diǎn)也越做越小。有人研發(fā)還在做0.9微米，但這個(gè)性能已經(jīng)很差了?？窟@些東西提高也會(huì)有一定的空間，但是真的非常難?！?/p>

　　“圖像感知技術(shù)正處于發(fā)展階段，還有很長(zhǎng)的路要走，比如軟件算法也還需要5~10年甚至20年的積累突破?！崩铙蟿P對(duì)記者表示。他認(rèn)為，行業(yè)的技術(shù)壁壘和應(yīng)用壁壘一直都存在，市場(chǎng)的完全爆發(fā)還需要兩到三年的時(shí)間。

　　不過(guò)，也正是因?yàn)榇嬖谶@樣巨大的發(fā)展空間，潛力才得以凸顯，可能才得以孕育。這些在行業(yè)中耕耘多年的從業(yè)者，他們擁有最專業(yè)的眼光和最敏銳的嗅覺(jué)，有心證明他們的堅(jiān)持并非一場(chǎng)豪賭。

　　是不是豪賭無(wú)從得知，但正如李笙凱對(duì)當(dāng)下的判斷：優(yōu)化已有的技術(shù)，以滿足市場(chǎng)的剛性需求，是這個(gè)行業(yè)最困難的痛點(diǎn)，亦是最敞亮的通道。

新聞中心

手機(jī)廠商叫停像素之戰(zhàn) 攝像頭后千億生意待淘金

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)