商湯科技徐立:人臉識(shí)別比指紋識(shí)別更準(zhǔn)確
刷臉支付的出現(xiàn)讓“靠臉吃飯”不再只是句玩笑,攝像頭識(shí)別人臉讓不法分子無(wú)處遁形……這背后所用到的視覺(jué)識(shí)別技術(shù),就是人工智能創(chuàng)業(yè)公司商湯科技所擅長(zhǎng)的領(lǐng)域。
本文引用地址:http://m.butianyuan.cn/article/201709/364966.htm公司成立不到3年,已經(jīng)受到多家投資機(jī)構(gòu)追捧。在今年7月,商湯科技宣布完成4.1億美元B輪融資,有投資人判斷這“可能成為這一波人工智能投資潮的巔峰”。
9月26日,在GPU技術(shù)大會(huì)間隙,商湯科技聯(lián)合創(chuàng)始人、CEO徐立與包括鳳凰科技在內(nèi)的多家媒體談到時(shí)下熱門(mén)的人臉解鎖、刷臉支付等問(wèn)題,并分享了商湯科技面對(duì)新行業(yè)如何做選擇,以及人才管理與培養(yǎng)計(jì)劃。
商湯科技是典型的、在技術(shù)浪潮中誕生于高校的創(chuàng)業(yè)公司,它的搖籃是香港中文大學(xué)的多媒體實(shí)驗(yàn)室。實(shí)驗(yàn)室在湯曉鷗教授的指導(dǎo)下,誕生了多篇知名論文,在2014年LFW檢測(cè)中人臉識(shí)別的準(zhǔn)確率首次超過(guò)人眼。
這些成果吸引了IDG合伙人??獾淖⒁饬ΓY本主動(dòng)找上門(mén),討論成立公司的可能性。于是在2014年10月,幾個(gè)香港中文大學(xué)的畢業(yè)生、微軟前員工加上一些清華畢業(yè)的研究人員,成立了這一公司。
學(xué)術(shù)研究貫穿了整個(gè)公司的發(fā)展。眼下團(tuán)隊(duì)已從30多人擴(kuò)展到700多人,其中有18名教授,120多名博士。并與香港中文大學(xué)、浙江大學(xué)、清華大學(xué)等高校都建有聯(lián)合培養(yǎng)實(shí)驗(yàn)室。在去年和前年,香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室共發(fā)了76篇論文。這對(duì)尚在學(xué)校的“未來(lái)人才”來(lái)說(shuō),就是一個(gè)不小的誘惑。“壟斷”人才,也是商湯的野心。
如何做好底層人工智能模塊,去應(yīng)用于有潛力的行業(yè)?人臉解鎖與刷臉支付是否安全?在以下內(nèi)容中都能找到答案,內(nèi)容整理自對(duì)徐立的采訪。
談手機(jī)上的人臉解鎖:技術(shù)早已成熟,商湯和主流手機(jī)廠商都有合作
蘋(píng)果在手機(jī)行業(yè)有這一領(lǐng)先的創(chuàng)舉,不在于技術(shù)領(lǐng)先,而是在他之前別人都不太敢去做大規(guī)模的嘗試。人臉識(shí)別做解鎖,之前就已經(jīng)成熟了,一年前就已經(jīng)能商用了。另外,這一變化可能和全面屏相關(guān),指紋移到后面去,比較麻煩,人臉解鎖就變成了一個(gè)自然的選擇。
商湯科技在這一方面進(jìn)行了較長(zhǎng)期的儲(chǔ)備,最早在互聯(lián)網(wǎng)金融方面做解鎖,跟手機(jī)人臉解鎖是完全一樣的。我們每天有一百萬(wàn)調(diào)用,20萬(wàn)次是攻擊,任何一個(gè)新的東西都要接受大量的攻擊。在攻防當(dāng)中,大部分的企業(yè)可能沒(méi)有這樣一個(gè)前期準(zhǔn)備。我們?cè)诨ヂ?lián)網(wǎng)金融行業(yè)里面,積累了大量的攻擊實(shí)例,我們?cè)诨铙w檢測(cè)上是有一定的優(yōu)勢(shì)。
人臉識(shí)別準(zhǔn)確率其實(shí)跟很多環(huán)境相關(guān),比如超遠(yuǎn)光等情況下。在大規(guī)模測(cè)試的情況下,人臉比對(duì)比指紋比對(duì)要準(zhǔn)確。指紋某種意義上特征沒(méi)有那么豐富,人臉特征維度就高很多。所以從生物特征來(lái)說(shuō),人臉是一個(gè)更好的生物特征。
我們現(xiàn)在跟很多主流手機(jī)廠商都有做解鎖的合作。量大了,大家都做,自然可以帶來(lái)一些行業(yè)的標(biāo)準(zhǔn)。
在刷臉支付領(lǐng)域,現(xiàn)在1:1的成熟度很高,1:N的就要看庫(kù)有多大,要是存全中國(guó)14億人的庫(kù),你跑來(lái)刷一次,做14億次的比例,可能每刷一次這個(gè)人就可能出錯(cuò),關(guān)鍵要看庫(kù)的大小。假設(shè)有一個(gè)APP的用戶達(dá)到了數(shù)億級(jí)別的,可能就會(huì)有風(fēng)險(xiǎn),現(xiàn)在百萬(wàn)級(jí)別,千萬(wàn)級(jí)別,1:N的準(zhǔn)確率還是很高的。
談發(fā)展階段與業(yè)務(wù)擴(kuò)展:判斷一年內(nèi)技術(shù)能超過(guò)人的行業(yè),我們就會(huì)進(jìn)入
2015年9月,我們開(kāi)始真正商業(yè)化,當(dāng)時(shí)與銀行和P2P公司合作,簽到千萬(wàn)級(jí)別的合同,之后才進(jìn)入安防領(lǐng)域。目前的情況是每一個(gè)工作日簽一個(gè)合同。
我們?cè)谶x擇進(jìn)入一個(gè)新行業(yè)時(shí),首先會(huì)拿市場(chǎng)上各種信息來(lái)形成一個(gè)市場(chǎng)反饋,有了這些反饋之后,我們找出公共點(diǎn),定義一個(gè)新的研究問(wèn)題。第二,我們看技術(shù)能不能超過(guò)人,一年之內(nèi)我們能夠把技術(shù)做到人的準(zhǔn)確率,過(guò)了那條紅線,我們就會(huì)投入去做這個(gè)行業(yè)。第三,看它的市場(chǎng)空間有多大,如果能替代人,這個(gè)行業(yè)本身有多少人,有多少市場(chǎng)空間,既有的空間有多大,如果這個(gè)市場(chǎng)能夠擴(kuò)展,會(huì)有多大的份額。
我們不可能把所有場(chǎng)景走完,所以我們采用的是1+1+X的模式。1+1是產(chǎn)和研,+X就是說(shuō)我在一些垂直行業(yè)里面,我本身不去把這個(gè)行業(yè)做穿,一定是要跟我的合作伙伴來(lái)快速結(jié)合去做。
智慧商業(yè)這些行業(yè)比較分散,我們會(huì)找這個(gè)行業(yè)背后的集成商。把我的東西包在他們的解決方案里,這是很多細(xì)分行業(yè)的打法。比如有一百多家銀行,地方都不一樣,跑到這些地方是很難服務(wù)的,你通過(guò)集成商的方法,1+1+X,X就起到了很大的作用。
為什么我們有一些行業(yè)不會(huì)進(jìn)去,原因是有可能是太細(xì)分,你是人海戰(zhàn)術(shù),每個(gè)省必須得有人,每個(gè)地方得有支持,只能跟合作伙伴來(lái)做,找到最好的合作伙伴。
商湯科技某種意義上是賣(mài)人工智能的樂(lè)高玩具,我要針對(duì)這個(gè)場(chǎng)景,去搭建一個(gè)樂(lè)高的車(chē),才能賣(mài)給這個(gè)行業(yè)的甲方,甲方根據(jù)我搭了這個(gè)車(chē),可以直接用,也可以改造一下,用這個(gè)東西去搭其他的東西,某種意義上是賣(mài)底層人工智能模塊,賦能這些行業(yè)。
這個(gè)賦能未來(lái)能夠形成核心競(jìng)爭(zhēng)力。第一是你模塊越來(lái)越多時(shí),就形成了聚集優(yōu)勢(shì),平臺(tái)上你可能有更多的流量,數(shù)據(jù)和場(chǎng)景,你用這些場(chǎng)景搭這個(gè)模塊,別人不具備。第二,這些模塊和應(yīng)用系統(tǒng)是耦合的。希望商湯成為這個(gè)軟的AI平臺(tái)的提供者。
談人才與管理:人工智能這本賬背后是人才的賬
驅(qū)動(dòng)這一波人工智能興起的是核心引擎和算法,你要真正掌握核心能力,要有5-7年的積累。
有一個(gè)故事,當(dāng)年谷歌收購(gòu)DeepMind,DeepMind是12個(gè)博士,價(jià)值4億英鎊。一個(gè)沒(méi)有產(chǎn)品的公司,12個(gè)人價(jià)值4億英鎊。當(dāng)時(shí)全球真正懂深度學(xué)習(xí)這個(gè)大腦的人,大概只有50個(gè)。意思就是說(shuō)你其實(shí)買(mǎi)的是核心的運(yùn)算能力,買(mǎi)的是未來(lái),不是這12個(gè)人值不值這個(gè)錢(qián)。果然一年之后,有了AlphaGo。
我們招人沒(méi)有設(shè)任何博士的門(mén)檻,博士和碩士沒(méi)有太大的差別,但是發(fā)現(xiàn)能做這件事情基本上都是博士。
第二,我們當(dāng)時(shí)前期融資只融了2千萬(wàn)美金,人工智能這本賬背后是人才的賬。我們把那些真正能做大腦設(shè)計(jì)、底層算法研究的這批人壟斷,行業(yè)再培養(yǎng)一批人還有5年時(shí)間,你就有足夠的時(shí)間窗口用行業(yè)領(lǐng)先的人。
第三,一群科學(xué)家坐在桌面去討論算法和想法,會(huì)有指數(shù)級(jí)的發(fā)現(xiàn)。你把一群聰明的人聚集在一起時(shí),演進(jìn)的速度是非??斓?。
我們的企業(yè)文化和團(tuán)隊(duì)的技術(shù)背景是相關(guān)的,我們想要堅(jiān)持做一些原創(chuàng)事情。當(dāng)時(shí)我們?cè)趯W(xué)習(xí)這個(gè)方向時(shí),明明感覺(jué)研究能在某個(gè)階段突破所謂的工業(yè)紅線,但是行業(yè)里沒(méi)人起頭,把這個(gè)場(chǎng)景落地,所以我們做了這樣的事。我們也會(huì)借鑒各種管理經(jīng)驗(yàn),很多高管來(lái)自于成熟大型公司。
在去年和前年,香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室共發(fā)了76篇論文,在行業(yè)里面要遠(yuǎn)遠(yuǎn)領(lǐng)先于谷歌,facebook,僅次于微軟。在這個(gè)過(guò)程當(dāng)中,學(xué)生們也會(huì)有成就感,我們有比較好的員工培養(yǎng)體系。
談當(dāng)下困惑與未來(lái)發(fā)展:看好視頻和交互
我們面臨的困難有當(dāng)團(tuán)隊(duì)從30人擴(kuò)到700多人,如何更有效地利用資源。第二,選擇垂直行業(yè)時(shí),考慮如何選擇能帶來(lái)最大商業(yè)價(jià)值與社會(huì)價(jià)值。
整個(gè)行業(yè)的困惑點(diǎn)在于技術(shù)的大眾化。我們一直講智能手機(jī),人工智能+手機(jī)還不如一個(gè)手機(jī)的價(jià)錢(qián),人工智能的錢(qián)誰(shuí)收呢?人工智能加了人臉解鎖,加了50元,這個(gè)錢(qián)向誰(shuí)收?這是行業(yè)的困惑,怎樣讓普羅大眾真正給技術(shù)買(mǎi)單。大眾對(duì)帶來(lái)的價(jià)值要有足夠的認(rèn)可度,這個(gè)行業(yè)的發(fā)展就會(huì)變得更好。
未來(lái)我們看好的兩塊,一塊是視頻,現(xiàn)在互聯(lián)網(wǎng)上真正帶來(lái)很大商業(yè)價(jià)值是搜索、電商、社交游戲,這些都很賺錢(qián)。這些完全都可以被視頻顛覆,如果視頻整個(gè)識(shí)別理解做得很好,未來(lái)就是谷歌搜索可以新做一個(gè)谷歌,視頻領(lǐng)域的谷歌。視頻都可以連接到背后的電商,你就是淘寶。我覺(jué)得視頻未來(lái)可以帶來(lái)很大的爆發(fā)力。
還有就是交互,現(xiàn)在整個(gè)互聯(lián)網(wǎng)的發(fā)展路徑,從傳統(tǒng)PC到移動(dòng)互聯(lián)網(wǎng),其實(shí)核心的點(diǎn)是交互模式發(fā)生了核心的變化,未來(lái)我們看到手勢(shì)、肢體,可能就會(huì)帶來(lái)下一波新的入口。人工智能已經(jīng)賦能了這樣一個(gè)交互的行業(yè),誰(shuí)把這些交互變成真正的產(chǎn)品入口,會(huì)帶來(lái)下一步的變化。我覺(jué)得不遠(yuǎn),可能五年之后,手機(jī)里面的APP,要么被顛覆,要么被轉(zhuǎn)型。
評(píng)論