科技新勢(shì)力:機(jī)器視覺(jué)讓人類看到的世界更精彩
這五種感知能力中,我們大腦所接收的80%的信息都來(lái)自視覺(jué),我問(wèn)大家一個(gè)問(wèn)題,如果我們不得不放棄四種感知能力,只保留一種,你會(huì)保留哪一種?
我相信在座的很多人答案跟我一樣,你會(huì)保留視覺(jué)信息。大家有沒(méi)有想過(guò)為什么?我們都知道有這樣一個(gè)數(shù)據(jù),我們的大腦分成兩半,左腦和右腦,左腦是理性,右腦是感性的,是有創(chuàng)造力的。
還有一個(gè)數(shù)據(jù)可能大家并不知道,我們大腦有接近一千億個(gè)神經(jīng)元,絕大多數(shù)只做一件事情,就是處理我們的視覺(jué)信息。大家想想當(dāng)我們休息時(shí),會(huì)做什么,通常會(huì)閉上我們的眼睛,所以每一天當(dāng)我們的眼睛睜開(kāi)時(shí)我們?cè)谥鲃?dòng)或者被動(dòng)地接受大量的復(fù)雜信息。
大家知道,我們?nèi)祟愔饕峭ㄟ^(guò)學(xué)習(xí)來(lái)成長(zhǎng),智慧也是在這樣的過(guò)程中提高。那么分享知識(shí)就非常重要。從幾千年前開(kāi)始我們?nèi)祟惥桶盐淖志庉嫵蓵?shū)。但文字承載的信息量是有限的,我們還希望它更加的豐富多彩。
所以到了100多年前有了電話,我們可以遠(yuǎn)距離的讓聽(tīng)到我們的聲音,后來(lái)我們就了廣播,終于幾十年前我們有了電視,到了十年前最近這段時(shí)間大家知道在網(wǎng)絡(luò)帶寬成為可能的情況下視頻網(wǎng)站才成為可能。
為什么從文字,到聲音,到視頻,一步一步到幾千年前,到最近幾年,才能隨時(shí)隨地的分享動(dòng)態(tài)的畫(huà)面視頻?沒(méi)有其他原因,就是因?yàn)閯?dòng)態(tài)的視覺(jué)信息是最豐富的,也是最復(fù)雜的。
當(dāng)我們討論人工智能,討論計(jì)算機(jī)、機(jī)器是否有學(xué)習(xí)能力時(shí),我們首先要問(wèn)自己一個(gè)問(wèn)題,那就是機(jī)器有視覺(jué)嗎?我必須要這樣講,在今天絕大多數(shù)場(chǎng)合下,對(duì)我們絕大多數(shù)人來(lái)說(shuō),機(jī)器是沒(méi)有視覺(jué)的,機(jī)器是瞎子。
你們可能會(huì)反對(duì)我,會(huì)說(shuō)我在用手機(jī)拍照,我的電腦上也有攝像頭,大街小巷有這么多攝像頭,難道它們不都是機(jī)器的眼睛嗎?難道這不是視覺(jué)嗎?但是大家想一想,當(dāng)我們拍了這些照片視頻,最終計(jì)算機(jī)看懂這些視頻照片了嗎?
我們把它存下來(lái),不管是單反相機(jī)、攝像機(jī),拍完以后,最終還是要人處理這些信息。為什么?因?yàn)樵诮^大多數(shù)情況下,電腦是無(wú)法處理這種復(fù)雜信息的。
機(jī)器視覺(jué)給予我們一個(gè)更加互動(dòng)的世界
但今天我也要告訴大家,實(shí)際上在很多領(lǐng)域,機(jī)器視覺(jué)已經(jīng)在改變我們的生活。當(dāng)我說(shuō)到這兒時(shí),可能很多人馬上會(huì)想到的第一件事情是微軟的體感游戲,當(dāng)你做各種動(dòng)作時(shí)它會(huì)理解你的行為,配合多媒體的體驗(yàn),你會(huì)感受到互動(dòng)和豐富的感受。
所以,當(dāng)機(jī)器有視覺(jué)的時(shí)候,首先帶給我們的就是一個(gè)更加互動(dòng)的世界。在這兒我給大家看一段特別有意思的視頻,我的朋友黃沙,就用微軟的這個(gè)傳感器拍了一段動(dòng)感的視頻。
我們知道,好萊塢電影和美劇在制作過(guò)程中會(huì)有一個(gè)綠色的背景,它就是做一件事情,就是把人和背景區(qū)分開(kāi),這樣后期制作時(shí),就可以把綠色背景換成任何的場(chǎng)景,但有了三維計(jì)算機(jī)視覺(jué),任何在座的每個(gè)人都能超越好萊塢特效師,更好地完成精彩的動(dòng)畫(huà),這只是個(gè)簡(jiǎn)單的例子。
機(jī)器視覺(jué)帶給我們一個(gè)更加健康的世界
當(dāng)機(jī)器有了視覺(jué)以后,還會(huì)給我們帶來(lái)一個(gè)更加健康的世界。舉個(gè)例子,在我們做心臟手術(shù)時(shí)有一件特別痛苦的事。大家知道,人的心臟是唯一不能夠被麻醉藥麻痹使它靜止的器官,只要人活著心臟就會(huì)不停的跳動(dòng),在跳動(dòng)的心臟上做手術(shù)難度是非常大的。
所以,很多時(shí)候當(dāng)要對(duì)心臟做手術(shù)的時(shí)候,醫(yī)生做的第一件事情就是通過(guò)醫(yī)學(xué)的手段讓心臟停止跳動(dòng),然后用最短的時(shí)間做完手術(shù)再讓心臟重新起搏,但將有30%心臟將會(huì)永遠(yuǎn)不能再跳動(dòng)起來(lái)。但如果有一種技術(shù)使醫(yī)生在跳動(dòng)的心臟上做手術(shù)將會(huì)挽救很多人的人。
大家想一下,人的心臟跳動(dòng)是非常有規(guī)律的,如果手術(shù)刀可以跟心臟同頻率振動(dòng),醫(yī)生通過(guò)攝像頭看到的就是相對(duì)靜止的心臟,那時(shí)動(dòng)手術(shù)就相當(dāng)于在靜止的心臟上做手術(shù)。
這個(gè)畫(huà)面上,白色的網(wǎng)格就是要做手術(shù)的區(qū)域,通過(guò)計(jì)算機(jī)深度視覺(jué),已經(jīng)把它穩(wěn)定下來(lái)了。心臟手術(shù)很多人看了可能會(huì)不舒服,所以我們做了這樣一個(gè)演示,醫(yī)生給葡萄剝皮,這在國(guó)外已經(jīng)應(yīng)用了,我相信不會(huì)很久中國(guó)也會(huì)應(yīng)用。
機(jī)器視覺(jué)創(chuàng)造一個(gè)更加便捷的世界
剛才余凱博士也談到了自動(dòng)駕駛汽車(chē),大家想一想,當(dāng)自動(dòng)駕駛這一天來(lái)臨時(shí),我們將有一個(gè)更加便捷的世界。各位極客可能對(duì)剛剛過(guò)去的2015美國(guó)電子消費(fèi)展CES有更深刻的印象。
除了智能硬件以外,應(yīng)該說(shuō)2015年今年是自動(dòng)駕駛的元年。奔馳、寶馬、尼桑,幾乎所有的車(chē)廠都在今年推出了自己自動(dòng)駕駛汽車(chē)的計(jì)劃,很多車(chē)廠宣稱在2020年,就是五年以后,他們的自動(dòng)駕駛汽車(chē)就會(huì)跑在大街小巷。
我在這里有個(gè)判斷,我個(gè)人覺(jué)得,自動(dòng)駕駛汽車(chē),將會(huì)是第一個(gè)真正被人類大規(guī)模使用,且對(duì)人類生活產(chǎn)生顛覆性影響,真正意義上的機(jī)器人。因?yàn)楫?dāng)汽車(chē)可以自動(dòng)駕駛時(shí),它對(duì)我們來(lái)說(shuō)才是一個(gè)真正智能,不需要人為干預(yù)的機(jī)器人。
大家可能都看到過(guò)左邊這輛汽車(chē),它其實(shí)就是Google的無(wú)人駕駛汽車(chē)。Google應(yīng)該說(shuō)是到現(xiàn)在為止全世界第一個(gè)讓自動(dòng)駕駛汽車(chē)在人類的公路上行駛超過(guò)100萬(wàn)公里的公司。
我曾經(jīng)跟Google無(wú)人駕駛汽車(chē)負(fù)責(zé)人聊過(guò),當(dāng)時(shí)我開(kāi)了個(gè)玩笑,你們Google自動(dòng)駕駛汽車(chē)業(yè)只敢在美國(guó)這樣的城市測(cè)試,敢來(lái)北京測(cè)嗎?他當(dāng)時(shí)告訴我,無(wú)人駕駛汽車(chē)這件事情要成功,最大的障礙和挑戰(zhàn)只有一個(gè),那就是計(jì)算機(jī)視覺(jué)。
評(píng)論