院士鄔賀銓：人工智能的魅力是“永遠(yuǎn)在路上”

作者：時間：2019-01-08 來源：網(wǎng)易智能

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：中國日報網(wǎng)與網(wǎng)易傳媒共同舉辦的2019影響力峰會在北京召開，首屆影響力峰會的主題為“預(yù)見未來”。會上，中國工程院院士鄔賀銓擔(dān)任“預(yù)見科技未來”發(fā)布人，發(fā)表了主題為“迎接人工智能的未來”的演講。

　　深度神經(jīng)網(wǎng)絡(luò)實(shí)際上是個分類器

本文引用地址：http://m.butianyuan.cn/article/201901/396443.htm

　　現(xiàn)在深度神經(jīng)網(wǎng)絡(luò)，就算你寫本書告訴計算機(jī)什么是貓什么是狗，它也學(xué)不會，但如果像對待人類小孩的教學(xué)方式那樣，感性地把一堆貓和狗的視頻送到深度神經(jīng)網(wǎng)絡(luò)，它就會分類，分類結(jié)束后，如果照片視頻上有標(biāo)簽，它就會知道分的這類是貓。如果籃子里有個小狗，放進(jìn)去，它照樣會分類為“狗”。所以深度神經(jīng)網(wǎng)絡(luò)實(shí)際上是個分類器，當(dāng)你告訴它是什么，它就學(xué)會了。

　　機(jī)器學(xué)習(xí)是深度神經(jīng)網(wǎng)絡(luò)的主要技術(shù)，從近10年里機(jī)器學(xué)習(xí)的論文里可以發(fā)現(xiàn)，現(xiàn)在機(jī)器學(xué)習(xí)的技術(shù)熱點(diǎn)，可以看到神經(jīng)網(wǎng)絡(luò)和進(jìn)化編程等計算密集型算法在機(jī)器學(xué)習(xí)研究中的出色表現(xiàn)。

　　人每天吃飯大概要輸入2500卡路里的能量，卡路里換算成焦耳大概是1000萬焦耳，下圍棋5個小時大概要消耗人類3.3兆焦耳。AlphaGo跟李世石下棋時用了1000多個CPU，176個GPU，一個CPU功率100W，1個GPU200W，換算出來是173000W(這是以秒計的)，如果5小時就是3000兆焦耳，這相當(dāng)于李世石用的能耗是AlphaGo能耗的千分之一，也就是說，人工智能目前還需要很大的能量支持。

　　后來隔了一年，改進(jìn)了AlphaGo Zero，換算成TPU，它只是AlphaGo原有1/12(能耗)，用1/12的能耗跟AlphaGo下棋，100比0，當(dāng)時AlphaGo還要搜集所有的圍棋棋譜，然后訓(xùn)練三個月，AlphaGoZero只需要了解圍棋的規(guī)則，兩個AlphaGoZero互相對應(yīng)，能把所有人類沒有走過的棋譜都走完，它就能戰(zhàn)勝了。所以優(yōu)化算法、改進(jìn)硬件，包括GPU替換CPU(提高了三倍)，TPU替換GPU(提高了15到30倍)。

　　最近不單AlphaGo Zero圍棋天下無敵，而且通過自學(xué)2個小時，還擊敗了日本的將棋(有點(diǎn)像中國的象棋)，自學(xué)4個小時，把國際象棋也全部打贏了。

　　人工智能能做的事情有太多

　　在醫(yī)學(xué)上，剛剛過去的三個月，谷歌在機(jī)器學(xué)習(xí)又開發(fā)了Alpha Fold，Alpha Go的折疊，所謂折疊是來預(yù)測蛋白質(zhì)結(jié)構(gòu)的，在蛋白質(zhì)結(jié)構(gòu)預(yù)測的國際競賽里，打敗了所有由人組成的各種團(tuán)隊(duì)，這有什么意義?如果能解釋蛋白質(zhì)的結(jié)構(gòu)，我們的很多疾病(包括癌癥)可能就會找到解決辦法。所以現(xiàn)在很多人工智能用在醫(yī)學(xué)上開發(fā)藥物，美國人工智能能比醫(yī)生提早六年診斷出阿茲海默病，醫(yī)療人工智能的器械也開始投入商用了。除此之外我們看一看蛋白質(zhì)折疊結(jié)構(gòu)，我們可以通過人工智能將它解釋出來。

　　我們知道門捷列夫開發(fā)元素周期表用了很長時間，現(xiàn)在假設(shè)我們不知道元素周期表，利用人工智能程序，幾個小時就可以把元素周期表重新定義出來。也就是說，人工智能確實(shí)能做好多事。

　　在語音識別方面，人工智能已經(jīng)超過了人，一般人類語音識別的錯誤率是5.1%，現(xiàn)在百度對漢語的語音識別，微軟對應(yīng)于的語音識別已經(jīng)比這個水平要高了。當(dāng)然，在嘈雜噪聲環(huán)境下，識別率現(xiàn)在也只有54%，不過人更識別不了，人還達(dá)不到這個水平。

　　包括人臉識別，中國上海依圖科技的人臉識別率在萬分之一，誤失率前提下可以通過98%，銀行柜臺人員用肉眼比對，誤差一般在1%，也就是說機(jī)器準(zhǔn)確性是超過人的眼睛的。

　　當(dāng)然，動態(tài)三維活體檢測更難，下面的圖是小布什的原相，右邊的小部什頭像和原圖一樣，但嘴型和上圖的胖子嘴型一樣，我們聽不出胖子講什么，但小布什可以通過口形恢復(fù)出他講話的聲音，讀懂唇語。

　　我們知道張學(xué)友在好幾場演唱會上抓到了逃犯，這不是因?yàn)閺垖W(xué)友，而是演唱會門口的人臉識別門口。所以張學(xué)友說“抓逃犯是我的正業(yè)，唱歌只是副業(yè)”。

　　機(jī)器視覺應(yīng)用于什么?這是一個肺部CT照片，大家可以從中發(fā)現(xiàn)有沒有長瘤子、有沒有癌癥，但CT可以掃描出幾百張圖片，很麻煩。我們通過人工智能把這些CT照片還原成一個肺，看看有沒有纖維化，再看看肺周邊的器官怎么樣。

　　語音識別可以用于醫(yī)學(xué)，還有圖像識別，可以重建三維影像，比如醫(yī)學(xué)教育，包括在增進(jìn)醫(yī)療手術(shù)的輔導(dǎo)可以起到很好的作用。

　　在產(chǎn)業(yè)上，清華和英業(yè)達(dá)合作(做影像電路板的)，影像電路板很復(fù)雜，可以看看該連的線是不是連了，不該連的線是不是沒連，人的肉眼很容易錯檢，但利用機(jī)器視覺就可以發(fā)覺人的肉眼沒法兒發(fā)現(xiàn)的問題，每年的經(jīng)濟(jì)效益9000萬。

　　看好AI在醫(yī)療保健、汽車和金融服務(wù)的應(yīng)用，但挑戰(zhàn)很大

　　人工智能對經(jīng)濟(jì)效益的貢獻(xiàn)，有一些統(tǒng)計，人工智能可以改進(jìn)勞動生產(chǎn)率，可以激發(fā)消費(fèi)需求、可以提高產(chǎn)品質(zhì)量，有人預(yù)測2017到2030年，人工智能對勞動生產(chǎn)率的貢獻(xiàn)超過GDP的55%，其中中國占了全球?qū)⒔话耄?030年人工智能會帶來7萬億美元的GDP增長貢獻(xiàn)，占GDP的26.1%，這個數(shù)字來源于普華永道，這里面講了幾個領(lǐng)域，是最重要的人工智能應(yīng)用領(lǐng)域。

　　AI指數(shù)比較高的應(yīng)用效果比較好的領(lǐng)域是：一是醫(yī)療保健，二是汽車，三是金融服務(wù)業(yè)。

　　以自動駕駛為例，麥肯錫估計2025年帶來的經(jīng)濟(jì)規(guī)模將達(dá)到萬億美元，降低交通事故，每年能挽救3到15萬人的生命，減少廢氣排放90%，麥肯錫還認(rèn)為到2030年人工智能可以為全球額外貢獻(xiàn)13萬億美元的GDP增長，普華永道的估計是15.7萬億，平均年均GDP會增加1.2%。后面那句話更重要：足以比肩19世紀(jì)的蒸汽機(jī)、20世紀(jì)的工業(yè)機(jī)器人和21世紀(jì)的信息技術(shù)。

　　自動駕駛在簡單路況中是好的，復(fù)雜路況就很難，因?yàn)樾腥撕退緳C(jī)不見到都遵守交通規(guī)則，很難用訓(xùn)練的辦法掌握，還需要駕駛員的經(jīng)驗(yàn)和知識，而且人類犯錯是偶然的，機(jī)器一旦犯錯可能就是系統(tǒng)性的。

　　人工智能可以檢測腫瘤，但醫(yī)院還不敢這么用，因?yàn)槿斯ぶ悄鼙旧砜梢愿嬖V你應(yīng)該做什么，但它不會告訴你為什么，比如人工智能診斷一個病人，最后得出結(jié)論“鋸掉一條腿”，但不告訴你為什么，那醫(yī)院敢鋸掉腿嗎?

　　還有很多功能是人工智能難以勝任的，神經(jīng)網(wǎng)絡(luò)是以輸入為導(dǎo)向的算法，首先的前提是大量數(shù)據(jù)，而且數(shù)據(jù)要比較準(zhǔn)確，如果受了干擾他就很難，醫(yī)生受干擾可能會產(chǎn)生很多錯誤，比如北加州一個組織(美國公民自由聯(lián)盟)利用亞馬遜面部識別算法把美國535位國會議員的照片和美國警察局掌握的2.5萬名罪犯照片進(jìn)行比對，發(fā)現(xiàn)28個議員被當(dāng)成了罪犯。分類數(shù)據(jù)終美國的數(shù)據(jù)嚴(yán)重偏向白人男性，所以黑皮膚的可能就容易被錯認(rèn)。

　　目前機(jī)器學(xué)習(xí)還有很多不足，圖靈獎的獲獎?wù)哒f，目前機(jī)器學(xué)習(xí)只是曲線的擬合，一個諾貝爾獎經(jīng)濟(jì)學(xué)獎得主(Judea Pear)說“人工智能不過是統(tǒng)計學(xué)”，也就是說目前還是有很多不夠的地方。

　　剛才我用的兩張圖映射的貓和狗的區(qū)別有個曲線，但只要擬合的地方稍微錯一點(diǎn)，可能就會發(fā)生錯誤。比如本來是熊貓，在照片上加上一些噪音，機(jī)器就可能識別成長臂猿，所以人工智能識別目前來講還是比較嬌氣的。

　　大家看這張圖，有人看是順時針轉(zhuǎn)，有人看是逆時針轉(zhuǎn)，哪怕是同一個人，一會兒看著是順時針轉(zhuǎn)，眨眨眼睛卻變成了逆時針轉(zhuǎn)，究竟是順還是逆?其實(shí)只是左腿在前還是右腿在前的問題，是你的錯覺。

　　為什么會出現(xiàn)這個錯覺?因?yàn)樗锰幱谌斯ぶ悄鼙孀R(包括人辨識)的分界線，這時就可能發(fā)生誤導(dǎo)。

　　比如這個圖里的圓圈，大家都覺得它是滾動的、是圓的，可是真的是這樣嗎?每個球都這樣走嗎?不一定，我們可以看看。實(shí)際上每個球走的都是直線，所以人工智能的模型是會被誤導(dǎo)的。

　　這張圖中最后一個打問號的地方應(yīng)該放(幾個數(shù)字)，人很容易看出來應(yīng)該放哪個，因?yàn)榈谝恍?32，第二行343，第三行應(yīng)該是454，可是人工智能就很難看出來，因?yàn)槿斯ぶ悄芤@得人類常識不是那么容易的。

　　人工智能的進(jìn)化與對就業(yè)的沖擊

　　當(dāng)然，神經(jīng)網(wǎng)絡(luò)現(xiàn)在還在演進(jìn)，關(guān)鍵是怎樣選擇正確框架以及訓(xùn)練，清華大學(xué)的張鈸院士說我們要把感知和認(rèn)知放到同一個空間里，不是簡單用概率統(tǒng)計的理論，要用模糊級的理論來重新定義它，否則我們沒辦法跟機(jī)器人交流，機(jī)器人之間也沒辦法交流。

　　機(jī)器學(xué)習(xí)著重于通過數(shù)據(jù)了解環(huán)境，而人類能夠同時洞悉不同的環(huán)境，群體學(xué)習(xí)是人類與生俱來的本領(lǐng)，而電腦是不具備的。我曾經(jīng)跟一個搞人工智能的公司說，識別語音、下圍棋都不算什么，能不能組織11人的機(jī)器人足球隊(duì)，什么時候踢贏皇馬了，那你就算厲害了，因?yàn)?1人的機(jī)器人足球隊(duì)是要群體活動的。

　　剛才談到就業(yè)，實(shí)際上人工智能確實(shí)會取代很多現(xiàn)在的就業(yè)，49%的勞動人口可能會被取代，但一半以上的人是不會被取代的，因?yàn)槿斯ぶ悄軟]有情感，有情感創(chuàng)作的文藝工作是不能被取代的，人工智能不能取代文藝，要由人來做。美國高德納咨詢公司以及世界經(jīng)濟(jì)論壇發(fā)布的《2018未來就業(yè)》報告中都說，實(shí)際上取代了一部分工作，但會新增一些工作崗位。人工智能會帶來數(shù)字鴻溝，發(fā)達(dá)國家、先進(jìn)企業(yè)，還會拉大社會貧富懸殊，高智能崗位會增加，一般勞動崗位會減少，自動駕駛出了問題是誰的責(zé)任?機(jī)器人創(chuàng)作的小說、詩歌是否享有相應(yīng)的知識產(chǎn)權(quán)?有法律道德的問題，還有安全問題，如果人工智能殺人了怎么辦?

　　最后，總書記提到，要加快發(fā)展新一代人工智能，是我們贏得全球科技競爭主動權(quán)的重要抓略抓手。

　　清華大學(xué)張鈸院士說，我們現(xiàn)在正在通往AI的路上，現(xiàn)在走得并不遠(yuǎn)，在出發(fā)點(diǎn)附近，但人工智能永遠(yuǎn)在路上，大家要有思想準(zhǔn)備，而這也就是人工智能的魅力。

　　人工智能會使得我們的生活更美好，或是走到我們的反面，這一切取決于人類自己。

　　謝謝。

新聞中心

院士鄔賀銓：人工智能的魅力是“永遠(yuǎn)在路上”

評論

相關(guān)推薦

技術(shù)專區(qū)