院士鄔賀銓:人工智能的魅力是“永遠在路上”
深度神經(jīng)網(wǎng)絡實際上是個分類器
本文引用地址:http://m.butianyuan.cn/article/201901/396443.htm現(xiàn)在深度神經(jīng)網(wǎng)絡,就算你寫本書告訴計算機什么是貓什么是狗,它也學不會,但如果像對待人類小孩的教學方式那樣,感性地把一堆貓和狗的視頻送到深度神經(jīng)網(wǎng)絡,它就會分類,分類結束后,如果照片視頻上有標簽,它就會知道分的這類是貓。如果籃子里有個小狗,放進去,它照樣會分類為“狗”。所以深度神經(jīng)網(wǎng)絡實際上是個分類器,當你告訴它是什么,它就學會了。
機器學習是深度神經(jīng)網(wǎng)絡的主要技術,從近10年里機器學習的論文里可以發(fā)現(xiàn),現(xiàn)在機器學習的技術熱點,可以看到神經(jīng)網(wǎng)絡和進化編程等計算密集型算法在機器學習研究中的出色表現(xiàn)。
人每天吃飯大概要輸入2500卡路里的能量,卡路里換算成焦耳大概是1000萬焦耳,下圍棋5個小時大概要消耗人類3.3兆焦耳。AlphaGo跟李世石下棋時用了1000多個CPU,176個GPU,一個CPU功率100W,1個GPU200W,換算出來是173000W(這是以秒計的),如果5小時就是3000兆焦耳,這相當于李世石用的能耗是AlphaGo能耗的千分之一,也就是說,人工智能目前還需要很大的能量支持。
后來隔了一年,改進了AlphaGo Zero,換算成TPU,它只是AlphaGo原有1/12(能耗),用1/12的能耗跟AlphaGo下棋,100比0,當時AlphaGo還要搜集所有的圍棋棋譜,然后訓練三個月,AlphaGoZero只需要了解圍棋的規(guī)則,兩個AlphaGoZero互相對應,能把所有人類沒有走過的棋譜都走完,它就能戰(zhàn)勝了。所以優(yōu)化算法、改進硬件,包括GPU替換CPU(提高了三倍),TPU替換GPU(提高了15到30倍)。
最近不單AlphaGo Zero圍棋天下無敵,而且通過自學2個小時,還擊敗了日本的將棋(有點像中國的象棋),自學4個小時,把國際象棋也全部打贏了。
人工智能能做的事情有太多
在醫(yī)學上,剛剛過去的三個月,谷歌在機器學習又開發(fā)了Alpha Fold,Alpha Go的折疊,所謂折疊是來預測蛋白質結構的,在蛋白質結構預測的國際競賽里,打敗了所有由人組成的各種團隊,這有什么意義?如果能解釋蛋白質的結構,我們的很多疾病(包括癌癥)可能就會找到解決辦法。所以現(xiàn)在很多人工智能用在醫(yī)學上開發(fā)藥物,美國人工智能能比醫(yī)生提早六年診斷出阿茲海默病,醫(yī)療人工智能的器械也開始投入商用了。除此之外我們看一看蛋白質折疊結構,我們可以通過人工智能將它解釋出來。
我們知道門捷列夫開發(fā)元素周期表用了很長時間,現(xiàn)在假設我們不知道元素周期表,利用人工智能程序,幾個小時就可以把元素周期表重新定義出來。也就是說,人工智能確實能做好多事。
在語音識別方面,人工智能已經(jīng)超過了人,一般人類語音識別的錯誤率是5.1%,現(xiàn)在百度對漢語的語音識別,微軟對應于的語音識別已經(jīng)比這個水平要高了。當然,在嘈雜噪聲環(huán)境下,識別率現(xiàn)在也只有54%,不過人更識別不了,人還達不到這個水平。
包括人臉識別,中國上海依圖科技的人臉識別率在萬分之一,誤失率前提下可以通過98%,銀行柜臺人員用肉眼比對,誤差一般在1%,也就是說機器準確性是超過人的眼睛的。
當然,動態(tài)三維活體檢測更難,下面的圖是小布什的原相,右邊的小部什頭像和原圖一樣,但嘴型和上圖的胖子嘴型一樣,我們聽不出胖子講什么,但小布什可以通過口形恢復出他講話的聲音,讀懂唇語。
我們知道張學友在好幾場演唱會上抓到了逃犯,這不是因為張學友,而是演唱會門口的人臉識別門口。所以張學友說“抓逃犯是我的正業(yè),唱歌只是副業(yè)”。
機器視覺應用于什么?這是一個肺部CT照片,大家可以從中發(fā)現(xiàn)有沒有長瘤子、有沒有癌癥,但CT可以掃描出幾百張圖片,很麻煩。我們通過人工智能把這些CT照片還原成一個肺,看看有沒有纖維化,再看看肺周邊的器官怎么樣。
語音識別可以用于醫(yī)學,還有圖像識別,可以重建三維影像,比如醫(yī)學教育,包括在增進醫(yī)療手術的輔導可以起到很好的作用。
在產(chǎn)業(yè)上,清華和英業(yè)達合作(做影像電路板的),影像電路板很復雜,可以看看該連的線是不是連了,不該連的線是不是沒連,人的肉眼很容易錯檢,但利用機器視覺就可以發(fā)覺人的肉眼沒法兒發(fā)現(xiàn)的問題,每年的經(jīng)濟效益9000萬。
看好AI在醫(yī)療保健、汽車和金融服務的應用,但挑戰(zhàn)很大
人工智能對經(jīng)濟效益的貢獻,有一些統(tǒng)計,人工智能可以改進勞動生產(chǎn)率,可以激發(fā)消費需求、可以提高產(chǎn)品質量,有人預測2017到2030年,人工智能對勞動生產(chǎn)率的貢獻超過GDP的55%,其中中國占了全球將近一半,2030年人工智能會帶來7萬億美元的GDP增長貢獻,占GDP的26.1%,這個數(shù)字來源于普華永道,這里面講了幾個領域,是最重要的人工智能應用領域。
AI指數(shù)比較高的應用效果比較好的領域是:一是醫(yī)療保健,二是汽車,三是金融服務業(yè)。
以自動駕駛為例,麥肯錫估計2025年帶來的經(jīng)濟規(guī)模將達到萬億美元,降低交通事故,每年能挽救3到15萬人的生命,減少廢氣排放90%,麥肯錫還認為到2030年人工智能可以為全球額外貢獻13萬億美元的GDP增長,普華永道的估計是15.7萬億,平均年均GDP會增加1.2%。后面那句話更重要:足以比肩19世紀的蒸汽機、20世紀的工業(yè)機器人和21世紀的信息技術。
自動駕駛在簡單路況中是好的,復雜路況就很難,因為行人和司機不見到都遵守交通規(guī)則,很難用訓練的辦法掌握,還需要駕駛員的經(jīng)驗和知識,而且人類犯錯是偶然的,機器一旦犯錯可能就是系統(tǒng)性的。
人工智能可以檢測腫瘤,但醫(yī)院還不敢這么用,因為人工智能本身可以告訴你應該做什么,但它不會告訴你為什么,比如人工智能診斷一個病人,最后得出結論“鋸掉一條腿”,但不告訴你為什么,那醫(yī)院敢鋸掉腿嗎?
還有很多功能是人工智能難以勝任的,神經(jīng)網(wǎng)絡是以輸入為導向的算法,首先的前提是大量數(shù)據(jù),而且數(shù)據(jù)要比較準確,如果受了干擾他就很難,醫(yī)生受干擾可能會產(chǎn)生很多錯誤,比如北加州一個組織(美國公民自由聯(lián)盟)利用亞馬遜面部識別算法把美國535位國會議員的照片和美國警察局掌握的2.5萬名罪犯照片進行比對,發(fā)現(xiàn)28個議員被當成了罪犯。分類數(shù)據(jù)終美國的數(shù)據(jù)嚴重偏向白人男性,所以黑皮膚的可能就容易被錯認。
目前機器學習還有很多不足,圖靈獎的獲獎者說,目前機器學習只是曲線的擬合,一個諾貝爾獎經(jīng)濟學獎得主(Judea Pear)說“人工智能不過是統(tǒng)計學”,也就是說目前還是有很多不夠的地方。
剛才我用的兩張圖映射的貓和狗的區(qū)別有個曲線,但只要擬合的地方稍微錯一點,可能就會發(fā)生錯誤。比如本來是熊貓,在照片上加上一些噪音,機器就可能識別成長臂猿,所以人工智能識別目前來講還是比較嬌氣的。
大家看這張圖,有人看是順時針轉,有人看是逆時針轉,哪怕是同一個人,一會兒看著是順時針轉,眨眨眼睛卻變成了逆時針轉,究竟是順還是逆?其實只是左腿在前還是右腿在前的問題,是你的錯覺。
為什么會出現(xiàn)這個錯覺?因為它正好處于人工智能辨識(包括人辨識)的分界線,這時就可能發(fā)生誤導。
比如這個圖里的圓圈,大家都覺得它是滾動的、是圓的,可是真的是這樣嗎?每個球都這樣走嗎?不一定,我們可以看看。實際上每個球走的都是直線,所以人工智能的模型是會被誤導的。
這張圖中最后一個打問號的地方應該放(幾個數(shù)字),人很容易看出來應該放哪個,因為第一行232,第二行343,第三行應該是454,可是人工智能就很難看出來,因為人工智能要獲得人類常識不是那么容易的。
人工智能的進化與對就業(yè)的沖擊
當然,神經(jīng)網(wǎng)絡現(xiàn)在還在演進,關鍵是怎樣選擇正確框架以及訓練,清華大學的張鈸院士說我們要把感知和認知放到同一個空間里,不是簡單用概率統(tǒng)計的理論,要用模糊級的理論來重新定義它,否則我們沒辦法跟機器人交流,機器人之間也沒辦法交流。
機器學習著重于通過數(shù)據(jù)了解環(huán)境,而人類能夠同時洞悉不同的環(huán)境,群體學習是人類與生俱來的本領,而電腦是不具備的。我曾經(jīng)跟一個搞人工智能的公司說,識別語音、下圍棋都不算什么,能不能組織11人的機器人足球隊,什么時候踢贏皇馬了,那你就算厲害了,因為11人的機器人足球隊是要群體活動的。
剛才談到就業(yè),實際上人工智能確實會取代很多現(xiàn)在的就業(yè),49%的勞動人口可能會被取代,但一半以上的人是不會被取代的,因為人工智能沒有情感,有情感創(chuàng)作的文藝工作是不能被取代的,人工智能不能取代文藝,要由人來做。美國高德納咨詢公司以及世界經(jīng)濟論壇發(fā)布的《2018未來就業(yè)》報告中都說,實際上取代了一部分工作,但會新增一些工作崗位。人工智能會帶來數(shù)字鴻溝,發(fā)達國家、先進企業(yè),還會拉大社會貧富懸殊,高智能崗位會增加,一般勞動崗位會減少,自動駕駛出了問題是誰的責任?機器人創(chuàng)作的小說、詩歌是否享有相應的知識產(chǎn)權?有法律道德的問題,還有安全問題,如果人工智能殺人了怎么辦?
最后,總書記提到,要加快發(fā)展新一代人工智能,是我們贏得全球科技競爭主動權的重要抓略抓手。
清華大學張鈸院士說,我們現(xiàn)在正在通往AI的路上,現(xiàn)在走得并不遠,在出發(fā)點附近,但人工智能永遠在路上,大家要有思想準備,而這也就是人工智能的魅力。
人工智能會使得我們的生活更美好,或是走到我們的反面,這一切取決于人類自己。
謝謝。
評論