人工智能的博弈 百度是失誤還是作弊
這一周,百度因?yàn)樵谝粋€(gè)比賽中作弊被推到輿論的風(fēng)頭浪尖。
本文引用地址:http://m.butianyuan.cn/article/275338.htm2張彩票和200張彩票
事情原委還要回到5月中旬,彼時(shí)百度宣稱其在ImageNet(圖像識(shí)別最大數(shù)據(jù)庫)的圖像識(shí)別測試挑戰(zhàn)賽中擊敗了谷歌和微軟,稱其圖像識(shí)別錯(cuò)誤率低至4.58%,而微軟是4.94%,谷歌為4.8%。而在這種測試中,人類辨識(shí)ImageNet照片的錯(cuò)誤率為5%左右。
ImageNet這項(xiàng)比賽的全稱為Imagenet Large Scale Visual Recognition Challenge(ILSVRC),由來自斯坦福大學(xué)、密歇根大學(xué)以及北卡萊羅納大學(xué)教堂山分校的學(xué)者舉辦,是目前最權(quán)威的圖像識(shí)別測試。該測試主要衡量計(jì)算機(jī)識(shí)別圖片中的物件的能力,其原理基本上和百度谷歌都有的識(shí)圖應(yīng)用一致,不過測試的數(shù)據(jù)集規(guī)模極大,標(biāo)準(zhǔn)更加嚴(yán)謹(jǐn)詳細(xì)。
失誤or作弊?百度人工智能遭遇刷分危機(jī)
該比賽從2010年開始舉辦,至今已經(jīng)是第六屆,參與比賽的學(xué)術(shù)組織和機(jī)構(gòu)達(dá)到了50余所,大多來自世界知名大學(xué)的人工智能研究所以及科技界巨頭企業(yè)如谷歌、微軟等。
參與者需要掃描擁有100多萬張圖片的數(shù)據(jù)庫,將它們歸到1000個(gè)不同的類別之中,并對(duì)通過識(shí)別自動(dòng)給每張圖片添加注釋,最后將結(jié)果上傳到ImageNet的評(píng)估服務(wù)器上。最終比賽排名結(jié)果及各項(xiàng)指標(biāo)將由ImageNet在比賽結(jié)束后審核公布。
然而本月初,ImageNet隨后卻發(fā)文指責(zé)百度在測試中存在違規(guī)作弊行為。因?yàn)榘凑諟y試的官方規(guī)定,參與者每周只能向服務(wù)器提交2次測試結(jié)果,而百度卻在5天內(nèi)提交了40次結(jié)果。此外,ImageNet表示,百度還使用了30個(gè)不同的賬號(hào),在過去6個(gè)月中提交了約200次測試結(jié)果。
通俗的來講,百度這種做法可以理解為在其他團(tuán)隊(duì)只購買2張彩票的情況下,它卻購買了200張彩票以提高中獎(jiǎng)概率。
ImageNet將此情況通報(bào)給了所有參賽團(tuán)隊(duì),對(duì)百度的成績予以否認(rèn)并禁止百度1年內(nèi)不得參加該比賽。
百度的不遺余力
與谷歌類似,百度都是以互聯(lián)網(wǎng)搜索為基礎(chǔ)的技術(shù)導(dǎo)向型公司,手頭握有大量的用戶和數(shù)據(jù)積累,對(duì)于進(jìn)行大數(shù)據(jù)挖掘,探索人工智能有著天然的優(yōu)勢(shì)。它也確實(shí)學(xué)著谷歌一樣在各個(gè)領(lǐng)域加強(qiáng)自己的創(chuàng)新技術(shù)探索,人工智能就是其中極為重要的一部分。
在人工智能這個(gè)大領(lǐng)域百度的探索和研究都可謂不遺余力,且在多個(gè)細(xì)分小類別都有巨大的投入。
其中,就包括引進(jìn)權(quán)威人才吳恩達(dá)及組建硅谷研究中心。2014年5月,百度宣布在美國硅谷成立人工智能的專門研發(fā)中心,并從谷歌挖來了深度學(xué)習(xí)權(quán)威學(xué)者吳恩達(dá)(AndrewNg)任命其為百度深度學(xué)習(xí)研究院首席科學(xué)家。吳恩達(dá)不僅是斯坦福大學(xué)計(jì)算機(jī)科學(xué)和電子工程學(xué)的學(xué)術(shù)風(fēng)向標(biāo),更因其一手創(chuàng)建并領(lǐng)導(dǎo)了谷歌深度學(xué)習(xí)團(tuán)隊(duì),被業(yè)界譽(yù)為“谷歌大腦之父”,百度能聘到這樣的權(quán)威級(jí)人才實(shí)屬不易,可見其重視和投入。
去年底,美國《福布斯》發(fā)布文章稱,吳恩達(dá)及研究團(tuán)隊(duì)發(fā)明了一種新的語音識(shí)別方法,這款基于深度學(xué)習(xí)的名為“DeepSpeech”語音識(shí)別系統(tǒng)可以在嘈雜環(huán)境下實(shí)現(xiàn)將近81%的辨識(shí)準(zhǔn)確率??突仿〈髮W(xué)工程學(xué)助理研究教授IanLane對(duì)其的評(píng)價(jià)是“百度研究院最近的工作有可能顛覆語音識(shí)別在未來的應(yīng)用效果?!?/p>
而百度目前在國內(nèi)擁有十幾座云計(jì)算中心,為滿足大數(shù)據(jù)在計(jì)算和存儲(chǔ)上的高要求,還投入使用了4萬兆交換機(jī),并在探索10萬兆的交換機(jī)。百度在GPU高性能計(jì)算機(jī)上的投入也是十分下血本,其美國研發(fā)中心的科學(xué)家吳韌稱百度在2013年剛開始準(zhǔn)備組建Minwa超級(jí)計(jì)算機(jī)的時(shí)候,購買量在國內(nèi)達(dá)到了第二,“拿不到第一是因?yàn)樘旌赢?dāng)然得是第一”。
交換機(jī)相關(guān)文章:交換機(jī)工作原理
評(píng)論