微軟人工智能計(jì)劃:華人頂起半邊天
每年,微軟研發(fā)集團(tuán)會(huì)挑選一些項(xiàng)目向公司業(yè)務(wù)部門(mén)展示,但只有七個(gè)項(xiàng)目進(jìn)入到最后的顛覆性科技評(píng)估環(huán)節(jié)。這些入選的項(xiàng)目大都在相關(guān)性領(lǐng)域有顛覆性的研究發(fā)現(xiàn)。每年10月,在雷德蒙會(huì)議室里,各個(gè)項(xiàng)目負(fù)責(zé)人都會(huì)與微軟高層們進(jìn)行4個(gè)小時(shí)的頭腦風(fēng)暴,沈向洋會(huì)在一旁收集反饋,并決定下一步動(dòng)作,比如,是否立刻將其落實(shí)為產(chǎn)品。
本文引用地址:http://m.butianyuan.cn/article/201606/293158.htm一些項(xiàng)目已經(jīng)處于前期研究的階段,其中包括位于美國(guó)加州的圣塔芭芭拉市(SantaBarbara)的量子計(jì)算實(shí)驗(yàn)室;英國(guó)劍橋研究院在做生物計(jì)算(Biological Computing)的長(zhǎng)期研究;最近,微軟還試圖在DNA上存儲(chǔ)海量信息,并為此新建了一個(gè)Wet Lab……
說(shuō)起這些項(xiàng)目,沈向洋如數(shù)家珍。過(guò)去兩年,他平均每周深度考察兩個(gè)來(lái)自全球研究院的項(xiàng)目。沈向洋分享了以上那些鮮為人知的微軟黑科技。他試圖向外界展示的不外乎一點(diǎn):現(xiàn)在的微軟跟蓋茨時(shí)代沒(méi)有兩樣,仍然是一家注重技術(shù)研發(fā)的公司,哪怕這些研發(fā)都相當(dāng)基礎(chǔ),短期內(nèi)不可能實(shí)現(xiàn)。
從基礎(chǔ)研發(fā)到最終產(chǎn)品,其中過(guò)程并不容易。微軟不止一次在一些項(xiàng)目上栽跟頭,包括Tay。今年3月Tay在美國(guó)正式上線(xiàn),但幾個(gè)小時(shí)后,就有別有用心的人教會(huì)它發(fā)表種族歧視的言論。不久Tay便被要求緊急下線(xiàn)。這幾乎可以看作小冰“西游”的一次失敗。
不過(guò),在與中國(guó)文化相近的日本,小冰的姐妹版Rinna卻受到追捧。在沈向洋看來(lái),這回到了最根本的問(wèn)題:計(jì)算機(jī)的算法讓它已經(jīng)能識(shí)別數(shù)千種汽車(chē),而人類(lèi)可能只能認(rèn)出三種。但在認(rèn)知、同理心和情感層面,機(jī)器還無(wú)法接近人類(lèi)。
需求與未來(lái)
人工智能之于今天的微軟,就像當(dāng)年的搜索服務(wù)。人工智能是讓計(jì)算機(jī)學(xué)習(xí)如何像人一樣聽(tīng)、說(shuō)、讀、想,該領(lǐng)域與移動(dòng)互聯(lián)網(wǎng)時(shí)代緊密相連。大多數(shù)科技公司都已經(jīng)看到其廣闊前景,巨頭之間,人工智能的競(jìng)賽也已展開(kāi)。
Facebook在硅谷、紐約和巴黎建立了三個(gè)人工智能實(shí)驗(yàn)室。Google常年在全球搜羅人工智能方面的科學(xué)家。百度挖走了谷歌的科學(xué)家吳恩達(dá),還在硅谷建立了研究院……“但是各家不一樣,主要還是看各自的業(yè)務(wù)模式,也就是你到底用這樣的技術(shù)去做什么。”沈向洋說(shuō)道,他與百度董事長(zhǎng)李彥宏相熟,去年他們還討論過(guò)尼克.波斯特洛姆的《超級(jí)智能》里的場(chǎng)景。
百度與谷歌類(lèi)似,在人臉識(shí)別、自然語(yǔ)言處理上下功夫,以支撐搜索技術(shù)發(fā)展的需要。Facebook則希望通過(guò)人工智能挖掘社交技術(shù)的可能。而微軟花了大量精力在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)識(shí)別等人工智能的基礎(chǔ)研究上,“所有的人工智能研究都圍繞微軟未來(lái)的智能云平臺(tái)展開(kāi)。”沈向洋說(shuō)道。這是繼搜索后的又一次賽跑,好在這次,微軟至少?zèng)]有輸在起跑線(xiàn)上,北京的研發(fā)團(tuán)隊(duì)過(guò)去十幾年的技術(shù)積累,正在派上用場(chǎng)。
機(jī)器學(xué)習(xí)是讓機(jī)器具有智能的核心。過(guò)去十多年,聶再清位于北京中關(guān)村的團(tuán)隊(duì)都在主攻大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)。他的第一個(gè)項(xiàng)目叫學(xué)術(shù)搜索。那時(shí),他剛從美國(guó)大學(xué)博士畢業(yè),正愁沒(méi)有研究課題。卻發(fā)現(xiàn)自己平時(shí)苦于做論文需要尋找文獻(xiàn),于是搭建了一個(gè)可以搜索文獻(xiàn)、會(huì)議、作者、機(jī)構(gòu)及其關(guān)系的對(duì)象級(jí)別搜索引擎。
后來(lái)該團(tuán)隊(duì)把搜索對(duì)象擴(kuò)展到了互聯(lián)網(wǎng)上有公開(kāi)信息的任何一個(gè)人,就有了叫“人立方”的產(chǎn)品——這是一種關(guān)系搜索,它從超過(guò)十億的中文網(wǎng)頁(yè)中自動(dòng)抽取出人名、地名、機(jī)構(gòu)名以及中文短語(yǔ),并且通過(guò)算法自動(dòng)計(jì)算出它們之間存在關(guān)系的可能性。
“機(jī)器人智能”項(xiàng)目,實(shí)際上基于人立方的技術(shù)。這種技術(shù)最先被用到了企業(yè)內(nèi)部,一款名為企業(yè)深度智能(Enterprise Deep Intelligence,簡(jiǎn)稱(chēng)EDI)的應(yīng)用已經(jīng)預(yù)計(jì)會(huì)很快進(jìn)行產(chǎn)品化。它已在微軟亞洲研究院內(nèi)部廣泛試用,人們都在用這個(gè)應(yīng)用查詢(xún)信息、組織會(huì)議、自動(dòng)預(yù)訂會(huì)議室。
另外,EDI還可以像一個(gè)私人秘書(shū)一樣,通過(guò)Skypefor Business與用戶(hù)聊天,只要告訴“他”你的需求,“他”就幫你處理日常事務(wù)。“可以把預(yù)訂會(huì)議的郵件抄送給‘他’,或者輸入:‘EDI,請(qǐng)幫我跟這些人約一個(gè)會(huì)議’,‘他’根據(jù)你的要求和喜好,會(huì)自動(dòng)去找會(huì)議室和大家都有空的時(shí)間段。”聶再清說(shuō),“把API應(yīng)用到達(dá)美樂(lè)場(chǎng)景,就得到了訂購(gòu)Pizza的機(jī)器人。”
在沈向洋看來(lái),這是微軟的下一步:“我們認(rèn)為未來(lái)智能助理(Intelligent Agent),可能會(huì)是一個(gè)新入口,無(wú)論是Android還是WindowsPhone都行得通,微軟就可以和所有的公司合作。”看上去此類(lèi)需求無(wú)處不在。“很多想法從平時(shí)的閱讀和學(xué)術(shù)文章中來(lái),但有些時(shí)候,是自己真的發(fā)現(xiàn)了需求。”微軟亞洲研究院主管研究員閆峻說(shuō)。近幾年,他一直在負(fù)責(zé)一支5個(gè)研究員組成的知識(shí)挖掘團(tuán)隊(duì)。
去年,閆峻在北京一家醫(yī)院接受了一個(gè)外科手術(shù)。他了解到,一個(gè)普通外科醫(yī)生一天可能進(jìn)行10例手術(shù),醫(yī)生資源不夠用,無(wú)法解答每個(gè)康復(fù)期病人的困惑。這激發(fā)他進(jìn)行一項(xiàng)基于知識(shí)挖掘的醫(yī)療項(xiàng)目,以解決醫(yī)院生產(chǎn)力的問(wèn)題。他選擇在北京和沈陽(yáng)的醫(yī)院進(jìn)行試點(diǎn),并同時(shí)與產(chǎn)品部門(mén)保持密切聯(lián)系,讓后者及時(shí)得到用戶(hù)需求的趨勢(shì)。
理想的模型是,醫(yī)院里有一個(gè)機(jī)器人,或者是存在于病患手機(jī)中的一個(gè)App中,病患的所有問(wèn)題都能通過(guò)這個(gè)機(jī)器人得到回復(fù)。去年年底開(kāi)始,閆峻通過(guò)讓機(jī)器模擬人類(lèi)學(xué)習(xí)的四個(gè)階段來(lái)獲取這些專(zhuān)業(yè)知識(shí)。閆峻介紹稱(chēng),即使在最簡(jiǎn)單的第一階段,也需要運(yùn)用到知識(shí)挖掘的技術(shù)——在這個(gè)階段,機(jī)器可以從一些網(wǎng)頁(yè)上抓取疾病可能存在的癥狀,然后捕捉那些在論壇上活躍醫(yī)生的問(wèn)答。
據(jù)閆峻團(tuán)隊(duì)統(tǒng)計(jì),一個(gè)外科醫(yī)生一年之內(nèi),能在不同論壇里回答幾十到幾千個(gè)問(wèn)題。而網(wǎng)絡(luò)針對(duì)同一疾病可能有幾萬(wàn)個(gè)不同問(wèn)題,最后通過(guò)機(jī)器的知識(shí)挖掘,可以總結(jié)出用戶(hù)實(shí)際上在問(wèn)的最本質(zhì)的問(wèn)題,針對(duì)一個(gè)疾病這樣的問(wèn)題可能只有80多個(gè)。
閆峻
除了機(jī)器學(xué)習(xí)和知識(shí)挖掘之外,沈向洋鼓勵(lì)亞洲研究院的中國(guó)研究員們?cè)谏疃壬窠?jīng)網(wǎng)絡(luò)研究領(lǐng)域投入力量。這個(gè)領(lǐng)域的研究屬于人工智能深度學(xué)習(xí)。“這個(gè)領(lǐng)域的意義在于,幾年內(nèi),計(jì)算機(jī)在感知上的能力就會(huì)超越人類(lèi)。再過(guò)5到10年,圖像識(shí)別上計(jì)算機(jī)就可以比人類(lèi)更厲害。到時(shí)候,當(dāng)識(shí)別這是個(gè)什么瓶子、是哪個(gè)牌子的瓶子時(shí),人工智能就能比人更清楚。”沈向洋說(shuō)。
人工智能要達(dá)到這樣的能力,還有很遠(yuǎn)的路要走。沈向洋明白,如果“人工智能”之父阿蘭.圖靈活到今天,可能會(huì)對(duì)人工智能過(guò)去60年的發(fā)展感到失望——即便是最近獲得極大關(guān)注的Alpha Go,它可以在圍棋上取勝,卻玩不了高級(jí)撲克,因?yàn)樗€看不懂人類(lèi)的虛張聲勢(shì)。不過(guò),對(duì)沈向洋的團(tuán)隊(duì)而言,這倒也是機(jī)會(huì),畢竟,至少現(xiàn)在他們的人工智能技術(shù)可以用來(lái)叫Pizza外賣(mài)了。
評(píng)論