五年前,是什么讓李彥宏相信了AI?
大部分人的思考習(xí)慣,是看到一個(gè)東西成功了,就感嘆成功者的運(yùn)氣。卻很少人愿意去回溯,到底一件事從想法到現(xiàn)實(shí),經(jīng)歷了怎么樣的思考和判斷,以及自我完善的過程。
本文引用地址:http://m.butianyuan.cn/article/201808/390842.htm把時(shí)間倒回過去來思考,其實(shí)是件很有意思的事情。比如今天我們已經(jīng)知道押注AI,可以說是百度做的最正確選擇之一。如今AI已經(jīng)和百度融為一體,甚至成為中國(guó)科技界的一張名片,這都應(yīng)該沒有什么人反對(duì)。
而與廣大科技企業(yè)近兩年突然轉(zhuǎn)型AI不同,李彥宏和百度早早就選擇了相信AI,甚至很早就判斷清楚了AI即將在哪些具體領(lǐng)域爆發(fā)。
比如2013年的時(shí)候,李彥宏表示“語音技術(shù)會(huì)根本性地改變?nèi)藗兪褂没ヂ?lián)網(wǎng)和手機(jī)的方式”;同年,他還認(rèn)為“人機(jī)對(duì)話的問題,最近幾年會(huì)很快進(jìn)入實(shí)用階段。”在2014年,他又提出“5年后語音搜索會(huì)超文字搜索”,隨后2015年百度推出了度秘。
顯而易見,今天來看這些判斷都實(shí)現(xiàn)了。但在五年前,似乎還沒有多少人關(guān)注智能語音交互。這里我們可以做個(gè)有意思的游戲:回到五年前李彥宏的視角,看看有哪些因素讓他選擇相信AI。尤其是相信AI能夠帶來商業(yè)價(jià)值,并判斷AI將以何種形態(tài)帶來商業(yè)價(jià)值。
不難看出,當(dāng)時(shí)的李彥宏,至少可以發(fā)現(xiàn)智能語音正在改變?nèi)隆?/p>
一、效率
2013-2015,是中文語音識(shí)別率快速攀升的三年。這一段時(shí)間里AI的中文語音識(shí)別成功率,成功超過了人類語言交互效率。另一方面,NLP和語義理解技術(shù)開始因深度學(xué)習(xí)而成熟,AI能夠“聽懂”人類,出現(xiàn)了可能性。
這樣的技術(shù)指數(shù),雖然對(duì)于普通人來說在當(dāng)時(shí)并不意味著什么,但就產(chǎn)業(yè)發(fā)展趨勢(shì)而言,意味著三件事必然在未來發(fā)生:
1、鍵盤可以被取代。打字輸入固然也很方便,但其存在的核心價(jià)值在于效率。在語音識(shí)別率大幅攀升,可以彈性識(shí)別人類語言的情況下,鍵盤輸入的必要性也將受到挑戰(zhàn)。尤其在手機(jī)端,語音輸入優(yōu)勢(shì)空前。
2、按鈕將逐漸被取代。生活、生產(chǎn)中有無數(shù)的按鈕,這些按鈕存在的價(jià)值是因?yàn)槿诵枰倏v某個(gè)機(jī)器,比如說電視遙控器。但在語音識(shí)別與語句理解能力攀升后,按鈕的地位可以被動(dòng)搖。當(dāng)然從而產(chǎn)生的經(jīng)濟(jì)價(jià)值也是難以估量的。
3、冗務(wù)被替代。今天社會(huì)中的很多工作,無非就是聽、記錄和反饋。尤其其中相當(dāng)大一部分是效率低下的冗務(wù),在AI識(shí)別說話的準(zhǔn)確度達(dá)標(biāo)后,大量類似工作將被取代,人類獲取服務(wù)的效率將大幅提升。
這些互聯(lián)網(wǎng)生活中的基礎(chǔ)效率改變,意味著巨大的市場(chǎng)調(diào)節(jié)和生產(chǎn)力升級(jí)。智能語音交互作為這一切的基礎(chǔ),其根基來自于技術(shù)升級(jí)。這對(duì)于技術(shù)立身的百度來說是比其他風(fēng)口更好的機(jī)會(huì)。去年李彥宏談?wù)揂I時(shí)提出AI時(shí)代更適合百度這樣的技術(shù)公司,他認(rèn)為“僅僅兩年的時(shí)間,大家就知道了深度學(xué)習(xí),算法在迅速地發(fā)生變化。外界既然都認(rèn)識(shí)到了AI的重要性,那么對(duì)于百度來說,成功的機(jī)會(huì)自然變大”。
AI的技術(shù)積累來自百度更早的投入,而在此之前,則是企業(yè)家對(duì)于“技術(shù)到底能換取什么價(jià)值”這件事的預(yù)判,這或許也是DuerOS最初的思考邏輯。
二、“搜索-答案”的關(guān)系
百度的核心業(yè)務(wù)是搜索,那么在上述邏輯中,智能語音帶來輸入效率提升和長(zhǎng)句理解能力后,搜索業(yè)務(wù)勢(shì)必面臨巨大的迭代。這或許帶給思考“搜索的未來”的李彥宏,另一種可能的發(fā)展方向。加上一門叫做知識(shí)圖譜的AI技術(shù),已經(jīng)開始廣泛投入應(yīng)用,搜索的變革也就自然而然孕育在了AI之中。
智能語音的進(jìn)場(chǎng),最直接的改變是用戶從習(xí)慣于搜索關(guān)鍵詞,開始向習(xí)慣于輸入大容量語句,也就是向搜索引擎進(jìn)行提問過渡。那么隨之而來的,也就是用戶期待的不僅是帶有關(guān)鍵詞的搜索結(jié)果和百科,還有對(duì)問題的解答,甚至對(duì)問題的再提問。
所謂搜索,核心價(jià)值是連接了人與信息,但信息不僅是關(guān)鍵詞,更多時(shí)候信息隱藏在問題背后。這樣的搜索習(xí)慣必須以用戶能夠提出復(fù)雜問題為開始,而智能語音正好帶給用戶以培養(yǎng)提問習(xí)慣的機(jī)會(huì)。
此外,用語言對(duì)事物進(jìn)行描述,更符合人類習(xí)慣。進(jìn)行抽象的、非關(guān)鍵詞的搜索服務(wù),也難以離開語音交互的支持。
而從問答式搜索去到更遠(yuǎn)一點(diǎn)的地方,很多時(shí)候我們需要的甚至不僅是答案,而是建議,甚至是反問和辯論。這樣的搜索效果有可能實(shí)現(xiàn)嗎?假如可以的話,核心當(dāng)然需要更智能的系統(tǒng)。但高度純熟的自然語言理解與自然語言處理,帶來人機(jī)對(duì)話的完整性,當(dāng)然是另一項(xiàng)基礎(chǔ)工程。
按照搜索的進(jìn)化來思考,我們很容易發(fā)現(xiàn)搜索業(yè)務(wù)是離不開語音交互的。那么智能語音為什么對(duì)百度如此重要,當(dāng)然也就不難理解了。用李彥宏自己的說法,在移動(dòng)互聯(lián)網(wǎng)普及之后,“要么think AI,要么 say goodbye”。
三、人機(jī)關(guān)系
更大的機(jī)會(huì),在于人機(jī)關(guān)系正在因?yàn)椤叭藱C(jī)對(duì)話”模式的到來而改變,這也是李彥宏早在幾年前就做出的判斷。AI可以讓人類與系統(tǒng)交談,系統(tǒng)的理解可以轉(zhuǎn)化為命令,命令是機(jī)器執(zhí)行的根源——那么人機(jī)交互必須以手觸發(fā)的現(xiàn)狀,也就很可能成為歷史。
我們很難低估以語音操控機(jī)器的潛力。在最普通的家居環(huán)境中,有個(gè)說法是你不換智能家居的時(shí)候不會(huì)多想它,可一旦換了就再也回不了頭。這是因?yàn)椴僮鞯暮?jiǎn)便性和準(zhǔn)確度來說,語言遠(yuǎn)遠(yuǎn)超過一個(gè)個(gè)開關(guān)。尤其是能夠在空間中行使命令,這是天然更符合人性的人機(jī)交互方式。
家居之外,人機(jī)交互的價(jià)值迭代還發(fā)生在近乎每一個(gè)生活中的核心場(chǎng)景:工廠中很多工作可以由工人指揮機(jī)器完成,帶來巨大的效率提升;辦公場(chǎng)景里語音交互可以升級(jí)為助手,取代海量的協(xié)同工作;駕駛場(chǎng)景中,如果能說話控制方向盤以外的一切,那么對(duì)使用體驗(yàn)是巨大的解放,更遑論無人駕駛場(chǎng)景里,人機(jī)交互只能靠語音來完成。
在語音識(shí)別和理解能力成熟后,這些市場(chǎng)自然會(huì)顯現(xiàn)出價(jià)值。這對(duì)當(dāng)時(shí)的百度來說是一個(gè)巨大的機(jī)會(huì)。于是我們看到了百度并沒有慌忙搶占音箱風(fēng)口,而是搭建底層平臺(tái),逐步完善對(duì)人機(jī)交互種類的覆蓋。這是因?yàn)樵诎俣鹊膬?yōu)勢(shì)中,設(shè)備不是核心,技術(shù)帶來的人機(jī)關(guān)系改變才是。
結(jié)論
退回到五年前,我們站在李彥宏的視角中可以發(fā)現(xiàn)有三個(gè)準(zhǔn)確出現(xiàn)的現(xiàn)象:智能語音技術(shù)正在成熟、智能語音對(duì)于百度的核心業(yè)務(wù)影響巨大、語音交互背后隱藏著巨大的新市場(chǎng)。這三件事支撐百度準(zhǔn)確找到了AI時(shí)代的核心方向。今天DuerOS連接的設(shè)備已經(jīng)過億,智能語音也成為了核心基礎(chǔ)技術(shù)。
但或許我們應(yīng)該問的是:智能語音已經(jīng)來到頂峰了嗎?退回去看百度與李彥宏當(dāng)年的判斷,或許答案應(yīng)該是:還沒有。
無論是搜索、信息流、內(nèi)容,還是人機(jī)協(xié)作與泛社會(huì)應(yīng)用,智能語音在今天只是打開了市場(chǎng),搭建了更牢靠的基礎(chǔ)。語言的魔力與紅利,都還沒有完整來到商業(yè)世界。百度的對(duì)話式AI之戰(zhàn),可能也還要跨過更遠(yuǎn)的山梁。
同時(shí)我們也可以發(fā)現(xiàn),計(jì)算機(jī)視覺在這兩年也正在爆發(fā)。而李彥宏恰好在2016年曾預(yù)言過,計(jì)算機(jī)視覺將是無人駕駛的最后一公里。因此我們也可以判斷,在Apollo平臺(tái)的搭建中,計(jì)算機(jī)視覺將成為其中的重要部分。而種種跡象表明,這一預(yù)測(cè)或許不再需要另一個(gè)5年,正在快速向我們駛來。
退回原點(diǎn),往往可以看到更多。在我們今天猜測(cè)AI未來的時(shí)候,這個(gè)方法或許格外有用。今天,又有哪些技術(shù)原點(diǎn),可以幫我們透視未來呢?
評(píng)論