五年前,是什么讓李彥宏相信了AI?
大部分人的思考習慣,是看到一個東西成功了,就感嘆成功者的運氣。卻很少人愿意去回溯,到底一件事從想法到現(xiàn)實,經(jīng)歷了怎么樣的思考和判斷,以及自我完善的過程。
本文引用地址:http://m.butianyuan.cn/article/201808/390842.htm把時間倒回過去來思考,其實是件很有意思的事情。比如今天我們已經(jīng)知道押注AI,可以說是百度做的最正確選擇之一。如今AI已經(jīng)和百度融為一體,甚至成為中國科技界的一張名片,這都應該沒有什么人反對。
而與廣大科技企業(yè)近兩年突然轉(zhuǎn)型AI不同,李彥宏和百度早早就選擇了相信AI,甚至很早就判斷清楚了AI即將在哪些具體領(lǐng)域爆發(fā)。
比如2013年的時候,李彥宏表示“語音技術(shù)會根本性地改變?nèi)藗兪褂没ヂ?lián)網(wǎng)和手機的方式”;同年,他還認為“人機對話的問題,最近幾年會很快進入實用階段?!痹?014年,他又提出“5年后語音搜索會超文字搜索”,隨后2015年百度推出了度秘。
顯而易見,今天來看這些判斷都實現(xiàn)了。但在五年前,似乎還沒有多少人關(guān)注智能語音交互。這里我們可以做個有意思的游戲:回到五年前李彥宏的視角,看看有哪些因素讓他選擇相信AI。尤其是相信AI能夠帶來商業(yè)價值,并判斷AI將以何種形態(tài)帶來商業(yè)價值。
不難看出,當時的李彥宏,至少可以發(fā)現(xiàn)智能語音正在改變?nèi)隆?/p>
一、效率
2013-2015,是中文語音識別率快速攀升的三年。這一段時間里AI的中文語音識別成功率,成功超過了人類語言交互效率。另一方面,NLP和語義理解技術(shù)開始因深度學習而成熟,AI能夠“聽懂”人類,出現(xiàn)了可能性。
這樣的技術(shù)指數(shù),雖然對于普通人來說在當時并不意味著什么,但就產(chǎn)業(yè)發(fā)展趨勢而言,意味著三件事必然在未來發(fā)生:
1、鍵盤可以被取代。打字輸入固然也很方便,但其存在的核心價值在于效率。在語音識別率大幅攀升,可以彈性識別人類語言的情況下,鍵盤輸入的必要性也將受到挑戰(zhàn)。尤其在手機端,語音輸入優(yōu)勢空前。
2、按鈕將逐漸被取代。生活、生產(chǎn)中有無數(shù)的按鈕,這些按鈕存在的價值是因為人需要操縱某個機器,比如說電視遙控器。但在語音識別與語句理解能力攀升后,按鈕的地位可以被動搖。當然從而產(chǎn)生的經(jīng)濟價值也是難以估量的。
3、冗務被替代。今天社會中的很多工作,無非就是聽、記錄和反饋。尤其其中相當大一部分是效率低下的冗務,在AI識別說話的準確度達標后,大量類似工作將被取代,人類獲取服務的效率將大幅提升。
這些互聯(lián)網(wǎng)生活中的基礎(chǔ)效率改變,意味著巨大的市場調(diào)節(jié)和生產(chǎn)力升級。智能語音交互作為這一切的基礎(chǔ),其根基來自于技術(shù)升級。這對于技術(shù)立身的百度來說是比其他風口更好的機會。去年李彥宏談論AI時提出AI時代更適合百度這樣的技術(shù)公司,他認為“僅僅兩年的時間,大家就知道了深度學習,算法在迅速地發(fā)生變化。外界既然都認識到了AI的重要性,那么對于百度來說,成功的機會自然變大”。
AI的技術(shù)積累來自百度更早的投入,而在此之前,則是企業(yè)家對于“技術(shù)到底能換取什么價值”這件事的預判,這或許也是DuerOS最初的思考邏輯。
二、“搜索-答案”的關(guān)系
百度的核心業(yè)務是搜索,那么在上述邏輯中,智能語音帶來輸入效率提升和長句理解能力后,搜索業(yè)務勢必面臨巨大的迭代。這或許帶給思考“搜索的未來”的李彥宏,另一種可能的發(fā)展方向。加上一門叫做知識圖譜的AI技術(shù),已經(jīng)開始廣泛投入應用,搜索的變革也就自然而然孕育在了AI之中。
智能語音的進場,最直接的改變是用戶從習慣于搜索關(guān)鍵詞,開始向習慣于輸入大容量語句,也就是向搜索引擎進行提問過渡。那么隨之而來的,也就是用戶期待的不僅是帶有關(guān)鍵詞的搜索結(jié)果和百科,還有對問題的解答,甚至對問題的再提問。
所謂搜索,核心價值是連接了人與信息,但信息不僅是關(guān)鍵詞,更多時候信息隱藏在問題背后。這樣的搜索習慣必須以用戶能夠提出復雜問題為開始,而智能語音正好帶給用戶以培養(yǎng)提問習慣的機會。
此外,用語言對事物進行描述,更符合人類習慣。進行抽象的、非關(guān)鍵詞的搜索服務,也難以離開語音交互的支持。
而從問答式搜索去到更遠一點的地方,很多時候我們需要的甚至不僅是答案,而是建議,甚至是反問和辯論。這樣的搜索效果有可能實現(xiàn)嗎?假如可以的話,核心當然需要更智能的系統(tǒng)。但高度純熟的自然語言理解與自然語言處理,帶來人機對話的完整性,當然是另一項基礎(chǔ)工程。
按照搜索的進化來思考,我們很容易發(fā)現(xiàn)搜索業(yè)務是離不開語音交互的。那么智能語音為什么對百度如此重要,當然也就不難理解了。用李彥宏自己的說法,在移動互聯(lián)網(wǎng)普及之后,“要么think AI,要么 say goodbye”。
三、人機關(guān)系
更大的機會,在于人機關(guān)系正在因為“人機對話”模式的到來而改變,這也是李彥宏早在幾年前就做出的判斷。AI可以讓人類與系統(tǒng)交談,系統(tǒng)的理解可以轉(zhuǎn)化為命令,命令是機器執(zhí)行的根源——那么人機交互必須以手觸發(fā)的現(xiàn)狀,也就很可能成為歷史。
我們很難低估以語音操控機器的潛力。在最普通的家居環(huán)境中,有個說法是你不換智能家居的時候不會多想它,可一旦換了就再也回不了頭。這是因為操作的簡便性和準確度來說,語言遠遠超過一個個開關(guān)。尤其是能夠在空間中行使命令,這是天然更符合人性的人機交互方式。
家居之外,人機交互的價值迭代還發(fā)生在近乎每一個生活中的核心場景:工廠中很多工作可以由工人指揮機器完成,帶來巨大的效率提升;辦公場景里語音交互可以升級為助手,取代海量的協(xié)同工作;駕駛場景中,如果能說話控制方向盤以外的一切,那么對使用體驗是巨大的解放,更遑論無人駕駛場景里,人機交互只能靠語音來完成。
在語音識別和理解能力成熟后,這些市場自然會顯現(xiàn)出價值。這對當時的百度來說是一個巨大的機會。于是我們看到了百度并沒有慌忙搶占音箱風口,而是搭建底層平臺,逐步完善對人機交互種類的覆蓋。這是因為在百度的優(yōu)勢中,設備不是核心,技術(shù)帶來的人機關(guān)系改變才是。
結(jié)論
退回到五年前,我們站在李彥宏的視角中可以發(fā)現(xiàn)有三個準確出現(xiàn)的現(xiàn)象:智能語音技術(shù)正在成熟、智能語音對于百度的核心業(yè)務影響巨大、語音交互背后隱藏著巨大的新市場。這三件事支撐百度準確找到了AI時代的核心方向。今天DuerOS連接的設備已經(jīng)過億,智能語音也成為了核心基礎(chǔ)技術(shù)。
但或許我們應該問的是:智能語音已經(jīng)來到頂峰了嗎?退回去看百度與李彥宏當年的判斷,或許答案應該是:還沒有。
無論是搜索、信息流、內(nèi)容,還是人機協(xié)作與泛社會應用,智能語音在今天只是打開了市場,搭建了更牢靠的基礎(chǔ)。語言的魔力與紅利,都還沒有完整來到商業(yè)世界。百度的對話式AI之戰(zhàn),可能也還要跨過更遠的山梁。
同時我們也可以發(fā)現(xiàn),計算機視覺在這兩年也正在爆發(fā)。而李彥宏恰好在2016年曾預言過,計算機視覺將是無人駕駛的最后一公里。因此我們也可以判斷,在Apollo平臺的搭建中,計算機視覺將成為其中的重要部分。而種種跡象表明,這一預測或許不再需要另一個5年,正在快速向我們駛來。
退回原點,往往可以看到更多。在我們今天猜測AI未來的時候,這個方法或許格外有用。今天,又有哪些技術(shù)原點,可以幫我們透視未來呢?
評論