新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

作者: 時(shí)間:2018-04-07 來(lái)源: 極客公園 收藏

  更加自然的全雙工語(yǔ)音交互感官

本文引用地址:http://m.butianyuan.cn/article/201804/377948.htm

  其實(shí)我對(duì)于此次所具備的智能家居設(shè)備控制技能、更加人性化的情感和同理心能力以及獨(dú)特的「姐姐」模式這三項(xiàng)功能并不感到意外,而真正值得關(guān)注的地方是其一次喚醒可進(jìn)行連續(xù)對(duì)話。

  要知道,目前包括智能音箱在內(nèi),絕大多數(shù)語(yǔ)音控制設(shè)備都采用了「一問(wèn)一答」的交互方式。理由也很簡(jiǎn)單,這樣的方案允許設(shè)備在技術(shù)并不足夠成熟的前提下,依舊能夠可以相對(duì)不錯(cuò)的識(shí)別準(zhǔn)確度。

  但這樣的人機(jī)交互方式所存在的不足之處在于,其并不符合人們自然的交互習(xí)慣。從某種角度上來(lái)說(shuō),即便是它在準(zhǔn)確度和回饋速度上都做到了接近完美,但可能也還是更多地停留在「工具」的層面,并非人們理想中人工智能該有的模樣。

  而對(duì)比來(lái)看,搭載了的 Yeelight 可以實(shí)現(xiàn)對(duì)話像河流一樣不間斷進(jìn)行,在語(yǔ)音交互方式上顯然要更自然一些,稱之為全雙工語(yǔ)音交互感官。

  不顧想要實(shí)現(xiàn)近乎于人與人之間的交流方式,顯然并不是一件容易的事情,在前幾天的媒體溝通會(huì)上,小冰團(tuán)隊(duì)也對(duì)這背后部分技術(shù)特征進(jìn)行了披露。

實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

 

  首先在基礎(chǔ)框架上,沒(méi)有選擇面向單個(gè)任務(wù)的的 Turn-oriented,而是采用了面向?qū)υ捜痰?Session-oriented。

  同時(shí)在實(shí)際的人機(jī)交互過(guò)程中,小冰所采用的全雙工語(yǔ)音交互技術(shù),在包括邊聽(tīng)邊想、節(jié)奏控制器、對(duì)聲音場(chǎng)景的理解以及自然語(yǔ)言理解與生成模型等多個(gè)維度上進(jìn)行了探索。

  

實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

 

  首先它建立了一套預(yù)測(cè)模型,來(lái)實(shí)現(xiàn)邊聽(tīng)邊想。簡(jiǎn)單來(lái)講,小冰會(huì)提前預(yù)測(cè)你想要表達(dá)的完整意思,從而實(shí)現(xiàn)更快的響應(yīng)速度和改口能力。同時(shí)在回答你所提出的問(wèn)題時(shí),可以實(shí)現(xiàn)動(dòng)態(tài)回應(yīng),通過(guò)有選擇的將回答分成多段,來(lái)減少你的等待時(shí)間。

  

實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

 

  另外,為了讓小冰在與人類的對(duì)話過(guò)程中可以更好的掌握時(shí)機(jī)和重要內(nèi)容,它也設(shè)置了節(jié)奏控制器。當(dāng)然,人與機(jī)器交互時(shí)需要它能夠很好的實(shí)現(xiàn)對(duì)聲音場(chǎng)景的理解。比如識(shí)別你的性別、對(duì)指令的正確識(shí)別等等。

  還有一個(gè)重要的技術(shù)特征是,小冰擁有自然語(yǔ)言理解與生成模型,從而實(shí)現(xiàn)更好的容錯(cuò)性以及基于整個(gè)對(duì)話對(duì)上下文的理解。

  

實(shí)現(xiàn)不間斷對(duì)話后,微軟小冰距離理想中的樣子又近了一步

 

  綜合來(lái)講,在語(yǔ)音交互方式上,微軟選擇了一條短時(shí)間內(nèi)可能并不容易獲得明顯效果,但上限更高的技術(shù)路徑。不難想象的是,未來(lái)隨著 Turn-oriented 框架走到極致而無(wú)法更進(jìn)一步的情況下,也會(huì)有越來(lái)越多語(yǔ)音平臺(tái)加入到這個(gè)行列中。

  但顯而易見(jiàn)的是,早先一步開(kāi)始布局 Session-oriented 框架的微軟已經(jīng)領(lǐng)先了半個(gè)身位。從長(zhǎng)遠(yuǎn)來(lái)看,其將獲得更高的收益。

  回過(guò)頭來(lái)看小冰這個(gè)平臺(tái),正如我們前邊提到的,雖然就目前而言它的整體體驗(yàn)并不那么完美,但其成長(zhǎng)上限非常高。一旦未來(lái)各方面走向成熟,這個(gè)平臺(tái)或許將最早成為我們理想中的人工智能。


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: 微軟 小冰

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉