新聞中心

EEPW首頁(yè) > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 國(guó)內(nèi)外語(yǔ)音識(shí)別行業(yè)現(xiàn)狀

國(guó)內(nèi)外語(yǔ)音識(shí)別行業(yè)現(xiàn)狀

作者: 時(shí)間:2016-08-23 來(lái)源:C114 收藏
編者按:隨著高速發(fā)展之后,智能手機(jī)和它所帶動(dòng)的相關(guān)產(chǎn)業(yè)都陷入了發(fā)展瓶頸,機(jī)器學(xué)習(xí)和人工智能被認(rèn)為是下一個(gè)科技熱潮,而語(yǔ)音識(shí)別也會(huì)趁著這個(gè)風(fēng)口飛起來(lái),國(guó)內(nèi)語(yǔ)音行業(yè)也可謂是百花齊放,尤其是最近幾年,不僅涌現(xiàn)了很多國(guó)內(nèi)外的小公司,而且巨頭們也開(kāi)始加速語(yǔ)音識(shí)別行業(yè)的布局。

  本文就詳細(xì)盤(pán)點(diǎn)一番國(guó)內(nèi)外的大型公司,并對(duì)他們掌握的技術(shù)進(jìn)行分析,同時(shí)預(yù)測(cè)一下未來(lái)的趨勢(shì),期望帶給行業(yè)內(nèi)外的專業(yè)人士些許參考,借此更進(jìn)一步推進(jìn)整個(gè)行業(yè)的發(fā)展。

本文引用地址:http://m.butianyuan.cn/article/201608/295872.htm

  1、國(guó)外行業(yè)收購(gòu)盤(pán)點(diǎn)和技術(shù)分析

  傳統(tǒng)行業(yè)貴族Nuance逐漸沒(méi)落

  任何時(shí)候提到語(yǔ)音識(shí)別,都不能避過(guò)Nuance這家公司,這家公司曾經(jīng)在語(yǔ)音領(lǐng)域一統(tǒng)江湖,世界上有超過(guò)80%的語(yǔ)音識(shí)別都用過(guò)Nuance識(shí)別引擎技術(shù),其語(yǔ)音產(chǎn)品可以支持超過(guò)50種語(yǔ)言,在全球擁有超過(guò)20億用戶,幾乎壟斷了金融和電信行業(yè)。就算現(xiàn)在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語(yǔ)音技術(shù)公司,掌握著全球最多的語(yǔ)音技術(shù)專利。蘋(píng)果語(yǔ)音助手Siri、三星語(yǔ)音助手S-Voice、各大航空公司和頂級(jí)銀行的自動(dòng)呼叫中心,剛開(kāi)始都是采用他們的語(yǔ)音識(shí)別引擎技術(shù)。Nuance已經(jīng)登陸了納斯達(dá)克,三星、蘋(píng)果和百度都和它傳過(guò)緋聞,傳言多次收購(gòu),但是全都無(wú)疾而終。

  事實(shí)上,Nuance有點(diǎn)過(guò)于自大了,語(yǔ)音技術(shù)即便冠絕全球,但是在具體應(yīng)用上,差距就沒(méi)有那么大了。語(yǔ)音識(shí)別技術(shù)并非高不可攀,實(shí)際上一款用戶體驗(yàn)較好的語(yǔ)音識(shí)別系統(tǒng),很大程度上依靠數(shù)據(jù)和經(jīng)驗(yàn),專利和算法什么的并沒(méi)有那么重要。聰明人自然很多,所以巨頭們只需考慮挖到專業(yè)人士或者收購(gòu)初創(chuàng)公司,自主研發(fā)出不遜于Nuance的語(yǔ)音識(shí)別技術(shù)也不是太難的事情,又何必花費(fèi)巨資看Nuance臉色呢。

  蘋(píng)果收購(gòu)Siri、Novauris Technologies、VocallQ和Emotient

  蘋(píng)果的Siri已經(jīng)鼎鼎大名了,也算世界上語(yǔ)音識(shí)別的執(zhí)牛耳者。Siri并不是蘋(píng)果自己研發(fā)的技術(shù),而是2010年蘋(píng)果收購(gòu)SiriInc.公司的產(chǎn)品,2011年蘋(píng)果將該技術(shù)融入到iPhone4S中并發(fā)布了Siri語(yǔ)音助理。SiriInc.這家公司成立于2007年,原本核心技術(shù)是CALO人工智能項(xiàng)目。當(dāng)然Siri剛開(kāi)始發(fā)布的時(shí)候語(yǔ)音識(shí)別的體驗(yàn)還很差,眾多果粉也是四處吐槽。因此2013年蘋(píng)果又收購(gòu)了語(yǔ)音識(shí)別公司Novauris Technologies。Novauris是一種可識(shí)別整個(gè)短語(yǔ)的語(yǔ)音識(shí)別技術(shù),這種技術(shù)并非簡(jiǎn)單識(shí)別單個(gè)詞句,而是試圖利用超過(guò)2.45億個(gè)短語(yǔ)的識(shí)別輔助理解上下文,當(dāng)然這是很有難度的一件事情。不管怎樣,這次收購(gòu)也讓蘋(píng)果進(jìn)一步完善了Siri的功能。



  但是這還是不夠,因此2015年蘋(píng)果又收購(gòu)了英國(guó)語(yǔ)音技術(shù)初創(chuàng)公司VocalIQ。VocalIQ開(kāi)發(fā)的人工智能軟件,能夠幫助計(jì)算機(jī)與用戶進(jìn)行更為自然的對(duì)話。VocalIQ使用機(jī)器學(xué)習(xí)(machine learning)開(kāi)發(fā)虛擬助手,將語(yǔ)音處理和機(jī)器學(xué)習(xí)技術(shù)整合到可穿戴設(shè)備、家庭聯(lián)網(wǎng)設(shè)備當(dāng)中的同時(shí),這家公司還特別關(guān)注車載應(yīng)用的開(kāi)發(fā)。這次收購(gòu)也證實(shí)了蘋(píng)果將來(lái)邁入汽車領(lǐng)域的決心。Siri應(yīng)該是通用語(yǔ)音識(shí)別領(lǐng)域用戶體驗(yàn)當(dāng)前較好的產(chǎn)品,特別是在兒童語(yǔ)音識(shí)別領(lǐng)域,這也得益于蘋(píng)果極易上手的特性吸引了眾多小朋友,也包括筆者家里的小朋友。

  當(dāng)然,Siri還是距離我們的實(shí)際應(yīng)用需求還差很遠(yuǎn),因此蘋(píng)果最近又收購(gòu)了美國(guó)圣地牙哥AI技術(shù)公司Emotient,接收其臉部表情分析與情緒辨別技術(shù)。據(jù)悉,Emotient開(kāi)發(fā)的情緒引擎可讀取人們的面部表情并且預(yù)測(cè)其情緒狀態(tài)。


上一頁(yè) 1 2 3 4 5 6 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉