新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 亞馬遜領先蘋果、谷歌站上語音識別風口 怎么做到的?

亞馬遜領先蘋果、谷歌站上語音識別風口 怎么做到的?

作者: 時間:2016-08-17 來源:企鵝智酷 收藏
編者按:高速發(fā)展之后,智能手機和它所帶動的相關產(chǎn)業(yè)都陷入了發(fā)展瓶頸,人工智能被認為是下一個科技熱潮,而語音識別也會趁著這個風口飛起來。

  三、定位于家庭,緩解與機器對話的尷尬

本文引用地址:http://m.butianyuan.cn/article/201608/295601.htm

  只提供語音交互并非Echo成功的唯一因素。如果沒有解決用戶不愿使用語音的根本問題,這樣做可能會帶來另一個問題——用戶放棄使用產(chǎn)品。顯然不愿看到這樣的結果。

  Echo成功的另一因素在于它定位于家居,而非手個人助理。

  Siri和Google Now定位于個人助理,于是它們依附于手機,期待通過手機的高頻使用普及服務。但手機作為個人設備,多數(shù)情況下在公開場合下使用。在公開場合下用語音對手機發(fā)號施令,使用者很容易陷入尷尬。

  Creative Strategies調(diào)查了300名手機用戶在公開場合下使用語音助手的比例。結果顯示,安卓用戶中,只有12%會在公開場合下使用語音助手;iPhone的比例更低,只有3%。

  產(chǎn)品和使用場景沒有恰當匹配,造成了Siri和Google Now的使用尷尬。

  Echo采用了不同的產(chǎn)品定位,巧妙地避開了用戶使用語音助手的尷尬。它從一開始就定位于家庭設備——體積較大,不宜隨身攜帶;沒有獨立電池,必須連接室內(nèi)電源才能使用。盡管對著機器說話依舊怪異,但家庭環(huán)境緩解了用戶的使用壓力。用戶面對的是熟悉的家人而非公共環(huán)境下的陌生人。

  四、提供針對性軟、硬件優(yōu)化,適時開放產(chǎn)品

  在明確Echo的交互方式和產(chǎn)品定位之后,對它進行了針對性的硬件和軟件優(yōu)化。

  為了能讓用戶在家中的任何位置都能喚醒Echo,設計了一個名為ARS的自動處理系統(tǒng)。ARS由七個麥克風和一個音頻信號過濾系統(tǒng)構成。七個麥克風組成的列陣能讓Echo捕捉到環(huán)境中的細微聲音,音頻信號過濾系統(tǒng)過濾掉環(huán)境噪音,從而辨別出人聲。使用ARS后,即使用戶在25英尺(7.62米)之外發(fā)出命令,Echo也能夠準確識別。


亞馬遜領先蘋果、谷歌站上語音識別風口 怎么做到的?


  (Echo的麥克風陣列)

  識別之后,如何理解用戶的語音命令?亞馬遜又設計了“關鍵詞識別”系統(tǒng)。Echo收到的語音命令被系統(tǒng)拆分為多個字段,它們與云端儲存的關鍵詞模型逐一比對,匹配度最高的部分被認為是用戶發(fā)出的語音命令。

  在先后增加對多款智能家電的支持之后,2015年6月,亞馬遜推出了語音服務“Alexa”開發(fā)包,正式開放Echo。兩家為Echo開發(fā)音樂播放和家電控制服務的公司還獲得了亞馬遜提供的1億美元資金。

  開放策略收效顯著。2015年,Echo整合的第三方服務只有14項,今年已經(jīng)上升至950項。目前這個數(shù)字在持續(xù)增長。

  今年3月,亞馬遜又推出了兩款面向中、低端市場的智能音箱:Tap和Dot。Echo家族的設備和服務在不斷壯大。



關鍵詞: 亞馬遜 語音識別

評論


相關推薦

技術專區(qū)

關閉