亞馬遜領先蘋果、谷歌站上語音識別風口怎么做到的？

作者：時間：2016-08-17 來源：企鵝智酷

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

編者按：高速發(fā)展之后，智能手機和它所帶動的相關產(chǎn)業(yè)都陷入了發(fā)展瓶頸，人工智能被認為是下一個科技熱潮，而語音識別也會趁著這個風口飛起來。

　　三、定位于家庭，緩解與機器對話的尷尬

本文引用地址：http://m.butianyuan.cn/article/201608/295601.htm

　　只提供語音交互并非Echo成功的唯一因素。如果沒有解決用戶不愿使用語音的根本問題，這樣做可能會帶來另一個問題——用戶放棄使用產(chǎn)品。亞馬遜顯然不愿看到這樣的結果。

　　Echo成功的另一因素在于它定位于家居，而非手個人助理。

　　Siri和Google Now定位于個人助理，于是它們依附于手機，期待通過手機的高頻使用普及服務。但手機作為個人設備，多數(shù)情況下在公開場合下使用。在公開場合下用語音對手機發(fā)號施令，使用者很容易陷入尷尬。

　　Creative Strategies調(diào)查了300名手機用戶在公開場合下使用語音助手的比例。結果顯示，安卓用戶中，只有12%會在公開場合下使用語音助手;iPhone的比例更低，只有3%。

　　產(chǎn)品和使用場景沒有恰當匹配，造成了Siri和Google Now的使用尷尬。

　　Echo采用了不同的產(chǎn)品定位，巧妙地避開了用戶使用語音助手的尷尬。它從一開始就定位于家庭設備——體積較大，不宜隨身攜帶;沒有獨立電池，必須連接室內(nèi)電源才能使用。盡管對著機器說話依舊怪異，但家庭環(huán)境緩解了用戶的使用壓力。用戶面對的是熟悉的家人而非公共環(huán)境下的陌生人。

　　四、提供針對性軟、硬件優(yōu)化，適時開放產(chǎn)品

　　在明確Echo的交互方式和產(chǎn)品定位之后，亞馬遜對它進行了針對性的硬件和軟件優(yōu)化。

　　為了能讓用戶在家中的任何位置都能喚醒Echo，亞馬遜設計了一個名為ARS的自動語音識別處理系統(tǒng)。ARS由七個麥克風和一個音頻信號過濾系統(tǒng)構成。七個麥克風組成的列陣能讓Echo捕捉到環(huán)境中的細微聲音，音頻信號過濾系統(tǒng)過濾掉環(huán)境噪音，從而辨別出人聲。使用ARS后，即使用戶在25英尺(7.62米)之外發(fā)出命令，Echo也能夠準確識別。