亞馬遜領先蘋果、谷歌站上語音識別風口 怎么做到的?
三、定位于家庭,緩解與機器對話的尷尬
本文引用地址:http://m.butianyuan.cn/article/201608/295601.htm只提供語音交互并非Echo成功的唯一因素。如果沒有解決用戶不愿使用語音的根本問題,這樣做可能會帶來另一個問題——用戶放棄使用產(chǎn)品。亞馬遜顯然不愿看到這樣的結果。
Echo成功的另一因素在于它定位于家居,而非手個人助理。
Siri和Google Now定位于個人助理,于是它們依附于手機,期待通過手機的高頻使用普及服務。但手機作為個人設備,多數(shù)情況下在公開場合下使用。在公開場合下用語音對手機發(fā)號施令,使用者很容易陷入尷尬。
Creative Strategies調(diào)查了300名手機用戶在公開場合下使用語音助手的比例。結果顯示,安卓用戶中,只有12%會在公開場合下使用語音助手;iPhone的比例更低,只有3%。
產(chǎn)品和使用場景沒有恰當匹配,造成了Siri和Google Now的使用尷尬。
Echo采用了不同的產(chǎn)品定位,巧妙地避開了用戶使用語音助手的尷尬。它從一開始就定位于家庭設備——體積較大,不宜隨身攜帶;沒有獨立電池,必須連接室內(nèi)電源才能使用。盡管對著機器說話依舊怪異,但家庭環(huán)境緩解了用戶的使用壓力。用戶面對的是熟悉的家人而非公共環(huán)境下的陌生人。
四、提供針對性軟、硬件優(yōu)化,適時開放產(chǎn)品
在明確Echo的交互方式和產(chǎn)品定位之后,亞馬遜對它進行了針對性的硬件和軟件優(yōu)化。
為了能讓用戶在家中的任何位置都能喚醒Echo,亞馬遜設計了一個名為ARS的自動語音識別處理系統(tǒng)。ARS由七個麥克風和一個音頻信號過濾系統(tǒng)構成。七個麥克風組成的列陣能讓Echo捕捉到環(huán)境中的細微聲音,音頻信號過濾系統(tǒng)過濾掉環(huán)境噪音,從而辨別出人聲。使用ARS后,即使用戶在25英尺(7.62米)之外發(fā)出命令,Echo也能夠準確識別。
(Echo的麥克風陣列)
識別之后,如何理解用戶的語音命令?亞馬遜又設計了“關鍵詞識別”系統(tǒng)。Echo收到的語音命令被系統(tǒng)拆分為多個字段,它們與云端儲存的關鍵詞模型逐一比對,匹配度最高的部分被認為是用戶發(fā)出的語音命令。
在先后增加對多款智能家電的支持之后,2015年6月,亞馬遜推出了語音服務“Alexa”開發(fā)包,正式開放Echo。兩家為Echo開發(fā)音樂播放和家電控制服務的公司還獲得了亞馬遜提供的1億美元資金。
開放策略收效顯著。2015年,Echo整合的第三方服務只有14項,今年已經(jīng)上升至950項。目前這個數(shù)字在持續(xù)增長。
今年3月,亞馬遜又推出了兩款面向中、低端市場的智能音箱:Tap和Dot。Echo家族的設備和服務在不斷壯大。
評論