便宜芯片與簡單AI，Google 打造拋棄式語音識別產(chǎn)品

作者：時間：2017-09-27 來源：TechNews

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　Google工程師PeteWarden在英國ARM研究高峰論壇表示，他希望打造超便宜的語音識別產(chǎn)品，搭載只要50美分的超低價芯片，一個硬幣大小的電池，足以維持一年的電力，再搭配簡單的人工智能算法，就可以讓語音識別產(chǎn)品快速普及。

本文引用地址：http://m.butianyuan.cn/article/201709/364928.htm

　　麻省理工科技評論(MITTechnologyReview)報導(dǎo)，這種超便宜的語音識別芯片可用來生產(chǎn)便宜的對話玩偶，或是簡單的家用電器，如可被語音驅(qū)動的燈。在工業(yè)環(huán)境應(yīng)用，這種芯片可辨識不尋常的聲響，或是農(nóng)田里的蟋蟀。

　　Warden為Google的云端人工智能工具開發(fā)行動和嵌入式應(yīng)用，稱為TensorFlow，他在開發(fā)過程中發(fā)現(xiàn)亞馬遜的AI助手Alexa透過電池供電的簡單芯片運作，頻率只有幾百兆赫是不夠的，原因是Alexa必須辨識許多不同的聲音，而且因為大多數(shù)語音識別AI工具使用的神經(jīng)網(wǎng)絡(luò)資源匱乏，這就是為什么Alexa必須將處理任務(wù)交給云端的原因。

　　為改善上述問題，Warden限制問題的問法，譬如只能使用開、關(guān)、啟動、停止等字眼，并舍棄一般語音識別算法，他拿一個音頻將其切成短片段，然后計算每個片段的頻率內(nèi)容，接著一個接一個排列每個頻率圖，以建立一個頻率內(nèi)容與時間的二維圖像，并應(yīng)用視覺辨識算法來辨識單詞的獨特記號。

　　第一次嘗試分析音頻的1秒鐘片段需要800萬次計算，準(zhǔn)確度為89%，這可用現(xiàn)代智能手機運作，并且互動速度也夠快，這種方式比將運算過程送到云端更好，但是在低功耗芯片上性能不佳。

　　后來開發(fā)團隊借鑒一些幫助Android手機辨識短語的算法技巧后，系統(tǒng)只需執(zhí)行75萬次計算，就能達(dá)到85%的分析準(zhǔn)確率，研究團隊已經(jīng)在TensorFlow網(wǎng)站發(fā)表代碼供他人使用，他們打算應(yīng)用在類似單芯片微控制器Arduino搭載的更小芯片。

　　但英國劍橋大學(xué)前AI研究員TonyRobinson認(rèn)為，低成本策略可能可以幫助語音識別產(chǎn)品普及，不過用戶不太可能按表操課，大多數(shù)人沒有耐心使用高度限制性的指令，認(rèn)為功率稍微高一點，可以處理更多語言能力的芯片，可能更適合消費者應(yīng)用。