博客專欄

EEPW首頁(yè) > 博客 > 基于九齊單片機(jī)的智能音箱解決方案

基于九齊單片機(jī)的智能音箱解決方案

發(fā)布人:xinling技術(shù) 時(shí)間:2022-04-16 來(lái)源:工程師 發(fā)布文章

目前的家庭智能音箱可以實(shí)現(xiàn)語(yǔ)音定鬧鐘?人工語(yǔ)音互動(dòng)?語(yǔ)音播放音樂?查天氣?查百科?查路況等功能,鏈接網(wǎng)絡(luò)后可實(shí)現(xiàn)了解未來(lái)天氣、上網(wǎng)購(gòu)物、打電話等更多功能,另外還可以連接第三方軟件,也可實(shí)現(xiàn)對(duì)家用智能電器的控制,可以說功能十分的強(qiáng)大。
智能音箱相比于傳統(tǒng)音箱的優(yōu)勢(shì)在于其能夠通過語(yǔ)音實(shí)現(xiàn)“隔空操作”。智能音箱的基本原理是用戶使用自然語(yǔ)言與音箱交流,音箱通過識(shí)別用戶的語(yǔ)音指令完成相應(yīng)任務(wù),在人們不方便使用手機(jī)或其他電子設(shè)備時(shí)提供幫助。用戶更多的是通過聲音與其進(jìn)行交互,從而解放了雙眼和手指。
芯嶺技術(shù)為企業(yè)提供了一種基于九齊單片機(jī)的智能音箱解決方案,下文是方案的一些相關(guān)介紹。

1.jpg

一、智能音箱解決方案的主要技術(shù):

智能音箱的工作流程為語(yǔ)音喚醒,之后內(nèi)部處理,最后找到對(duì)應(yīng)內(nèi)容輸出,其中主要包括前端信號(hào)處理、語(yǔ)音喚醒、語(yǔ)音交互等技術(shù)。

1、前端信號(hào)處理

前端信號(hào)處理是在喚醒前進(jìn)行準(zhǔn)備工作,音箱工作時(shí),麥列處于拾音狀態(tài),當(dāng)接收到聲音時(shí),對(duì)聲音進(jìn)行處理,包括語(yǔ)音檢測(cè)、降噪、聲源定位和波束形成四個(gè)方面。

語(yǔ)音檢測(cè)用來(lái)檢測(cè)出音頻信號(hào)語(yǔ)音段的起始位置,并過濾不相干的非語(yǔ)音信號(hào),達(dá)到分離語(yǔ)音段和非語(yǔ)音段信號(hào)的目的。降噪即減少噪音對(duì)智能音箱識(shí)別的影響,包含聲學(xué)回聲消除和去混響。實(shí)際環(huán)境中存在各種各樣的噪聲,采取降噪來(lái)降低噪聲干擾,提高信噪比。由于室內(nèi)語(yǔ)音會(huì)被墻壁等多次反射,采集到的聲音較混雜,采用去混響來(lái)處理。聲源定位是根據(jù)麥列,確定使用者的位置??梢杂脕?lái)展示方位燈,增強(qiáng)交互效果,也可作為波束形成的前導(dǎo)任務(wù),確定空間濾波參數(shù)。波束形成通過利用空間濾波,將多路信號(hào)整合為一路,達(dá)到增強(qiáng)原始語(yǔ)音信號(hào)和抑制旁路信號(hào)的目的。

2、語(yǔ)音喚醒

語(yǔ)音喚醒又稱關(guān)鍵詞檢測(cè),即在連續(xù)不斷的語(yǔ)音中將目標(biāo)關(guān)鍵詞檢測(cè)出來(lái),一般目標(biāo)關(guān)鍵詞的個(gè)數(shù)較少。語(yǔ)音喚醒性能取決于喚醒率和誤喚醒率。喚醒率指將連續(xù)語(yǔ)流中存在的喚醒詞檢測(cè)出來(lái)的概率。語(yǔ)音喚醒常用的實(shí)現(xiàn)方式是dnn+hmm(深度神經(jīng)網(wǎng)絡(luò)+隱馬爾科夫模型)和lstm+ctc(長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)+全連接時(shí)序分類模型)。目前開源的喚醒方案可提供SDK,實(shí)現(xiàn)喚醒功能一般分為在線和離線版本。國(guó)內(nèi)主要以科大訊飛為代表。網(wǎng)上也有多種開源的小型語(yǔ)音識(shí)別引擎,可實(shí)現(xiàn)單獨(dú)的語(yǔ)音喚醒功能,性能參差不齊。

3、語(yǔ)音交互

語(yǔ)音交互包括語(yǔ)音識(shí)別、自然語(yǔ)言理解、對(duì)話管理、自然語(yǔ)言生成和語(yǔ)音合成。

語(yǔ)音識(shí)別技術(shù)也稱為自動(dòng)語(yǔ)音識(shí)別,可將語(yǔ)音信息轉(zhuǎn)為文字信息。用戶發(fā)出的指令為語(yǔ)音,然而語(yǔ)音并不能直接拿來(lái)分析,需要轉(zhuǎn)化為文字。隨著深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用、大數(shù)據(jù)的使用和云計(jì)算的普及,語(yǔ)音技術(shù)已經(jīng)進(jìn)入人們的日常生活,如科大訊飛、阿里巴巴的AliGenie、喜馬拉雅的小雅等。

自然語(yǔ)言理解的目的是將自然語(yǔ)言轉(zhuǎn)化為計(jì)算機(jī)易處理的形式,即接收到指令后,識(shí)別出用戶命令的所屬領(lǐng)域,之后再相應(yīng)領(lǐng)域識(shí)別用戶的意圖,最后進(jìn)行實(shí)體抽取,確定意圖的參數(shù)。目前,自然語(yǔ)言處理使用的NPL算法是基于機(jī)器學(xué)習(xí)的,擁有各類語(yǔ)言處理的數(shù)據(jù)集,其中包括中文分詞、詞性標(biāo)注、實(shí)體識(shí)別、句法分析以及自動(dòng)文本分類等功能。

對(duì)話管理對(duì)連續(xù)對(duì)話的交互極為重要,一般的解決辦法是將上輪對(duì)話解析的參數(shù)作為全局變量,帶入到下一輪對(duì)話,根據(jù)當(dāng)輪對(duì)話和一定條件來(lái)判斷是否保持在上一輪的領(lǐng)域,或是清空上下文。

自然語(yǔ)言生成是使計(jì)算機(jī)具有人一樣的表達(dá)和寫作的功能,即能根據(jù)一些關(guān)鍵信息及其在機(jī)器內(nèi)部的表達(dá)形式,經(jīng)過一個(gè)規(guī)劃過程,自動(dòng)生成一段高質(zhì)量的自然語(yǔ)言文本。語(yǔ)音合成又叫文語(yǔ)轉(zhuǎn)換,能使智能音箱像人一樣朗讀任意給定的文本。主要合成方法有參數(shù)合成和拼接合成,其中參數(shù)合成計(jì)算量小,部署靈活,但自然度較差。拼接合成接近真人發(fā)音,存儲(chǔ)和計(jì)算資源高,一般只能在線合成。

2.jpg

二、智能音箱解決方案可實(shí)現(xiàn)功能:
芯嶺技術(shù)的智能音箱方案的主控芯片采用了臺(tái)灣九齊NY8A051F這款單片機(jī),封裝型號(hào)為8引腳sop,該方案通過程序編寫,燒錄,電路設(shè)計(jì)完成功能模塊的搭建,產(chǎn)品設(shè)計(jì)完成之后,最終能夠?qū)崿F(xiàn)如下多種功能:
1、夜燈功能:七彩閃爍小夜燈,跟隨音樂的節(jié)奏閃爍;

2、LED顯示:外置顯示屏,電量顯示,音樂顯示;

3、時(shí)鐘顯示:自動(dòng)適配時(shí)區(qū),24小時(shí)時(shí)鐘顯示;

4、語(yǔ)音交互用語(yǔ)音替代了之前的觸摸按鈕等交互功能,方便您的生活。


深圳市芯嶺技術(shù)有限公司是一家創(chuàng)新的物聯(lián)網(wǎng)整體應(yīng)用解決方案商,從事芯片代理、方案開發(fā)、物聯(lián)網(wǎng)產(chǎn)品研發(fā)、生產(chǎn)、銷售,同時(shí)為眾多企業(yè)提供物聯(lián)網(wǎng)應(yīng)用解決方案服務(wù)。公司具備智能家電、智能家居、智能硬件、智能門店、智慧農(nóng)業(yè)等物聯(lián)網(wǎng)解決方案,公司一直致力于物聯(lián)網(wǎng)技術(shù)及市場(chǎng)推進(jìn)。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

電接點(diǎn)壓力表相關(guān)文章:電接點(diǎn)壓力表原理



相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉