基于STM32的嵌入式語音識別模塊設(shè)計

作者：時間：2011-03-23 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：介紹了一種以ARM為核心的嵌入式語音識別模塊的設(shè)計與實現(xiàn)。模塊的核心處理單元選用ST公司的基于ARM Cortex-M3內(nèi)核的32位處理器STM32F103C8T6。本模塊以對話管理單元為中心，通過以LD3320芯片為核心的硬件單元實現(xiàn)語音識別功能，采用嵌入式操作系統(tǒng)μC／OS-II來實現(xiàn)統(tǒng)一的任務(wù)調(diào)度和外圍設(shè)備管理。經(jīng)過大量的實驗數(shù)據(jù)驗證，本文設(shè)計的語音識別模塊具有高實時性、高識別率、高穩(wěn)定性的優(yōu)點。
關(guān)鍵詞：ARM；語音識別；對話管理；LD3320；μC／OS-II

引言
服務(wù)機器人以服務(wù)為目的，因此人們需要一種更方便、更自然、更加人性化的方式與機器人交互，而不再滿足于復(fù)雜的鍵盤和按鈕操作。基于聽覺的人機交互是該領(lǐng)域的一個重要發(fā)展方向。目前主流的語音識別技術(shù)是基于統(tǒng)計模式。然而，由于統(tǒng)計模型訓(xùn)練算法復(fù)雜，運算量大，一般由工控機、PC機或筆記本來完成，這無疑限制了它的運用。嵌入式語音交互已成為目前研究的熱門課題。
嵌入式語音識別系統(tǒng)和PC機的語音識別系統(tǒng)相比，雖然其運算速度和內(nèi)存容量有一定限制，但它具有體積小、功耗低、可靠性高、投入小、安裝靈活等優(yōu)點，特別適用于智能家居、機器人及消費電子等領(lǐng)域。

1 模塊整體方案及架構(gòu)
語音識別的基本原理如圖1所示。語音識別包括兩個階段：訓(xùn)練和識別。不管是訓(xùn)練還是識別，都必須對輸入語音預(yù)處理和特征提取。訓(xùn)練階段所做的具體工作是通過用戶輸入若干次訓(xùn)練語音，經(jīng)過預(yù)處理和特征提取后得到特征矢量參數(shù)，最后通過特征建模達到建立訓(xùn)練語
音的參考模型庫的目的。而識別階段所做的主要工作是將輸入語音的特征矢量參數(shù)和參考模型庫中的參考模型進行相似性度量比較，然后把相似性最高的輸入特征矢量作為識別結(jié)果輸出。這樣，最終就達到了語音識別的目的。

本文引用地址：http://m.butianyuan.cn/article/150932.htm

現(xiàn)有的語音識別技術(shù)按照識別對象可以分為特定人識別和非特定人識別。特定人識別是指識別對象為專門的人，非特定人識別是指識別對象是針對大多數(shù)用戶，一般需要采集多個人的語音進行錄音和訓(xùn)練，經(jīng)過學(xué)習(xí)，達到較高的識別率。
基于現(xiàn)有技術(shù)開發(fā)嵌入式語音交互系統(tǒng)，目前主要有兩種方式：一種是直接在嵌入式處理器中調(diào)用語音開發(fā)包；另一種是嵌入式處理器外圍擴展語音芯片。第一種方法程序量大，計算復(fù)雜，需要占用大量的處理器資源，開發(fā)周期長；第二種方法相對簡單，只需要關(guān)注語音芯片的接口部分與微處理器相連，結(jié)構(gòu)簡單，搭建方便，微處理器的計算負擔(dān)大大降低，增強了可靠性，縮短了開發(fā)周期。
語音識別技術(shù)在國內(nèi)外的發(fā)展十分迅速。目前國內(nèi)在PC應(yīng)用領(lǐng)域，具有代表性的有：科大訊飛的InterReco2．0、中科模式識別的Pattek ASR3．0、捷通華聲的jASRv5．5；在嵌入式應(yīng)用領(lǐng)域，具有代表性的有：凌陽的SPCE061A、ICRoute的LD332X、上海華鎮(zhèn)電子的WS-117。
本文的語音識別方案是以嵌入式微處理器為核心，外圍加非特定人語音識別芯片及相關(guān)電路構(gòu)成。語音識別芯片選用ICRoute公司的LD33 20芯片。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

新聞中心

基于STM32的嵌入式語音識別模塊設(shè)計

評論

相關(guān)推薦

技術(shù)專區(qū)