新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應用 > 嵌入式語音識別系統(tǒng)電路設(shè)計—電路精選(13)

嵌入式語音識別系統(tǒng)電路設(shè)計—電路精選(13)

作者: 時間:2017-10-27 來源:網(wǎng)絡(luò) 收藏

  語音交互系統(tǒng)是比較人性化的人機操作界面,它需要系統(tǒng)的支持。而技術(shù)在這其中起到中流砥柱的作用,它也被稱為自動,其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。

本文引用地址:http://m.butianyuan.cn/article/201710/368800.htm

  特定人語音識別技術(shù)是基于“關(guān)鍵詞語列表”的識別技術(shù),它是對大量的語音數(shù)據(jù)(相當于對數(shù)千人采集的數(shù)萬小時的有效聲音數(shù)據(jù))經(jīng)語言學家語音模型分析,建立數(shù)學模型,并經(jīng)過反復訓練提取基元語音的細節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計概率最優(yōu)化意義上的各個基元語音特征,最后才由資深工程師將算法以及語音模型轉(zhuǎn)換成硬件芯片并應用在系統(tǒng)中。

  本文將介紹一款語音識別芯片——LD3320芯片。LD3320采用的是ASR技術(shù),提供了一種脫離按鍵、鍵盤、鼠標、觸摸屏等GUI操作方式且基于語音的用戶界面VUI(Voice User Interface),使得用戶對該系統(tǒng)的操作更簡單、快速和自然。隨著高檔MCU的不斷出現(xiàn),以MCU為核心的語音交互系統(tǒng)會有非常好的應用前景。

  工作原理

  圖1 LD3320和單片機(或系統(tǒng))組成的語音識別系統(tǒng)原理框圖。

  在使用過程中,用戶只需要把識別的關(guān)鍵詞語以字符串的形式傳送進芯片,即可以在下次識別中立即生效。比如,用戶在51等主控MCU的編程中,簡單地通過設(shè)置芯片的寄存器,把諸如“你好”這樣的識別關(guān)鍵詞語的內(nèi)容動態(tài)地傳入芯片中,芯片就可以識別所設(shè)定的關(guān)鍵詞語了。每個關(guān)鍵詞語可以是單字、詞組、短句或者任何的中文發(fā)音的組合。基于LD3320的語音識別系統(tǒng)可以隨著使用流程,在運行時動態(tài)地更改關(guān)鍵詞語列表的內(nèi)容,這樣可以用一個系統(tǒng)支持多種不同的場景,同時也不需要用戶作任何的錄音訓練。

  圖2 STC10L08XE構(gòu)成的主控芯片

  圖3 LD3320A構(gòu)成的語音識別主系統(tǒng)

  由圖可知,由LD3320組成的語音識別系統(tǒng)硬件有單片機(或嵌入式系統(tǒng))及LD33202.圖2和圖3分別是由單片機STC10L08XE 構(gòu)成的主控芯片和由LD3320A 構(gòu)成的語音識別主系統(tǒng)。

  LD3320評估板(其中,控制MCU選用的是STC的51單片機)

  編者結(jié)語

  編者認為這種語音識別系統(tǒng)主要應用于語音控制的點歌系統(tǒng)、語音控制的手機、音控智能導航儀、音控智能家電產(chǎn)品等。當然,這種語音識別系統(tǒng)不是完美的,它容易引起誤識別,如當用戶說的內(nèi)容不在識別列表內(nèi)時,必然會引起誤識別。為了克服這些缺點,降低誤識別率,可在設(shè)定好要識別的關(guān)鍵詞語后,再添加一些與識別列表內(nèi)的單詞有聯(lián)系的任意其他詞匯,用來吸收錯誤識別,從而達到降低誤識別率的目的。



關(guān)鍵詞: 嵌入式 語音識別 電路

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉