新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ARM的非特定人語音識(shí)別系統(tǒng)設(shè)計(jì)

基于ARM的非特定人語音識(shí)別系統(tǒng)設(shè)計(jì)

作者: 時(shí)間:2014-05-26 來源:網(wǎng)絡(luò) 收藏

 

本文引用地址:http://m.butianyuan.cn/article/247359.htm

2.3 語音合成單元設(shè)計(jì)

TTS(Text To Speech)文本轉(zhuǎn)語音技術(shù)是人機(jī)智能對(duì)話發(fā)展的趨勢(shì)。基于TTS技術(shù)的語音系統(tǒng)無需事先錄音就能夠隨時(shí)根據(jù)查詢條件查出并合成語音進(jìn)行播報(bào),從而大大減少了系統(tǒng)維護(hù)的工作量。利用此技術(shù),通過MCU或者PC機(jī)就能控制語音芯片發(fā)音[4].

本文采用SYN6658中文語音合成芯片進(jìn)行語音合成。SYN6658 通過UART 接口或SPI接口通信方式,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語音(或TTS語音)的轉(zhuǎn)換[6].控制器和SYN6658 語音合成芯片之間通過UART接口連接,控制器通過串口通信向SYN6658語音合成芯片發(fā)送控制命令和文本,SYN6658語音合成芯片把接收到的文本合成為語音信號(hào)輸出,輸出的信號(hào)經(jīng)LM386 功率放大器進(jìn)行放大后連接到喇叭進(jìn)行播放。如圖6所示。

 

 

SYN6658語音合成電路采用芯片硬件數(shù)據(jù)手冊(cè)提供的典型應(yīng)用電路進(jìn)行設(shè)計(jì)[5],在此不做介紹,功率放大電路采用美國(guó)國(guó)家半導(dǎo)體生產(chǎn)的音頻功率放大器LM386進(jìn)行放大。

在進(jìn)行語音合成時(shí)首先進(jìn)行初始化,包括發(fā)音人選擇、數(shù)字處理策略、語速調(diào)節(jié)、語調(diào)調(diào)節(jié)、音量調(diào)節(jié)等。

由于該系統(tǒng)要模擬多人發(fā)音,所以不同的從設(shè)備設(shè)置不同的發(fā)音人及語調(diào)與語速以便于區(qū)分。初始化后等待測(cè)控計(jì)算機(jī)的語音合成命令,待收到命令后芯片會(huì)向上位機(jī)發(fā)送1字節(jié)的狀態(tài)回傳,上位機(jī)可根據(jù)這個(gè)回傳來判斷芯片目前的工作狀態(tài)。語音合成流程圖如圖7所示。

 

 

3 系統(tǒng)軟件設(shè)計(jì)

示教與回放系統(tǒng)的軟件設(shè)計(jì)包括測(cè)控計(jì)算機(jī)的軟件設(shè)計(jì)和各從設(shè)備Arduino mega260控制器的軟件設(shè)計(jì)。

測(cè)控計(jì)算機(jī)是整個(gè)系統(tǒng)的控制核心,其軟件采用C#進(jìn)行編寫,在示教與回放系統(tǒng)中主要是對(duì)操作數(shù)據(jù)的記錄以便根據(jù)所記錄的數(shù)據(jù)對(duì)操作過程進(jìn)行精確回放,需要記錄的數(shù)據(jù)包括:各從設(shè)備操作人員的操作口令,操作動(dòng)作,口令及動(dòng)作時(shí)間,各操作對(duì)應(yīng)的操作現(xiàn)象。為簡(jiǎn)化記錄數(shù)據(jù),事先編制好各事件代碼,記錄過程只記錄代碼,大大提高程序效率。建立結(jié)構(gòu)體如下:

 

 

在操作訓(xùn)練過程中測(cè)控計(jì)算機(jī)每隔50 ms 對(duì)下位機(jī)進(jìn)行控制及輪詢,并記錄反饋數(shù)據(jù),在數(shù)據(jù)記錄時(shí)以50 ms 為一個(gè)單位。采用定時(shí)器對(duì)時(shí)間進(jìn)行控制。在回放過程中首先比對(duì)當(dāng)前時(shí)間和所記錄的時(shí)間,當(dāng)所記錄的時(shí)間與當(dāng)前時(shí)間吻合時(shí)測(cè)控計(jì)算機(jī)控制下位機(jī)執(zhí)行該事件,完成事件回放。

Arduino mega2560控制器負(fù)責(zé)接收測(cè)控計(jì)算機(jī)的控制指令并執(zhí)行指令,讀取結(jié)果,對(duì)聲強(qiáng)數(shù)據(jù)采集和處理,控制語音合成單元進(jìn)行語音合成等。Arduinomega2560 控制器采用串口中斷的方式進(jìn)行命令接收。

只有正確接收到命令才會(huì)執(zhí)行并回傳結(jié)果,若測(cè)控計(jì)算機(jī)在限定時(shí)間內(nèi)未收到回傳結(jié)果則表明發(fā)生錯(cuò)誤,測(cè)控計(jì)算機(jī)需重新發(fā)送。數(shù)據(jù)接收流程圖如圖8所示。

 

 

4 總結(jié)

本文利用智能語音芯片設(shè)計(jì)了某模擬訓(xùn)練器的示教與回放系統(tǒng),該系統(tǒng)不需要現(xiàn)在流行的虛擬現(xiàn)實(shí)技術(shù)的支持,僅在MCU的控制下就可以運(yùn)行。該系統(tǒng)也可以在小型的便攜式設(shè)備上實(shí)現(xiàn),具有良好的應(yīng)用前景。

手機(jī)電池相關(guān)文章:手機(jī)電池修復(fù)


聲控?zé)粝嚓P(guān)文章:聲控?zé)粼?/a>

上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: ARM 語音識(shí)別

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉