新聞中心

EEPW首頁 > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > 電視機(jī)智能聲控選臺系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

電視機(jī)智能聲控選臺系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

作者: 時間:2012-07-30 來源:網(wǎng)絡(luò) 收藏

標(biāo)簽:遙控發(fā)射 MIC

本文引用地址:http://m.butianyuan.cn/article/165167.htm

隨著電視頻道數(shù)目的日益增多,傳統(tǒng)的電視遙控方法弊端越來越明顯。它需要觀念記憶大量電視臺對音識別芯片TSG410了一個彩電選臺,可以較好地解決記憶頻道這個難題。尤其對列疾朋友來講,更具有特殊的意義。

不對彩電做任何改動。在保留原有遙控功能的基礎(chǔ)上,語音控制選臺,主要功能有:

開關(guān)電視:電視接通電源處于待命狀態(tài),操作者發(fā)出“開機(jī)”命令,則打開;操作者發(fā)出“關(guān)機(jī)”命令,則關(guān)掉;

;選臺功能:操作者想看XX電視臺的節(jié)目,只要發(fā)出“XX臺”的命令,自動跳轉(zhuǎn)到該臺。

識別主人功能:日防止識操作,該只能事先錄入命令樣本的操作者語音敏感,其他人發(fā)出的命令包括電視伴音均無效。

其它功能:具有電視音量、畫面亮度調(diào)節(jié)等適合語音控制的功能。

1 系統(tǒng)方案

我們最初考慮了兩種方案(見圖1和圖2),它們各有優(yōu)缺點(diǎn)。第一種電路不足之處是:電路稍復(fù)雜一點(diǎn),而且要對電視機(jī)的選臺控制電路做必要的改動(當(dāng)然這對電視機(jī)生產(chǎn)廠家是不成問題的);其優(yōu)點(diǎn)是:只需一個無線話筒便可選臺,且不必對準(zhǔn)電視機(jī),甚至在另一個房間也可遙控。第二種電路的優(yōu)點(diǎn)是:不必對電視機(jī)的選臺控制電路做任何的改動;缺點(diǎn)是:所有電路只能靠電池供電,芯片選擇要考慮耗電和工作電壓問題。由于采用紅外遙控發(fā)射來控制電視,該系統(tǒng)須對準(zhǔn)電視機(jī)才能正常工作。綜合考慮各方面因素,我們認(rèn)日第二種設(shè)計(jì)方案切實(shí)可行。

圖1 設(shè)計(jì)方案1示意框圖

圖2:設(shè)計(jì)方案2示意框圖

2 各個功能模塊簡介

2.1 語音命令提取單元

語音命令提供該單元(如圖2)在電視話音和其它噪音背景下,完成提取出操作者語音命令功能,其示意圖如圖3所示。

圖3 語音命令提取單元示意圖

MIC選用駐極體送話器,它具有結(jié)構(gòu)簡單、重量輕、體積小、頻率響應(yīng)寬、保真度好等優(yōu)點(diǎn),但靈敏度較低,必須再加放大器才行。由于輸出阻抗可高達(dá)10 8Ω數(shù)量級,所在必須進(jìn)行阻抗變換后才能與放大器配合使用。放大器采用差分放大電路,一個駐極體送話器面對送話者,其輸出接送放大器正向輸入端;另一個駐極體送話器背對送話者,其輸出接放大器負(fù)向輸入端。由于兩個送話器相對于電視機(jī)和其它噪聲源的位置基本一樣遠(yuǎn),可以近似認(rèn)日通過二者輸入的干擾是一樣的。但考慮到送話器具有方向性,前者送入的操作者語音命令遠(yuǎn)遠(yuǎn)大于后者,適當(dāng)選擇各電阻值可以抵消掉各種干擾。放大器采用運(yùn)放(OPAmps)MAX495(單電源供電+2.7~+6V)。

2.2 語音識別單元

語音識別單元主要由TSG410和非易失性SRAM組成,大體構(gòu)成如下圖4所示。

圖4 語音命令識別單元

語音識別功能由專用語音芯片TSG410完成,TSG410是一種新穎功能齊全的語音識別集成電路。它采用CMOS大規(guī)模集成電路制作工藝制造,內(nèi)含除SRAM以外語音識別所需的全部電路,如CPU、A/D轉(zhuǎn)換器、ROM、語音放大器、壓縮器、濾波器、振蕩器及接口電路等。TSG410具有雙列直插和貼片兩種封裝方式,可工作在CPU控制和人工控制兩種模式下。語音識別的響應(yīng)時間典型值日300ms,最長不超過600ms。

識別容量大,最多可識別40個字段,且分段方式靈活。為了CPU管理方便,將40個字段分成四組,編號為1~4,每組10個段。這樣,第一個字段編號為10,第二個為11,第三個為12…依次類推,第40個字段編號為49。在操作顯示時,十位數(shù)顯示組號,個位數(shù)顯示序號。因此,建立語音樣本時,應(yīng)注意顯示數(shù)字和電視機(jī)選擇頻率之間的換算關(guān)系,以免語音命令和控制結(jié)果對應(yīng)不起來。各段功能分配如表1所示。

TSG410的每個字段時間長度可以在0.9s和1.92s之間選擇。按正常人的講話速度,每秒吐字2~4個,如選擇0.9s,則每個命令字段以1~3個字為宜,選擇1.92s則最大容量為8個漢字,但可識別的字段數(shù)減少為20個。我們選擇膠一種分段方式,語音命令以3個字以下為宜。因此,電視選臺命令采用“地方”命名原則,如:山東、上海等,中央臺可直接叫“一臺”、“二臺”,依次類推。語音命令差別越大越不容易出現(xiàn)錯誤識別。系統(tǒng)要正常工作,必須首先建立語音樣本,為防止語音樣本因?yàn)榈綦妬G失,SRAM選用內(nèi)帶掉電保護(hù)電池的非易失性SRAM,即NVSRAM(non-volatile SRAM),如HK1125,掉電后其數(shù)據(jù)可保存10年以上,用法同普通RAM。

一般情況下,留有30個預(yù)選頻道是足夠用的。實(shí)際上,既可以采用多片TSG410進(jìn)行頻道數(shù)和允許操作者人數(shù)擴(kuò)展方式滿足各種需要,也可以采用讓TSG410工作在CPU控制方式的辦法。此時識別容量不受40字段限制,但需增加單片機(jī)(如8031)作控制用。

2.3 控制面板

為了能輸入字段號,以便建立語音樣本,RSG410配置了外接鍵盤掃描電路。行、列信號的輸入、輸出口由芯片的S1~S3、K1~K3擔(dān)當(dāng)。這樣一個三列、四行的鍵盤共有12個按鍵,其中十個定義為:0~9數(shù)字鍵,一個定義為:語音樣本建立鍵(TRN),一個定義為:語音樣本清除鍵(CLR)。由于控制面板只在建立語音樣本時使用,為防止誤操作,應(yīng)將12個按鍵用塑料外亮封起來。

2.4 操作指示電路

采用兩片數(shù)碼管和譯碼驅(qū)動電路CC4558組成操作指示電路。在本系統(tǒng)中,操作指示電路作用是:建立語音命令樣本時,用于顯示存入的字段號;語音命令識別時用于顯示識別結(jié)果及芯片識別結(jié)果的處理報告。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉