新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 車上設備人機語音接口

車上設備人機語音接口

作者: 時間:2013-02-04 來源:網絡 收藏
6 語音命令處理策略

語音接口中最重要也是最難處理的是語音命令的識別部分。在車輛環(huán)境下,識別方法必須對車輛運行中可能的噪聲和車內的回音具有魯棒性,并且要有足夠高的識別準確率和具有響應的實時性。為了實現這些目標,這個系統(tǒng)中,在語音信號輸入通道中引入了噪聲抵消和回音抵消技術;在語音識別算法中采用多步分層策略,使每一步的有效待識別詞匯集盡量小,以提高每一步識別的準確度和提高識別速度。

在語音識別中另外一個問題是對說話人口音語速等方面的適應。由于汽車具有特定人使用的特點,也就是一般有一個特定的人使用這個汽車,所以這個語音識別過程采用特定人語音識別技術,而且RSC364支持特定人語音識別,并具有很高的識別率。它可由使用者直接訓練語音識別系統(tǒng),形成詞匯的模板可以大大提高系統(tǒng)對這個使用者的語音識別準確度。

在汽車一定的狀態(tài)下,和當前輸入的命令狀態(tài)下,下一步輸入的可能的有效命令構成這個命令的一個合法后續(xù)命令集,依次類推,語音命令之間構成一個樹型結構,稱為命令樹。在正確識別一個命令后,其后續(xù)輸入的語音識別只在已識別命令的孩子節(jié)點集中進行。根據歸納的情況,一個命令的有效后續(xù)命令不超過20 個。在這樣的詞匯集中進行識別,可以達到很高的識別率,而且識別速度很快。

命令樹有三層。第一層的可能命令集為:

Top={“復位”,“退出”,“狀態(tài)”,“故障”,“關閉”,“電話”,“CD”,“車窗”,“空調”,“導航”,“啟動提示”,“關閉提示”,“信箱” }

其中有后續(xù)(下層)命令的命令有 “電話”,“CD”,“車窗”,“空調”,“導航”, “信箱”表示要打電話的“電話”命令的后續(xù)命令有:

Tel-1={“撥號”,“掛機”,“重撥”}

其中,“撥號”的后續(xù)命令集為:

Tel-2={“0”, “1”, “2”, “3”, “4”, “5”, “6”, “7”, “8”, “9”, “通話”}。

表示播放C1D 的命令 “CD” 的后續(xù)命令集為:

CD-1={“播放”,“關機”,“增大”,“降低”}

車窗控制命令 “車窗”的后續(xù)命令集為:

Win-1={“左前”,“左后”,“右前”,“右后”}

表示選擇要操作的車窗。其中每一個命令都對應有以下后續(xù)命令集:

Win-2={“升”,“降”,“?!眪

表示要進行空調操作的“空調”命令有以下后續(xù)操作:

AC-1={“啟動”,“關閉”,“提高”,“降低”}

在每一種命令的操作過程中都可以通過“復位”命令終止這個過程,而回到初始化時的狀態(tài)。

每一個命令集在RSC364 中都用一個單獨的詞匯模板,以便進行訓練。

7 結束語

本文介紹的系統(tǒng)可以作為一個統(tǒng)一的車上人機語音接口。與其它方式比較具有以下特點:

(1) 成本和價格完全處于車上應用能夠接受的范圍;單片機(嵌入式系統(tǒng))能夠滿足其對計算能力和存儲量的要求。
(2) 采用噪聲和回聲抵消等技術,使其完全能夠滿足車上環(huán)境的應用要求,可以達到用戶接受的準確率。
(3) 通過網絡與被訪問設備連接,結構靈活、連接線路簡單、適應性強。

基于語音的車上設備人機界面被認為是最自然、最安全、也最有發(fā)展?jié)摿Φ娜藱C交互方式。本文介紹的工作,目前還處于研究開發(fā)初級階段,要應用于實車還有很多工作;而且,涉及到車上其它設備的連接問題。但是,這里給出的技術方法已經勾畫出了一個完整的體系結構,進一步的工作可以在其基礎上細化完成。汽車電子裝置的網絡化連接已經是一個必然的趨勢,在這些裝置具備網絡連接接口時,本系統(tǒng)的連入就是一個非常自然和簡單的事情了。雖然從目前的情況看,語音接口方式還不能推廣應用,但它是一項必然要采用的技術方法。超前的研究開發(fā)工作對提高我國汽車電子技術水平具有實際意義。

參考文獻
1 Charles J. Murray. “Automakers struggle with speech recognition technology,” EE Times Dec 1, 2000
2 Deborah F.Allinger. Charles Strauss and Dennis Kwon. “ Applications of speech technology to unmanned vehicles,” 20th Digital Avionics Systems Conference, Volume: 1, 2001. Page(s): 5B4/1 -5B4/9
3 T. Kuhn, A.Jameel, M.Stumpfle and A. Haddadi, “Hybrid in-car speech recognition for mobile multimedia application.” IEEE 49th Vehicular Technology Conference, Volume: 3 , 1999. Page(s): 2009~2013
4 Lawrence Rabiner, B-H Juang. “Fundamentals of Speech Recognition”. 北京:清華大學出版社,1999(end)

上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉