基于MATLAB的皮膚聽聲器系統(tǒng)的研究
摘要:為了使皮膚聽聲器能夠辨析語音,設計了基于MATLAB的皮膚聽聲器系統(tǒng)。該系統(tǒng)以MATLAB軟件為平臺,在此基礎上實現(xiàn)了語音信號的錄制、播放、預處理、分段濾波、特征提取等功能,并利用特征參數(shù)辨析語音。本系統(tǒng)達到了辨析簡單語音的要求,但仍有需改進的地方,如:能否構造更合適的特征參數(shù),能否辨析比較復雜的語音。
關鍵詞:皮膚聽聲;采集;處理;語音辨析;MATLAB
目前,世界上有許多的耳聾患者,他們要么是皋天性耳聾,要么是后天造成的耳聾。當前解決耳聾問題主要通過傳統(tǒng)助聽器和電子耳蝸,但兩者都有明顯的缺陷,前者只使用于輕度耳聾患者,而后者造價太高,不適于推廣。為徹底解決耳聾問題,李建文教授針對全聾人的聽覺問題發(fā)明了變壓式皮膚聽聲器,其實質是利用聲-電轉換讓皮膚獲得對電流信號的感覺,使全聾人通過皮膚獲得一定的聽覺,從根本上解決了聾啞人士的聽力問題。
但是,變壓式皮膚聽聲器僅僅使用戶感受到電刺激,而不能辨析語音。為解決此問題,本文提出了一種基于MATLAB的皮膚聽聲器系統(tǒng)。該系統(tǒng)能夠實現(xiàn)語音信號的錄制、播放、預處理、分段濾波、特征提取等功能,并能夠辨析簡單的語音。
1 皮膚聽聲技術與皮膚聽聲器
皮膚聽聲技術是一門比較前沿的技術,其目韻是利用皮膚解決耳聾患者的聽聲問題。而皮膚聽聲器就是通過皮膚聽聲技術解決耳聾患者聽覺問題的電子工具,其特點類似于助聽器并涉及醫(yī)學、電子學、聲學和生理學,進一步的發(fā)展將依賴于數(shù)學和計算機等學科,屬于典型的多學科高科技領域。它通過皮膚傳遞聲音信號且不依賴于人的任何殘余聽力,實用效果明顯,容易佩戴,幾乎無副作用,任何聽力損失的人均可使用。
由李建文教授發(fā)明并研制的第一代皮膚聽聲器已經(jīng)達到聽聲的效果,接下來皮膚聽聲器要達到能夠辨析語音的要求。這需要將原來的模擬電路轉換為數(shù)字電路,在此基礎上進行語音辨析。而本文就設計了一個基于MATLAB的皮膚聽聲器系統(tǒng),該系統(tǒng)以MATLAB軟件為平臺,依次實現(xiàn)語音信號的錄制、播放、預處理、分段濾波、特征提取和最后的辨析語音等功能。
2 系統(tǒng)功能介紹
2.1 主要功能
皮膚聽聲器的作用就是解決耳聾患者的聽聲問題,因此是皮膚聽聲器能量辨析語音是一個十分重要的技術環(huán)節(jié)。本文設計了一個皮膚聽聲器系統(tǒng),基本能夠辨析簡單的語音。該系統(tǒng)以MATLAB軟件為平臺,主要功能有錄制語音、播放語音、預處理、分段濾波、特征提取和最后的辨析語音。平臺功能劃分如圖1所示。
2.2 核心模塊
根據(jù)本文皮膚聽聲器系統(tǒng)的各個功能,將其分成三大核心模塊,分別是采集模塊、處理模塊和辨析模塊。
2.2.1 采集模塊
系統(tǒng)采集模塊的功能包括:錄制語音,播放語音。
1)錄制語音:通過麥克風錄入聲音,并保存為.wav的格式,以備后用。
在MATLAB中,用函數(shù)wavrecord錄制語音。得到的是數(shù)字化的語音數(shù)據(jù)串,可直接作為Matlab變量參與各種運算。然后用函數(shù)wavwrite(y,filename)將變量y中儲存的數(shù)據(jù)寫入名為filename的WAVE文件中。
2)播放語音:播放已錄制的語音WAVE文件,并輸出其波形圖和語譜圖。
在此,用wavread和sound函數(shù)分別讀取、播放語音。求取波形圖和語譜圖時,要用到length函數(shù)和FFT變換。
2.2.2 處理模塊
該模塊的功能有預處理、分段濾波和特征提取。
1)預處理:對前面錄制的語音信號進行去除噪聲、預加重和端點檢測處理,為后續(xù)工作提供更加清晰有效的信號。
2)分段濾波:對經(jīng)預處理后語音信號進行分段濾波,將不同的頻率的語音信號分離開,使得皮膚能夠更好地感應語音信號。
3)特征提?。赫Z音的特征參數(shù)能有效地體現(xiàn)說話人語音所包含的與其他說話人不同的特點,它在整個辨析過程中起著至關重要的作用。本文在語音濾波后,從每個頻率段內提取一個能夠表征該段語音的參數(shù),在把所有參數(shù)結合在一起構造一個特征向量,將其作為表征該語音信號的特征參數(shù),為后面的辨析工作提供一個較為可靠的參考數(shù)據(jù)。
2.2.3 辨析模塊
該模塊的功能包括:模板建庫、模式匹配和輸出結果。
1)模板建庫:講話者多次重復語音單元,從原始語音樣本中去除冗余信息,保留關鍵數(shù)據(jù),獲得表示識別基本單元共性特點的標準數(shù)據(jù),以此構成參考模板,將所有能識別的基本單元的參考模板結合在一起,建立參考模板庫。
2)模式匹配:新錄入的語音經(jīng)特征提取后,與庫中模板按某種原則進行比較,找出相似度最高的參考模板所對應的發(fā)音,即為辨析的結果。
3)輸出結果:輸出前面的辨析結果,以使用戶能夠更好的通過皮膚聽聲器辨析語音。
評論