基于PXA255的VoIP語(yǔ)音傳輸系統(tǒng)研究
語(yǔ)音處理的音頻庫(kù)函數(shù)使用OSS(Open Sound System)。
嵌入式IP終端系統(tǒng)軟件界面采用QT/Embed編程。利用qte的界面編程輔助工具QT Designer能很方便地實(shí)現(xiàn)界面規(guī)劃布局。由于是可視化編程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML語(yǔ)言編寫的.ui文件,通過(guò)QT附帶的工具UIC,能讓*.ui文件生成*.h和*.cpp的文件格式。使用QTDesigner大大降低了編程的工作量,并且能得到所見(jiàn)即所得的圖形效果。
3 語(yǔ)音編解碼器選型
對(duì)語(yǔ)音信號(hào),有許多壓縮算法和標(biāo)準(zhǔn)。這些編碼算法可按照編碼系統(tǒng)碼率大小、輸入信號(hào)頻帶寬度、所采用的編碼技術(shù)等方面進(jìn)行分類。編碼系統(tǒng)優(yōu)劣的評(píng)價(jià)主要體現(xiàn)在編解碼系統(tǒng)的性能指標(biāo)上,一個(gè)編解碼器系統(tǒng)有輸出聲音的質(zhì)量、編碼速率、復(fù)雜度、遲延和容錯(cuò)性
等性能指標(biāo)。
(1)編碼速率。編碼速率指的是編碼器對(duì)輸入聲音經(jīng)過(guò)壓縮后每秒的比特?cái)?shù),即壓縮后的傳碼率。這是編碼系統(tǒng)的一個(gè)十分重要的指標(biāo)。降低比特率而維持較高的解碼聲音質(zhì)量,是語(yǔ)音和音頻信號(hào)壓縮編碼的主要任務(wù)和主要目標(biāo)。對(duì)電話級(jí)別的語(yǔ)音帶寬而言,通常認(rèn)為比特率超過(guò)16kb/s的為高速編碼,而速率在8~16kb/s范圍的為中速率編碼,速率在8kb/s以下的為低速率編碼。
(2)輸出聲音的質(zhì)量。輸出聲音的質(zhì)量是指經(jīng)過(guò)編碼系統(tǒng)再經(jīng)過(guò)接收方的解碼后恢復(fù)出的聲音質(zhì)量。衡量輸出聲音質(zhì)量主要有二個(gè)指標(biāo):客觀質(zhì)量和主觀質(zhì)量??陀^質(zhì)量法易測(cè)量,但往往不能精確反映語(yǔ)音質(zhì)量。由于聲音的最終接收者是人,所以主觀法更能反映聲音質(zhì)量的真正好壞,但它測(cè)試不易,費(fèi)時(shí)費(fèi)力。
(3)復(fù)雜度。在傳統(tǒng)電話應(yīng)用中,很少使用壓縮,是因?yàn)閴嚎s算法的復(fù)雜度太大,算法執(zhí)行時(shí)間長(zhǎng),算法的延遲也一起帶入到通信系統(tǒng)中。隨著技術(shù)的進(jìn)步,芯片處理速度越來(lái)越快。現(xiàn)在工程上一般采用單片數(shù)字信號(hào)處理器DSP芯片來(lái)實(shí)時(shí)實(shí)現(xiàn)語(yǔ)音編解碼。語(yǔ)音編解碼算法的復(fù)雜度可由算法所需的計(jì)算量、存儲(chǔ)量、硬件尺寸、消耗功率及價(jià)格來(lái)衡量。
(4)時(shí)延。時(shí)延指完成編解碼算法所需的時(shí)間。對(duì)于語(yǔ)音編解碼器來(lái)說(shuō),時(shí)延也是一個(gè)非常重要的指標(biāo),如果時(shí)延太大,聽(tīng)起來(lái)很不舒服。對(duì)于時(shí)延,不同的應(yīng)用場(chǎng)合有不同規(guī)定,如對(duì)長(zhǎng)話網(wǎng)不加回波抑制的單向編解碼時(shí)延不得大于10ms。對(duì)可視電話則放松到不超過(guò)500ms。對(duì)VOIP語(yǔ)音系統(tǒng)的時(shí)延要求不超過(guò)300ms。
(5)容錯(cuò)能力或魯棒性。容錯(cuò)能力指編解碼系統(tǒng)抗誤差、線路噪聲等各種干擾的能力。
表1對(duì)幾種編碼器的比特率、主觀平均意見(jiàn)分法(MOS)、復(fù)雜度(以G.711為基準(zhǔn))和時(shí)延(幀大小)做了比較。
本系統(tǒng)選用GSM 06.10語(yǔ)音標(biāo)準(zhǔn)算法,該算法在1988年被確定為數(shù)字移動(dòng)通信的語(yǔ)音編碼標(biāo)準(zhǔn),其編碼速率為13kb/s,算法簡(jiǎn)單,運(yùn)算量小,語(yǔ)音質(zhì)量高,接近32kb/s的ADPCM(ITU-G.712)。
4 IP語(yǔ)音實(shí)時(shí)傳輸系統(tǒng)設(shè)計(jì)
本文采用Intel公司推出的PXA255處理器,該芯片專用于網(wǎng)絡(luò)和多媒體。其最高工作頻率可達(dá)400MHz,并帶內(nèi)存管理單元MMU和DSP協(xié)處理器,可方便與高清晰的彩色LCD接口,同時(shí)該芯片可擴(kuò)展連接AC97音頻芯片CS4201、高性能網(wǎng)絡(luò)接口芯片LANC9196,可方便移植嵌入式Linux和圖形界面等。
評(píng)論