IP視頻電話設(shè)計營造逼真環(huán)境
伴隨寬帶的繁榮,IP網(wǎng)絡(luò)步入千家萬戶,同時也催生出VoIP業(yè)務(wù),全球VoIP用戶有望在2010年達到1.5億。雖然目前國內(nèi)對VoIP服務(wù)的規(guī)范還未明朗,但是“擦邊球”式的業(yè)務(wù)已經(jīng)造就了一個不小的市場,據(jù)iSuppli的估算,中國VoIP的市場份額在2005年底約為5.6億美元,這一數(shù)字到2010年可達到11億美元。隨著業(yè)務(wù)的發(fā)展,人們不再滿足基本的語音通話,生動的影像可以營造逼真的環(huán)境,更能縮短溝通的距離。IP 視頻電話除了對視頻和語音質(zhì)量的高要求,電話終端也在向多功能的方向發(fā)展,網(wǎng)頁瀏覽、收發(fā)e-mail甚至是類似PVR功能的視頻留言都將出現(xiàn)在終端話機上。
因而,一個優(yōu)秀的IP 視頻電話開發(fā)平臺,除了需要支持各種音頻/視頻編解碼的處理能力外,更多的特性體現(xiàn)在平臺開發(fā)的靈活性上。例如,在應(yīng)用層添加豐富的I/O接口讓客戶定制不同的應(yīng)用、提供良好的圖形用戶見面以及同時支持SIP和H.323多種通信協(xié)議等等。聞亭數(shù)字系統(tǒng)公司總裁董永宏把這種方便靈活的方式稱作交鑰匙(Turn Key)式解決方案。在聞亭和TI最近聯(lián)合推出的視頻電話開發(fā)平臺VDP-II上,采用了主板+子板的模式,董永宏稱這種模塊化的設(shè)計更適合客戶小批量的靈活生產(chǎn)。
高質(zhì)量的音視頻體驗
目前的IP 視頻電話消費市場是以商業(yè)用戶為主,他們要求視頻電話具備高分辨率和良好的語音質(zhì)量,以提高身臨其境的體驗。對于用做長途通話的家庭用戶,清晰逼真的環(huán)境也能實現(xiàn),因而先進的編解碼技術(shù)已經(jīng)開始應(yīng)用到新一代的視頻電話解決方案中。
圖 基于DM644X的視頻電話方案
新興的視頻編解碼標準H.264需要的帶寬只有目前通用的H.263的一半、MPEG-2的1/5,這個性能優(yōu)勢將允許流媒體在更低的帶寬上傳輸,非常適合像網(wǎng)絡(luò)視頻應(yīng)用這樣在帶寬受限緊缺的應(yīng)用中。董永宏告訴記者,IP 視頻電話中通常采用H.264 Baseline Profile,它滿足了實時通話的低延遲要求,同時還能實現(xiàn)720x480的D1分辨率。此外,IP 視頻電話機正在綜合更多的多媒體功能,例如有些解決方案廠商在應(yīng)用軟件里加入了視頻回放和錄制功能,從而實現(xiàn)視頻留言。或者為了增加數(shù)碼像框的功能而加入JPEG幀采集。
在音頻編解碼技術(shù)方面,國際電信聯(lián)盟 (ITU)針對寬帶 IP 電話應(yīng)用的 G.722.2 (WB-AMR)規(guī)范將成為IP 視頻電話的主導(dǎo)標準。G.722.2 是取樣在 16KHz 的語音壓縮標準,音頻覆蓋從 50Hz 到 7KHz。與窄帶編解碼器如 G.711 和 G.729 相比,G.722.2通過提高摩擦音(如 s、f)的可理解性來改善所有通過 IP 和無線網(wǎng)絡(luò)傳輸?shù)恼Z音交流。設(shè)計人員還需要考慮到與移動電話的IP通話,采用GSM-AMR(Adaptive Multi-Rate)語音編解碼技術(shù)可以減少GSM- G.729的轉(zhuǎn)換環(huán)節(jié),改善固定電話和移動電話的通話質(zhì)量。值得一提的是,iLBC也是一種收到歡迎的低比特率編解碼,iLBC在丟包率達到10%的情況下都能具有健壯性,因而輸送的語音音質(zhì)超過 G.729 和 G.723.1。iLBC 支持兩種基本的幀長度:13.3 kbps 比特率下編碼幀長度為 30 ms;而 15.2 kbps比特率下編碼幀長度則為 20 ms。
除了音視頻編解碼技術(shù)外,一個好的實時軟件框架同樣能幫助改善體驗。例如,QoS自適應(yīng)功能、DTMF抖動緩沖器和媒體同步化等等。
雙核處理優(yōu)勢
IP 視頻電話的開發(fā)面臨著成本和性能的雙重挑戰(zhàn),高性能的數(shù)字媒體處理器在其中舉足輕重。通常情況下,IP 視頻電話需要處理2種不同的任務(wù):事務(wù)密集型和流密集型。有些解決方案在VoIP系統(tǒng)中加入視頻協(xié)處理器控制設(shè)計成本,但是卻沒有足夠的帶寬處理寬帶音頻和高清視頻。
相較而言,集成一個通用處理器和一個DSP的雙核數(shù)字多媒體SoC更能有效協(xié)調(diào)成本和性能之間的關(guān)系:采用ARM處理器處理事務(wù)密集型任務(wù),用DSP處理流密集型任務(wù)。在一個典型的MPEG-4編解碼器中,離散余弦變換及其反變換、像素插值和運動估計四種功能大約占據(jù)了整個處理過程的80%,一個每秒15幀的MPEG-4解碼幾乎占據(jù)了RISC處理器的所有資源,而DSP卻有足夠的計算能力完成相同的任務(wù)。在雙核架構(gòu)中,ARM處理器則負責(zé)支持應(yīng)用操作系統(tǒng)并完成以控制為核心的應(yīng)用處理,ARM集成了大量的內(nèi)部電路和外圍接口,例如LCD控制器、UART串行接口、USB2.0、I2C等等。雙核架構(gòu)的一個明顯優(yōu)勢就是可以使操作系統(tǒng)的效率和多媒體代碼的執(zhí)行更加優(yōu)化并延長電源壽命;同時采用雙處理器可以將總工作負荷進行合理劃分,從而降低時鐘工作頻率,減少系統(tǒng)的功耗。
有些解決方案還添加了一種視頻/影像協(xié)處理器 (VICP),用于減輕相關(guān)算法(如:JPEG、H.264、MPEG4 與 VC-1)的 DSP 內(nèi)核繁重的視頻與影像處理負擔(dān),從而使更多的 DSP MIPS 能夠用于視頻后處理或者其他并行運行功能。
IP視頻電話的發(fā)展正在經(jīng)歷著類似2001年VoIP的發(fā)展?fàn)顩r,一方面要求高質(zhì)量的基本通話功能,另一方面設(shè)備制造商也正在單一設(shè)備上提供更多的附加增值應(yīng)用,如WEB瀏覽器、Wi-Fi、短消息甚至是互動游戲等等。而隨著技術(shù)的發(fā)展,視頻電話也正在協(xié)調(diào)成本和性能的關(guān)系,有望在不久的將來走進大眾的生活。
評論