新聞中心

EEPW首頁 > 消費電子 > 設(shè)計應(yīng)用 > 多媒體技術(shù)應(yīng)用之聲音編碼技術(shù)分析

多媒體技術(shù)應(yīng)用之聲音編碼技術(shù)分析

作者: 時間:2012-03-28 來源:網(wǎng)絡(luò) 收藏

前言

本文引用地址:http://m.butianyuan.cn/article/165786.htm

數(shù)據(jù)類型主要有一下幾個方面:

·圖形和圖像:圖像由象素組成;圖形由圖元組成

文本:最基本的,有多中方式, ASCII碼, 中文的GB碼等等

音頻:WAV文件是計算機中最基礎(chǔ)的記錄形式,對聲波信號進行采樣,采樣后經(jīng)過量化形成數(shù)字信號。MIDI格式的數(shù)據(jù)記錄的實際是樂譜(數(shù)字音視頻)。

·動畫和視頻: 動畫是用計算機生成一系列可供實時演播的連續(xù)畫面。視頻是由一幅幅拍攝下來的真實畫面序列組成。

通常情況下,我們將利用計算機把文本、圖像、圖形、動畫、音頻及視頻等多種媒體綜合一體化,使之建立起邏輯上的聯(lián)系,并能夠?qū)λ鼈儷@取,,編輯,處理,存儲,傳輸和再現(xiàn)的技術(shù)稱之為技術(shù)。在實際生活中是非常廣泛的,下面小編以多媒體技術(shù)中技術(shù)為例(音視頻技術(shù)),詳細介紹實際生活中有關(guān)多媒體的相關(guān)知識。

1.G.721 ADPCM編碼器

ADPCM 是利用樣本與樣本之間的高度相關(guān)性和量化階自適應(yīng)來壓縮數(shù)據(jù)的一種波形編碼技術(shù)。

CCITT 為此制定了 G.721 推薦標準 , 這個標準叫做 32kb/s 自適應(yīng)差分脈沖Differential Pulse Code Modulation to 24and 40kb/s for Digital Circuit Multiplication Equipment Application , 使用該標準的編碼器的數(shù)據(jù)率可降低到 40kb/s 和24kb/s 。

CCITT 推薦的 G.721 ADPCM 標準是一個代碼轉(zhuǎn)換系統(tǒng)。它使用 ADPCM 轉(zhuǎn)換技術(shù) , 實現(xiàn) 64kb/s A 律或μ律 PCM 速率和 32kb/s 速率之間的相互轉(zhuǎn)換。

2.子帶編碼 (SBC)

子帶編碼主要過程是:

①使用一組帶通濾波器 (band-pass filter ,BPF) 把輸入音頻信號的頻帶分成若干個連續(xù)的頻段 , 每個頻段稱為子帶。

②對每個子帶中的音頻信號采用單獨的編碼方案去編碼。

③在信道上傳送時 , 將每個子帶的代碼復(fù)合起來。

④在接收端譯碼時 , 將每個子帶的代碼單獨譯碼 , 然后把它們組合起來 , 還原成原來的音頻信號。

采用對每個子帶分別編碼的好處:

第一.對每個子帶信號分別進行自適應(yīng)控制,量化階(quantization step) 的大小可以按照每個子帶的能量電平加以調(diào)節(jié)。具有較高能量電平的子帶用大的量化階去量化 , 以減少總的量化噪聲。

·第二,可根據(jù)每個子帶信號在感覺上的重要性 , 對每個子帶分配不同的位數(shù) , 用來表示每個樣本值。例如 ,在低頻子帶中,為了保護音調(diào)和共振峰的結(jié)構(gòu),就要求較小的量化階、較多的量化級數(shù), 即分配較多的位數(shù)來表示樣本值。而話音中的摩擦音和類似噪聲的,通常出現(xiàn)在高頻子帶中,對它分配較少的位數(shù)。

3. 子帶-自適應(yīng)差分脈沖編碼調(diào)制(SB-ADPCM)

采樣率為 8kHz 、 8 位 / 樣本、數(shù)據(jù)率為 64kb/s 的 G.711 標準是 CCITT 為話音信號頻率為 (300~3400)Hz制定的編譯碼標準, 這屬于窄帶音頻信號編碼。現(xiàn)代的話音編碼技術(shù)已經(jīng)可以減少數(shù)據(jù)率 ,而又不至于顯著降低音質(zhì)。 CCITT 推薦的 8KHz 采樣率、 4 位 / 樣本、 32kb/s 的 G.721 標準, 以及 G.721 的擴充標準 G.723, 都說明了話音壓縮編碼技術(shù)的進展。

G.722 是 CCITT 推薦的音頻信號編碼譯碼標準。該標準是描述音頻信號帶寬為 7kHz、數(shù)據(jù)率為 64kb/s 的編譯碼原理、算法和計算細節(jié)。

G.722 的主要目標是保持 64kb/s 的數(shù)據(jù)率 , 而音頻信號的質(zhì)量要明顯高于 G.711 的質(zhì)量。 G.722 標準把音頻信號采樣頻率由 8kHz 提高到 16KHz, 是 G.711PCM 采樣率的 2 倍 , 因而要被編碼的信號頻率由原來的 3.4kHz 擴展到 7kHz 。這就使音頻信號的質(zhì)量有很大改善 , 由數(shù)字電話的話音質(zhì)量提高到調(diào)幅 (AM) 無線電廣播的質(zhì)量。對話音信號質(zhì)量來說 , 提高采樣率并無多大改善 , 但對音樂一類信號來說 , 其質(zhì)量卻有很大提高。

G.722編譯碼系統(tǒng)采用自帶自適應(yīng)差分脈沖編碼調(diào)制技術(shù),把頻帶分成兩個等帶寬的子代分別是高頻子帶和低頻子帶。在每個等帶寬的子帶中的信號都用ADPCM進行編碼。

4.G.722 SB-ADPCM編譯碼器

為了適應(yīng)可視電話會議日益增長的迫切需要 ,1988年CITT 為此制定了G.722 推薦標準, 叫做 數(shù)據(jù)率為 64kb/s 的 7KHz 聲音信號編碼—— 7kHz Audio-coding with 64kb/s。這個標準把話音信號的質(zhì)量由電話質(zhì)量提高到AM 無線電廣播質(zhì)量, 而其數(shù)據(jù)傳輸率仍保持為 64kb/s 。

寬帶話音是指帶寬在 (50~7000)Hz的話音 , 這種話音在可懂度和自然度方面都比帶寬為 (300~3400)Hz 的話音有明顯的提高, 也更容易識別對方的說話人。

5. 線性預(yù)測編碼(LPC)

線性預(yù)測編碼是一種非常重要的編碼方法。從原理上講 ,LPC 是通過話音波形來產(chǎn)生聲道激勵和轉(zhuǎn)移函數(shù)的參數(shù),對聲音波形的編碼實際就轉(zhuǎn)化為對這些參數(shù)的編碼,這就使聲音的數(shù)據(jù)量大大減少。在接收端使用 LPC 得到的參數(shù) , 通過話音合成器重構(gòu)話音。

合成器實際上是一個離散的隨時間變化的時變線性濾波器,它代表人的話音生成系統(tǒng)模型 。時變線性濾波器既當(dāng)作預(yù)測器使用 , 又當(dāng)作合成器使用。話音波形時 , 主要是當(dāng)作預(yù)測器使用。隨著話音波形的變化,周期性地使模型地參數(shù)和激勵條件適合新的要求。

多媒體前景及展望

多媒體技術(shù)應(yīng)用的前景

家庭教育和個人娛樂是目前國際多媒體市場的主流

內(nèi)容演示和管理信息系統(tǒng)是多媒體技術(shù)應(yīng)用的重要方面

·多媒體通信和分布式多媒體系統(tǒng)是多媒體技術(shù)今后的發(fā)展方向

多媒體技術(shù)應(yīng)用發(fā)展方向:

一是計算機系統(tǒng)本身的多媒體化;

二是多媒體技術(shù)與點播電視、智能化家電、識別網(wǎng)絡(luò)通信等技術(shù)互相結(jié)合,使多媒體技術(shù)進入教育、咨詢、娛樂。企業(yè)管理和辦公室自動化等領(lǐng)域;

三是多媒體技術(shù)與控制技術(shù)相互滲透,進入工業(yè)自動化測控等領(lǐng)域。

總結(jié)

真正的多媒體技術(shù)所涉及的對象是計算機技術(shù)的產(chǎn)物,而其他的單純事物,如電影、電視、音響等,均不屬于多媒體技術(shù)的范疇。本文以聲音編碼技術(shù)為例,詳細介紹實際生活中有關(guān)多媒體技術(shù)應(yīng)用的相關(guān)知識及對多媒體技術(shù)應(yīng)用未來發(fā)展前景作了簡單的分析.

鎖相環(huán)相關(guān)文章:鎖相環(huán)原理


評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉