基于FPGA的樂(lè)器數(shù)字接口音樂(lè)FM合成器
l 引言
本文引用地址:http://m.butianyuan.cn/article/192211.htm樂(lè)器數(shù)字接口(Musical Instraament Digital Inter一face,MIDI)是20世紀(jì)80年代初為解決電聲樂(lè)器之間的通信問(wèn)題而提出的。MIDI傳輸?shù)牟皇锹曇粜盘?hào),而是音符、控制參數(shù)等指令,它指示MIDI設(shè)備要做什么,怎么做,如演奏哪個(gè)音符、多大音量等。它們被統(tǒng)一表示成MIDI消息(MIDI Message)。傳輸時(shí)采用異步串行通信,標(biāo)準(zhǔn)通信波特率為31.25x(10.01)Kb/s[1]。
MIDI的核心技術(shù)之一是合成。合成方法主要有2種:頻率調(diào)制(Frequency Modularion,F(xiàn)M)合成和波表(wavetable)合成[2]。相對(duì)于高成本的樣本波表合成,F(xiàn)M方式對(duì)存儲(chǔ)空間要求更低,盡管音色表現(xiàn)有一定的局限性,實(shí)現(xiàn)難度較大,但在國(guó)際上仍然十分流行。目前,國(guó)內(nèi)對(duì)MIDI技術(shù)層面的研究還不多,FM合成方面也大多采用單音基頻方式,這在很大程度上制約了MIDI音樂(lè)的表現(xiàn)力。筆者論述了在FPGA上的MIDI音樂(lè)數(shù)字式FM合成方法,設(shè)計(jì)并驗(yàn)證了合成方案,合成音樂(lè)的表現(xiàn)力有了本質(zhì)上的改善,達(dá)到了預(yù)期的效果。
2 音樂(lè)合成
2.1 FM方法
FM作為音樂(lè)合成方法最早由John Chowning提出,它是用調(diào)制器發(fā)出的周期性信號(hào)(調(diào)制波)來(lái)調(diào)制另一個(gè)信號(hào)(載波)的頻率[3-4]。FM的基本表達(dá)式為
其中,A(n)為幅度包絡(luò);I(n)為調(diào)制度包絡(luò);ωm為載波角頻率,它決定了樂(lè)音的音調(diào);ωm為調(diào)制波角頻率。如調(diào)制波頻率處于亞音頻(sub-audio)段時(shí),可以聽(tīng)到像警車(chē)警報(bào)器似的音調(diào)起伏變化的聲音;而當(dāng)頻率升高到約30 Hz以上時(shí),可聽(tīng)到有邊帶頻率的新的音色。
2.2復(fù)音
合成器的復(fù)音(polyphony)涉及到它同時(shí)發(fā)出多個(gè)獨(dú)立音的能力,也叫"和弦"。復(fù)音一般以音符(note)數(shù)或聲音(voice)數(shù)來(lái)衡量或說(shuō)明,voice的數(shù)量就是復(fù)音數(shù)或和弦數(shù)。不同MIDI音樂(lè)要求的復(fù)音播放能力可能不相同,復(fù)音數(shù)越高,播放和聲的能力就越強(qiáng)。
2.3 ADSR包絡(luò)
圖1示出的ADSR包絡(luò)(ADSR envelope)[5]是許多合成器、采樣器和其他電聲樂(lè)器的重要部件。其功能是對(duì)樂(lè)器聲音的某些方面進(jìn)行調(diào)制(常常是音量)。當(dāng)樂(lè)器發(fā)聲時(shí),相關(guān)音量也隨著時(shí)間而變化。不同樂(lè)器的音量變化圖案不同。
ADSR的定義如下:
起奏(attack)時(shí)間,表示聲音由激活到達(dá)到滿音量的時(shí)間。衰減(decay)時(shí)間,表示聲音由峰值音量衰減到保持的時(shí)間。保持(sustain)時(shí)間,表示聲音衰減后到音符被釋放前的音量定常值。釋放(release)時(shí)間,表示音符終止后聲音淡出的時(shí)間。
如果把不同的ADSR包絡(luò)應(yīng)用到FM表達(dá)式中的A(n)和,(n),那么就可得到變化的頻譜,再設(shè)置合適的fc/fm值,就可得到不同的音色。
3 設(shè)計(jì)實(shí)現(xiàn)
3.1 總體結(jié)構(gòu)
在本設(shè)計(jì)中,硬件和軟件資源都得到了利用。在串口MIDI驅(qū)動(dòng)的支持下,軟件音序器Sonar6.0播放計(jì)算機(jī)里的MIDI文件,通過(guò)RS232口輸出波特率38.4 Kb/s的MIDI信號(hào),如圖2所示。全部的數(shù)字音頻合成都在FPGA內(nèi)部完成。數(shù)字音頻碼流通過(guò)12S總線方式接口到音頻DAC,最后由功放輸出。
3.2合成部分邏輯結(jié)構(gòu)
為實(shí)現(xiàn)32復(fù)音FM合成,如圖3的邏輯結(jié)構(gòu)被采用。它需要邏輯上64個(gè)振蕩器、64個(gè)ADSR包絡(luò)發(fā)生器和64個(gè)壓控放大器。這樣的邏輯結(jié)構(gòu)有大量的重復(fù)單元和模塊,直接在FPGA上實(shí)現(xiàn)會(huì)消耗很多資源,開(kāi)銷(xiāo)太大。為減少面積,采用了時(shí)分復(fù)用技術(shù)把資源消耗控制到約1/64,而宏觀上看起來(lái)卻仍然是并行的。設(shè)計(jì)中,在FPGA上構(gòu)造一個(gè)DDS(實(shí)現(xiàn)OSC)和一個(gè)ADSR包絡(luò)發(fā)生器。
3.3設(shè)計(jì)結(jié)構(gòu)
FPGA上的主要模塊設(shè)計(jì)結(jié)構(gòu)如圖4所示,描述方式為VHDL[6],LPM和原理圖。
MIDI UART即通用異步收發(fā)器,用來(lái)把異步串行方式的MIDI信號(hào)轉(zhuǎn)換為MIDI字節(jié)。
消息檢測(cè)模塊檢測(cè)MIDI字節(jié)的有效性,并提取預(yù)定義的MIDI消息。在本設(shè)計(jì)中,使用了音符開(kāi)和音符關(guān)2種消息(力度為0的音符開(kāi)消息等于音符關(guān))。
聲音分配器是實(shí)現(xiàn)復(fù)音合成的重要模塊。作為關(guān)鍵技術(shù)之一一,它負(fù)責(zé)音的動(dòng)態(tài)分配,當(dāng)有新的音需要?jiǎng)?chuàng)建而沒(méi)有空閑可用時(shí),直接丟棄該音符(丟音時(shí)會(huì)被汁數(shù)器記錄),如有空閑可用時(shí)則注冊(cè)到寄存器里;當(dāng)要關(guān)閉音時(shí)查找對(duì)應(yīng)位值并改寫(xiě)標(biāo)志位。32個(gè)聲音的值和占用情況被存儲(chǔ)在寄存器中,其音符值和開(kāi)關(guān)值在時(shí)分復(fù)用的各時(shí)隙被輸出。音符供后級(jí)查表得出頻率,開(kāi)關(guān)則用來(lái)觸發(fā)ADSR包絡(luò)發(fā)生器。另一方面,包絡(luò)發(fā)生器反饋回來(lái)的聲音狀態(tài)又決定哪個(gè)復(fù)音需要被終結(jié)并使之空閑(釋放復(fù)音資源)。
音符頻率表模塊查表得出哪個(gè)音符對(duì)應(yīng)的頻率是多少,以LPM方式實(shí)現(xiàn)。按照十二平均率音程關(guān)系,聲音每升高8度,頻率提高一倍,則相鄰音階的頻率比值為。以國(guó)際標(biāo)準(zhǔn)A音(440Hz)為基準(zhǔn),它在MIDI消息中音符值為69(0x45),則音符值為Ⅳ所對(duì)應(yīng)的頻率為
相位累加器模塊對(duì)頻率進(jìn)行線性累加后得到在一個(gè)周期內(nèi)的相位值。它配合正弦表模塊實(shí)現(xiàn)DDS。一其中包含64個(gè)寄存器,分別存儲(chǔ)64個(gè)相位,并進(jìn)行時(shí)分復(fù)用以實(shí)現(xiàn)FM與復(fù)音。
相位調(diào)制器對(duì)2個(gè)輸入求和并映射回一個(gè)周期內(nèi)實(shí)現(xiàn)間接調(diào)頻。
ADSR發(fā)生器模塊根據(jù)參數(shù)控制器和觸發(fā)器輸入產(chǎn)生64個(gè)包絡(luò),在調(diào)制波和載波的相應(yīng)采樣時(shí)刻輸出,以調(diào)制正弦表的輸出幅度。
正弦表模塊存儲(chǔ)正弦波表,把相位映射到幅度。作為關(guān)鍵技術(shù)之一,它與相位累加器和相位調(diào)制器組成了帶相位調(diào)制能力的DDS。本設(shè)計(jì)中,在Matlab里預(yù)先計(jì)算出正弦波從相位0~π/2的4070點(diǎn)采樣,實(shí)現(xiàn)時(shí)經(jīng)過(guò)變換,映射成為一個(gè)整周期的虛擬正弦波表,實(shí)現(xiàn)了一個(gè)正弦周期內(nèi)的16 276點(diǎn)采樣,實(shí)際占用存儲(chǔ)空間只有其1/4。本設(shè)計(jì)中音頻采樣率約為32 550 Hz,所以頻率分辨率為
FIFO模塊起延遲作用。由于時(shí)序上先生成所有32個(gè)調(diào)制波采樣點(diǎn),后生成32個(gè)載波采樣點(diǎn),所以必須進(jìn)行延遲使對(duì)應(yīng)點(diǎn)在相位調(diào)制器上適當(dāng)?shù)臅r(shí)刻相遇,即FIFO模塊對(duì)齊了載波采樣和調(diào)制波采樣。
混音與限幅模塊的作用就是把各已調(diào)單音的采樣值相加,混合為復(fù)音輸出。32個(gè)單音采樣都是16 bit的,相加后有可能溢出,于是還要進(jìn)行限幅。這里使用的是硬限幅算法。
參數(shù)控制器模塊實(shí)現(xiàn)合成參數(shù)的配置。以VHDL代碼的形式仔放不同音色的ADsR參數(shù)和fm/fc比值。本設(shè)計(jì)內(nèi)置了8種音色,2個(gè)子模塊分別存放A(n)和I(n)的參數(shù),參數(shù)部分代碼如下:
數(shù)字音頻效果用FPCA實(shí)現(xiàn)簡(jiǎn)單低音增強(qiáng)數(shù)字效果器。在Matlab 7.0中設(shè)計(jì)IIR低通濾波器,16 bif定點(diǎn)方式計(jì)算,經(jīng)低音增強(qiáng)并混音后輸出到后級(jí)。
11S總線接口模塊負(fù)責(zé)配置外部DAC。I2S(Inter-ICSound Bus)[7]是飛利浦公司為數(shù)字音頻設(shè)備之間的音頻數(shù)據(jù)傳輸而制定的一種總線標(biāo)準(zhǔn)。在飛利浦公司的I2S標(biāo)準(zhǔn)中,既規(guī)定了硬件接口規(guī)范,也規(guī)定了數(shù)字音頻數(shù)據(jù)的格式。本設(shè)計(jì)使用的是CS4334音頻專(zhuān)用DAC。合成音頻采樣率32550Hz,雙聲道16bit補(bǔ)零填充到24bit,I2S總線上輸出MCLK為12.5 MHz,SCLK為1.5625 MHz,LRCK為32.55 kHz,SDATA為串行音頻數(shù)據(jù)。
3.4系統(tǒng)特性
整個(gè)FPGA設(shè)計(jì)總共消耗邏輯單元5 000多個(gè)(約90%),存儲(chǔ)器57000多位(約60%),時(shí)鐘頻率50MHz,主要特性為雙聲道16 bit,32.55 kHz采樣率;32復(fù)音FM數(shù)字合成,實(shí)時(shí)MIDI演奏;獨(dú)立ADSR控制器;8種內(nèi)置音色參數(shù);內(nèi)置低音增強(qiáng)數(shù)字效果器。
圖5~6為聲音分配器到混音器以及I2S接口的仿真結(jié)果,聲音分配器的輸入消息為"開(kāi)啟通道0上的音符60(channel=0,note=60,on-off=1)",在收到該消息約80μs后,聲音開(kāi)始起奏,可見(jiàn)聲音合成時(shí)間遠(yuǎn)小于MIDI通信約1.5 ms的固有延遲。
以下為MIDI的合成實(shí)例,圖7為MIDI音樂(lè)在音序器軟件Sonar 6.0鋼琴卷視圖里的顯示,它指示了各個(gè)音的開(kāi)閉時(shí)間。圖8是這段MIDI音樂(lè)在FPGA上合成出的實(shí)際波形,此波形由聲卡以44.1 kHz采樣率、16 bit錄制,這里在音頻軟件Audition 2.0中顯示了其中一個(gè)聲道對(duì)應(yīng)圖7的片段。圖9為對(duì)波形的STFT分析??梢郧宄乜吹?,合成出的聲音均有豐富的諧波分量存在(主要分布在10kHz以下),且由于調(diào)制度包絡(luò)的變化頻譜也動(dòng)態(tài)變化。另外,從頻譜上看也沒(méi)有明顯的寬帶亮線存在,這說(shuō)明合成波形的相位連續(xù)性較好,在聽(tīng)感上表現(xiàn)為沒(méi)有暴音。圖10顯示了聲音起奏階段的波形,從其包絡(luò)可看到ADSR模型的實(shí)現(xiàn)也是成功的。
4 結(jié)束語(yǔ)
本設(shè)計(jì)以現(xiàn)代電聲技術(shù)為依托,在FPGA上進(jìn)行全數(shù)字音樂(lè)合成,使用了經(jīng)典的FM音樂(lè)合成算法,并成功實(shí)現(xiàn)了32復(fù)音(和弦),完成了風(fēng)琴等多種音色的模擬,聲音悅耳動(dòng)聽(tīng),音樂(lè)表現(xiàn)力強(qiáng),可應(yīng)用于伴奏、演奏、鈴音、電玩等各種場(chǎng)合,具有實(shí)用價(jià)值,同時(shí)也體現(xiàn)了FPGA開(kāi)發(fā)數(shù)字IC的優(yōu)越性和在MIDI系統(tǒng)中的靈活性。
fpga相關(guān)文章:fpga是什么
評(píng)論