新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > TMS320C6000系列DSP的軟件優(yōu)化

TMS320C6000系列DSP的軟件優(yōu)化

作者: 時間:2012-06-20 來源:網(wǎng)絡(luò) 收藏

1 系統(tǒng)的流程

本文引用地址:http://m.butianyuan.cn/article/257422.htm

系統(tǒng)的流程如圖1所示。整個工作流程分為3個階段:


第1階段,直接根據(jù)需要用高級C語言實現(xiàn)功能,測試代碼的正確性。然后,移植到C6X平臺,利用C6X開發(fā)環(huán)境Profile測試程序的運行時間。若不滿足要求,則進(jìn)入下一階段。

第2階段,利用C6X提供的優(yōu)化方式和其他各種優(yōu)化技巧,如使用不同的編譯器選項使能軟件流水,循環(huán)展開,字存取代替半字存取等,優(yōu)化C語言代碼。如果還不能滿足要求,則進(jìn)入第3階段。

第3階段,將C語言代碼中耗時最長的部分抽取出來,用線性匯編語言重寫,用匯編優(yōu)化器進(jìn)行優(yōu)化。使用profile確定這段代碼是否需要進(jìn)一步優(yōu)化。


2 優(yōu)化過程

首先,用C語言編寫程序,并通過編譯驗證其正確性。然后,使用內(nèi)聯(lián)函數(shù)和合適的優(yōu)化選項進(jìn)行優(yōu)化,并通過CCS中的profiler確定是否有函數(shù)需要被進(jìn)一步優(yōu)化,使用線性匯編語言重寫需要被優(yōu)化的函數(shù)。最后,使用匯編優(yōu)化編程技巧和匯編優(yōu)化器優(yōu)化匯編代碼。

2.1 編譯器

當(dāng)優(yōu)化器被激活時,將完成圖2所示的過程。C/C++語言源代碼首先通過一個完成預(yù)處理的解析器(Parser),生成一個中間文件(.if)作為優(yōu)化器(Optimizer)的輸入。優(yōu)化器生成一個優(yōu)化文件(.opt),這個文件作為完成進(jìn)一步優(yōu)化的代碼生成器(Code generator)的輸入,最終生成匯編文件(.asm)。當(dāng)選擇編譯選項時,-o2和-o3將盡可能地優(yōu)化軟件。

2.2 編譯器內(nèi)聯(lián)函數(shù)

TMS320C6X提供了很多內(nèi)聯(lián)函數(shù),它們直接映射為內(nèi)嵌C6X匯編指令的特殊函數(shù),這樣可迅速優(yōu)化C語言代碼。C編譯器以內(nèi)聯(lián)函數(shù)的形式支持所有C語言代碼不易表達(dá)的指令。內(nèi)聯(lián)函數(shù)用下劃線_開頭,如例2,使用時如同調(diào)用普通函數(shù)一樣。下面結(jié)合實例,研究一下完成200點點積經(jīng)過上述各種優(yōu)化技術(shù)優(yōu)化后的代碼效率。完成200點的點積運算C語言代碼程序dotp.c如下:

3 線性匯編代碼的優(yōu)化

優(yōu)化線性匯編代碼,首先是盡可能地使指令并行,使得同一時間內(nèi)多個功能單元同時被使用,然后是調(diào)整代碼順序,縮減等待時延(NOPS),如例5。接下來使用字訪問short型數(shù)據(jù),如例6,最后使用軟件流水技術(shù)。當(dāng)進(jìn)行實際操作時,并不是要按順序地完成上面的每一步。只要達(dá)到要求,就可以結(jié)束。

3.1 C語言代碼轉(zhuǎn)換到線性匯編代碼

定點點積中,C語言代碼內(nèi)部循環(huán)使用線性匯編指令,如例3所示。

3.2 線性匯編的資源分配

①裝載指令(LDW)必須使用.D單元。
②乘法指令(MPY和MPYH)必須使用.M單元。
③加法指令(ADD)使用.L單元。
④減法指令(SUB)使用.S單元。
⑤跳轉(zhuǎn)指令(B)使用.S單元。

由此得到例4的匯編代碼。

完成200次循環(huán)迭代,經(jīng)過profile clock分析循環(huán)部分,需要16×200=3200 cycles。 3.3 使用并行指令完成點積代碼


上一頁 1 2 下一頁

關(guān)鍵詞: TMS320C6000 DSP 軟件優(yōu)化

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉