降低顯示功耗來延長移動電池壽命
有許多因素會影響器件的功效,功效可以用電池兩次充電之間可用小時(shí)數(shù)來衡量。在如今這個高清移動屏?xí)r代,電池耗費(fèi)最大的主要因素有兩個——顯示器亮度和視頻與圖形子系統(tǒng)的功耗。在這篇文章中,我們將討論后者——系統(tǒng)級芯片中的智能視頻和顯示流水線(Display Pipeline)。智能,意味著提供與競爭性解決方案類似的性能,但要求低得多的功耗。
本文引用地址:http://m.butianyuan.cn/article/201610/307398.htm視頻與圖形子系統(tǒng)面臨的挑戰(zhàn)
現(xiàn)代圖形SoC要求以高幀速率渲染高分辨率圖像,并且在此基礎(chǔ)之上執(zhí)行多個圖像后處理任務(wù),如縮放、旋轉(zhuǎn)、像素格式轉(zhuǎn)換等等。應(yīng)對這種挑戰(zhàn)的典型方法是采用圖形處理單元(GPU),然而,由于其通用性架構(gòu),在具體顯示處理操作期間的功效并不是最優(yōu)的。
針對這種情況,Evatronix公司開發(fā)出了PANTA DP IP內(nèi)核——系列顯示處理器,旨在從GPU接管這些特殊顯示任務(wù),進(jìn)而顯著降低功耗。PANTA處理器專門針對一些執(zhí)行任務(wù)進(jìn)行了優(yōu)化,如多層組合、YUVRGB轉(zhuǎn)換、旋轉(zhuǎn)、阿爾法混合、伽瑪校正以及在將幀緩沖內(nèi)容提交給顯示器之前的其它任務(wù)。這樣可以通過部分或全部卸載GPU任務(wù)而顯著降低總的SoC動態(tài)功耗。由于通過減少對視頻和圖形幀緩沖器的訪問次數(shù)而保留了最小的系統(tǒng)內(nèi)存帶寬,因此可以進(jìn)一步降低PANTA DP輔助SoC的功耗。
增強(qiáng)現(xiàn)有架構(gòu)
我們以一個處理多個顯示器輸出的GPU處理顯示流水線為例。該系統(tǒng)要在兩個具有不同分辨率的屏幕上顯示圖形幀——外部全高清(1920x1080像素)和本地高清(1280x720像素)顯示器。每個幀由3個層組成。第一層是由以前設(shè)備相機(jī)記錄的經(jīng)過譯碼的全高清視頻。這個幀以YUV 4:2:0格式存儲在幀緩沖器內(nèi)。另外兩層是音量控制和記錄速率,由GPU以RGB格式產(chǎn)生。在組合層可以被顯示之前必須執(zhí)行許多操作,包括YUV到RGB視頻層轉(zhuǎn)換、三幀阿爾法混合、縮放和旋轉(zhuǎn)。在如圖1所示的系統(tǒng)中,顯示控制器只需傳送幀緩沖器中由GPU準(zhǔn)備好的最終數(shù)據(jù)。
圖1:典型的多顯示器系統(tǒng)。
在這個案例中,能量被GPU中執(zhí)行的特殊顯示任務(wù)浪費(fèi)了,而GPU專門針對執(zhí)行不同圖形運(yùn)算操作——本例中是2D圖形渲染進(jìn)行過優(yōu)化。
為了提高能效,可以使用PANTA系列元件。圖2顯示了一個圖形子系統(tǒng)架構(gòu)例子,其中使用了兩個配置有PANTA CP20縮放協(xié)處理器的PANTA DP30顯示處理器。在這個例子中,GPU只負(fù)責(zé)渲染圖形層像素,并將結(jié)果發(fā)送到幀緩沖器。因此GPU任務(wù)量得到了很大程度地卸載,因?yàn)閅UV到RGB轉(zhuǎn)換、阿爾法混合、縮放和旋轉(zhuǎn)交給了PANTA DP30和PANTA CP20單元來完成。
圖2:采用PANTA元件的多顯示器子系統(tǒng)。
在這個系統(tǒng)中,由PANTA DP30轉(zhuǎn)換到RGB格式的視頻層會與其它圖形層組合在一起,并在外部屏幕上直接顯示。與此同時(shí),組合幀被PANTA CP20模塊從1080p縮小到720p,并返回到幀緩沖器。第2個PANTA顯示處理器取回縮小后的幀并旋轉(zhuǎn)90度,然后將它發(fā)送給本地顯示器。由于PANTA IP的縮放和旋轉(zhuǎn)功能,這兩個額外操作不需要在GPU中執(zhí)行,因此圖形子系統(tǒng)中的總體功耗會有顯著降低。另外,由于幀緩沖器中存儲的圖形數(shù)據(jù)大小取決于幀分辨率和格式,因此與圖1所示的典型多顯示器解決方案相比,PANTA元件的使用可以將系統(tǒng)內(nèi)存帶寬最多減少40%。在這個用例中描述并用40nm LP工藝實(shí)現(xiàn)的PANTA元件總功耗不到30mW。
PANTA顯示處理器還能降低更多的功耗。在有些情況下,所有視頻和圖形處理任務(wù)都可以由PANTA元件執(zhí)行,因而允許完全關(guān)閉GPU。圖3顯示了一種用例,其中PANTA IP顯示由視頻譯碼器傳送至幀緩沖器的譯碼視頻。這樣的數(shù)據(jù)流只要求旋轉(zhuǎn)以及YUV至RGB轉(zhuǎn)換,因此完全不需要GPU參與。在這種情況下,采用40nm LP工藝實(shí)現(xiàn)的PANTA DP30功耗不會超過6mW。
圖3:沒有GPU的PANTA DP輔助顯示子系統(tǒng)。
小結(jié)
因?yàn)槿S游戲和高清視頻回放正在成為移動設(shè)備的基本功能,因此上述視頻流水線在SoC等級得到功耗最優(yōu)化非常重要。用戶期望智能手機(jī)和平板電腦能夠提供超長電池壽命,在多媒體應(yīng)用期間也不例外。
Evatronix PANTA處理器可以在不犧牲任何性能的前提下幫助用戶提高顯示子系統(tǒng)的功效,這要?dú)w功于代替GPU執(zhí)行特殊顯示任務(wù)、最大限度減少視頻/圖形子系統(tǒng)內(nèi)存帶寬的內(nèi)部IP。
評論