GPU-前途無限光明
隨便拿起一個(gè)DIYer寫下的一份PC配置單,圖形卡(video card)往往是必不可少的部分。當(dāng)被問及為何會鐘情于獨(dú)立的圖形卡而不是選擇主板自帶的集成顯示芯片的時(shí)候,得到的答案往往驚人的一致——為了游戲。是的,人類僅僅是為了滿足自己的七情六欲,我們的PC才擁有了無比強(qiáng)大的運(yùn)算能力。甚至比起同期的圖形子系統(tǒng),PC里其他各部分都相形見絀。從R300到NV40,再到現(xiàn)在最新的G80,每一代旗艦GPU的晶體管都大大超過了同期的頂級CPU,也在挑戰(zhàn)其同時(shí)代半導(dǎo)體工藝的極限。不過,GPU正如其名字“graphics processing unit(圖形處理器)”一樣,縱然有再強(qiáng)大的運(yùn)算能力,也只能在其轉(zhuǎn)司的實(shí)時(shí)圖形渲染領(lǐng)域內(nèi)一展手腳。僅僅靠娛樂市場就支撐起NV40和G80這種怪獸級別的半導(dǎo)體芯片,這種情況讓人難以想象。不過,既然在很多特定領(lǐng)域,GPU都能提供比同時(shí)代CPU更為強(qiáng)大的處理能力,那么是否有人想過讓圖形處理器來替代CPU充當(dāng)這些程序中運(yùn)算的主角,或者是“幫助”CPU更快的完成運(yùn)算任務(wù)呢?答案是肯定的。
本文引用地址:http://m.butianyuan.cn/article/276093.htm似乎在一夜之間,GPU用于通用計(jì)算(General Purpose GPU)及其相關(guān)方面的問題成為一個(gè)十分熱門的話題。GPGPU指的是利用圖形卡來進(jìn)行一般意義上的計(jì)算,而不是單純的繪制。讓人們感到驚奇的是,在計(jì)算機(jī)圖形處理器多年巡視發(fā)展的進(jìn)程中,幾乎沒有人認(rèn)真的預(yù)言過這一重大應(yīng)用。而在今天,由于GPU具備了極高的性能和前所未有的發(fā)展速度以及普及率,使得人們對于GPU的這一新的應(yīng)用前景給予了空前高的期望和熱情。下面一些數(shù)字也許能幫助你更加深刻的了解人們?yōu)槭裁磳τ贕PU通用處理如此關(guān)注。
自誕生起,GPU就將摩爾定律的定義大大擴(kuò)展。研究表明,從1993年開始,GPU的性能以每年2.8倍的速度增長,這個(gè)數(shù)字大大超過了PC其他子系統(tǒng)的發(fā)展速度。
一塊工作頻率為3.0GHz的Pentium 4處理器,其晶體管數(shù)目為1.25億個(gè),即使算上SSE指令集的SIMD(單指令并發(fā)多數(shù)據(jù)流,這種情況是浮點(diǎn)吞運(yùn)算下吐能力的最理想狀況),也只有6GFlops的峰值浮點(diǎn)處理能力,而同期的一塊NV40 GPU就有2.22億個(gè)晶體管。峰值浮點(diǎn)運(yùn)算能力很輕易超過40GFlops。
GPU擁有自己的獨(dú)立子存儲系統(tǒng)--顯存,它擁有比系統(tǒng)主內(nèi)存高得多的帶寬。Intel曾經(jīng)為它的Pentium 4 XE系列處理器所擁有的1066MHz前端總線所提供的8.6GB/S的帶寬倍感自豪,而同期一塊普通的GeForce 6800就擁有20GB/S以上的顯存帶寬。
由上面幾點(diǎn)可以看出,因?yàn)榫邆鋸?qiáng)大的并行處理能力和極高的存儲器帶寬,GPU如果被抽象成一個(gè)“流處理器”(Stream Processor),來用于諸如科學(xué)運(yùn)算、數(shù)據(jù)分析、線性代數(shù)、流體模擬等需要大量重復(fù)的數(shù)據(jù)集運(yùn)算和密集的內(nèi)存存取的應(yīng)用程序,那么我們就能獲得一些比CPU強(qiáng)悍得多的計(jì)算能力。相比之下,CPU本質(zhì)上是一個(gè)標(biāo)量計(jì)算模型,計(jì)算單元偏少,主要針對復(fù)雜控制和低延遲而非高帶寬優(yōu)化。正是因?yàn)檫@些優(yōu)勢,使得GPU比CPU更適用于流處理計(jì)算。目前,AMD和NVIDIA兩大圖形芯片巨頭都提出了自己的GPGPU方案。
圖形處理器渲染流水線的發(fā)展歷程
評論