新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 硬核浮點DSP的FPGA或取代高性能計算GPGPU

硬核浮點DSP的FPGA或取代高性能計算GPGPU

作者: 時間:2014-07-04 來源:華強電子網(wǎng) 收藏
編者按:Altera公司推出業(yè)界首款浮點FPGA,在高性能計算方面具有突出優(yōu)勢。它與GPGPU都可以使用OpenCL進行設計,但在算法實現(xiàn)上有很大的不同。

  近來,Altera公司推出業(yè)界首款浮點,它集成了硬核IEEE754兼容浮點運算功能,提高了性能、設計人員的效能和邏輯效率。據(jù)悉,硬核浮點模塊集成在Altera20nmArria10和SoC中,以及14nmStratix10和SoC中。該新功能支持設計人員以相同的定點性能和效率在浮點中實現(xiàn)其算法,且不會對功耗、面積或者密度產(chǎn)生任何影響,也不會損失定點特性或功能。用戶可以使用Altera的FPGA和SoC來滿足大計算量應用需求,例如應用在高性能計算(HPC)、雷達、科學和醫(yī)療成像等領(lǐng)域。

本文引用地址:http://m.butianyuan.cn/article/249251.htm

  精度可調(diào)體系結(jié)構(gòu)

  “出色的性能歸功于我們創(chuàng)新的精度可調(diào)DSP體系結(jié)構(gòu)(圖)。”Altera公司首席DSP產(chǎn)品規(guī)劃經(jīng)理MichaelParker表示,“該技術(shù)在每一DSP模塊中包含了一個高精度加法器和單精度乘法器。這些硬核DSP模塊中內(nèi)置了數(shù)千個浮點運算器,在20nm系列中,Arria10FPGA性能從140GigaFLOPS(GFLOPS)提升至1.5TeraFLOPS(TFLOPS);Altera的14nmStratix10FPGA系列將使用相同的體系結(jié)構(gòu),性能擴展到10TFLOPS。這是單個器件有史以來最高的性能指標。”

  

圖:具有硬核浮點DSP模塊的首款FPGA

?

  圖:具有硬核浮點DSP模塊的首款FPGA

  該浮點計算單元與現(xiàn)有精度可調(diào)定點模式實現(xiàn)了無縫集成。設計人員可以在其設計中使用所有定點DSP處理特性,還可以根據(jù)需要將全部設計或者部分設計更新到單精度浮點。IEEE754浮點所有復數(shù)都位于DSP模塊的硬核邏輯中,不占用可編程邏輯,即使是100%使用了DSP模塊,浮點也支持定點設計中相似的時鐘速率。

  大幅縮短開發(fā)時間

  MichaelParker稱,自然支持浮點功能對于設計人員在FPGA中實現(xiàn)復雜的高性能算法非常重要。構(gòu)建系統(tǒng)之前,在浮點中完成所有算法開發(fā)和仿真。完成算法后,通常還需要6~12個月的時間在定點實現(xiàn)中進行分析、轉(zhuǎn)換并驗證浮點算法。這一過程需要克服以下三個問題:(1)必須手動將浮點設計轉(zhuǎn)換為定點,這需要工程師非常有經(jīng)驗,而且其實現(xiàn)的精度沒有仿真高;(2)如果以后對算法進行任何修改,還需要再次進行手動轉(zhuǎn)換,而且優(yōu)化系統(tǒng)中定點算法的任何步驟都不會反映在仿真中;(3)如果系統(tǒng)集成和測試過程中出現(xiàn)問題,要隔離問題會非常困難。

  使用Altera浮點FPGA能夠幫助設計人員克服上述問題,它們可以將DSP設計直接轉(zhuǎn)譯成浮點硬件,而不是轉(zhuǎn)換為定點,從而大幅縮短了時序收斂和驗證時間。相比之前的系列,硬核浮點DSP模塊能夠縮短近12個月的開發(fā)時間。

  將與GPGPU展開競爭

  據(jù)Altera方面透露,與Altera浮點FPGA競爭的并非FPGA,而是GPGPU(GENERAL.html"target="_blank">GeneralPurposeGPU,即通用圖形處理單元,它不是簡單的圖形引擎,而是通用計算加速器)。MichaelParker表示,這是因為其他FPGA供應商提供的“軟核”浮點使用邏輯來實現(xiàn)復數(shù)浮點電路的效率不高,還不具競爭力。

  FPGA和GPGPU都可以使用OpenCL進行設計,但它們在算法實現(xiàn)上有很大的不同。GPGPU使用并行處理器體系結(jié)構(gòu),并行運行數(shù)千個浮點乘加小單元。算法被分成數(shù)萬個線程,數(shù)據(jù)準備好后,映射到計算單元中。

  Altera浮點FPGA在高性能計算方面具有突出優(yōu)勢。首先,由于其流水線邏輯體系結(jié)構(gòu),數(shù)據(jù)流的處理延時要比GPGPU低得多;其次,F(xiàn)PGA的GFLOPS/W性能要優(yōu)于GPGPU,這也意味著對于所要求的功率預算,F(xiàn)PGA完成的計算量一般要多于GPGPU;第三,F(xiàn)PGA具有很好的通用性和廣泛的連通性,能夠直接放在數(shù)據(jù)通路中處理通過的數(shù)據(jù)。Altera還專門增加了數(shù)據(jù)流至其OpenCL工具的選項,以符合OpenCL供應商的擴展要求。

  Altera公司軟件和DSP產(chǎn)品市場經(jīng)理AlbertChang介紹,2014年下半年,Altera將提供面向Arria10器件中硬核浮點DSP模塊的浮點設計流程,包括演示和基準測試。在此之前,用戶可以采用Arria10FPGA開始設計,使用軟件浮點技術(shù)來實現(xiàn)浮點功能,在得到設計流程支持后,軟件工具會自動(一次重新編譯)將浮點算法無縫映射到硬核浮點運算中,而不必使用軟核邏輯。

fpga相關(guān)文章:fpga是什么




關(guān)鍵詞: DSP FPGA

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉