新聞中心

EEPW首頁 > 專題 > FPGA及IP在邊緣智能中的機會

FPGA及IP在邊緣智能中的機會

作者:Bob Siller 時間:2020-03-30 來源:電子產(chǎn)品世界 收藏

  Bob?Siller?(Achronix公司?產(chǎn)品營銷總監(jiān))

本文引用地址:http://m.butianyuan.cn/article/202003/411456.htm

  1 助力

  多種應用需要不斷加速,包括:視頻、圖像和語音識別;數(shù)據(jù)壓縮;加密與解密;自然語言處理;工業(yè)物聯(lián)網(wǎng);汽車駕駛員輔助系統(tǒng);低延遲邊緣推理;智能網(wǎng)卡和服務器加速。

微信截圖_20200403140827.png

  在這些應用中,我們看到對性能的需求日益增長,從而產(chǎn)生了許多全新的、創(chuàng)新的系統(tǒng)架構。業(yè)界對硬件加速平臺的需求不斷增加,以釋放CPU周期,從而提供更好的系統(tǒng)總體擁有成本。微軟、谷歌、亞馬遜、蘋果和特斯拉等終端設備制造商已開始為其特定的應用工作負載開發(fā)自己的ASIC芯片,以推動不斷增強的產(chǎn)品差異化和競爭優(yōu)勢。這促使半導體產(chǎn)品作為技術的關鍵驅動力而得到復興,特別是對于Achronix而言,越來越多的客戶正在尋找,以幫助盡快提供創(chuàng)新的AI功能。

  2 解決開發(fā)AI的挑戰(zhàn)

  開發(fā)人員在開發(fā)AI方案時,面臨2個關鍵挑戰(zhàn):

  ①硬件平臺如何跟上全新的AI軟件算法和不斷變化的工作負載的創(chuàng)新速度?

 ?、谟布圃焐倘绾卫靡粋€硬件平臺來平衡計算、存儲和I/O性能,以獲得最大的使用性能?

  Achronix的Speedster7t 器件和SpeedcoreeFPGA IP解決方案可以通過多種方式幫助應對這些挑戰(zhàn)。

  FPGA從本質(zhì)上是可重編程的,但直到最近幾年,它們才被主要用于網(wǎng)絡加速和預處理任務。隨著FPGA已經(jīng)變得功能越來越強大,它們現(xiàn)在也作為CPU的協(xié)處理器和硬件加速器被用于核心應用功能中。

  FPGA協(xié)處理器支持系統(tǒng)架構師去將性能關鍵功能轉移到專用硬件器件上。通過卸載這些功能,設計人員可以看到整體應用性能的顯著提高。隨之而來的其他好處是,當AI工作負載或算法最終發(fā)生改變時,設計人員只需在現(xiàn)場對FPGA進行重新編程,即可更新算法并提供更高的性能。相比傳統(tǒng)的ASIC,可以縮短產(chǎn)品上市時間、延長產(chǎn)品生命周期,從而最大限度地利用硬件投資。eFPGA IP為那些努力設計出完美AI架構的ASIC設計人員提供了令人信服的優(yōu)勢?,F(xiàn)實的情況是沒有完美的架構,最佳的架構取決于所分配到的工作負載。

  eFPGA IP被嵌入在ASIC中,因而盡管ASIC架構是固定的,但是將關鍵算法卸載到器件的eFPGA部分,就可以在硬件平臺的整個生命周期中進行持續(xù)的更新并提高性能。這可以延長生命周期,并為類似于使用獨立FPGA的新功能提供更快的上市時間,而無需其他分立器件來支持。與連接到分立FPGA解決方案的ASIC相比,集成在同一個芯片上,使設計人員可以節(jié)省高達90%的成本,降低75%的功耗,并增加10倍的帶寬。

  Achronix是唯一一家在批量應用中可同時提供經(jīng)過驗證的FPGA和eFPGA IP解決方案的公司。Speedster7tFPGA具有平衡的架構,結合了諸如112 Gbps SerDes、PCIe Gen5和400 Gbps以太網(wǎng)接口等非常高速的I/O接口。 

  在將數(shù)據(jù)傳輸?shù)絊peedster7t之后,一種特有的片上網(wǎng)絡(NoC)架構支持這些數(shù)據(jù)以高達2 GHz的雙向速度在FPGA邏輯陣列中進行傳輸。與傳統(tǒng)的FPGA相比,NoC可以實現(xiàn)在FPGA架構中更快的數(shù)據(jù)傳輸速度,從而進一步減少路由擁塞并提高系統(tǒng)性能。新的機器學習處理器(MLP)單元模塊也被添加到其中,也提高了在AI應用中被經(jīng)常使用的數(shù)學乘法和累加函數(shù)的性能。Speedster7t FPGA器件中的MLP是可配置的,以支持諸如整數(shù)、浮點和塊浮點等多種不同的數(shù)字格式,從而可以在較低的數(shù)據(jù)規(guī)模要求下實現(xiàn)更高的性能。

  最后,擁有足夠的內(nèi)存帶寬是幫助AI應用實現(xiàn)高性能的另一個關鍵要素。Speedster7t FPGA配備8個GDDR6內(nèi)存接口,總帶寬可達4 Tbps。這有助于支持在人AI應用中存儲系數(shù)和其他數(shù)據(jù)密集型操作及工作負載。

  把所有這些元素相結合,就為AI工作負載提供了令人信服的解決方案。Achronix提供了獨特、靈活的FPGA或eFPGA架構,以及帶寬優(yōu)化的I/O、計算和存儲性能,這是未來AI應用的理想選擇。




評論


相關推薦

技術專區(qū)

關閉