基于FPGA+PCI的并行計算平臺實現

——

作者：時間：2007-10-29 來源：嵌入式系統(tǒng)IC網

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

　　當前對于各種加密算法.除了有針對性的破解算法，最基本的思想就是窮舉密鑰進行匹配，通常稱為暴力破解算法。由于暴力破解算法包含密鑰個數較多，遍歷的時間超過實際可接受的范圍。如果計算速度提高到足夠快。這種遍歷的算法因結構設計簡便而具有實際應用的前景。

　　PCI總線(外設互聯(lián)總線)與傳統(tǒng)的總線標準——ISA總線(工業(yè)標準結構總線)相比，具有更高的傳輸率(132MBps)、支持32位處理器及DMA和即插即用等優(yōu)點，用于取代ISA總線而成為目前臺式計算機的事實I/O總線標準，在普通PC機和工控機上有著廣泛的應用。PCI總線為滿足在插卡和系統(tǒng)存儲器中高速傳輸數據的要求提供了很好的途徑。

　　PCI總線是一種獨立于處理器的局部總線，因此通過PCI總線插入擴展板，利用并提升普通PC機和工控機對大規(guī)模數字信號處理的運算能力和速度是一項非常具有實用意義的工作。

　　隨著數字技術日益廣泛的應用，以現場可編程門陣列(FPGA)為代表的ASIC器件得到了迅速普及和發(fā)展，器件集成度和速度都在高速增長。FPGA既具有門陣列的高邏輯密度和高可靠性，又具有可編程邏輯器件的

　　用戶可編程特性，可以減少系統(tǒng)設計和維護的風險，降低產品成本，縮短設計周期。FPGA與通用CPU相比又具有如下顯著優(yōu)點：

　　(1)FPGA一般均帶有多個加法器和移位器，特別適合多步驟算法中相同運算的并行處理。通用CPU只能提供有限的多級流水線作業(yè)。

　　(2)一塊FPGA中可以集成數個算法并行運算。通用CPU一般只能對一個算法串行處理。

　　(3)基于FPGA設計的板卡功耗小、體積小、成本低，特別適合板卡問的并聯(lián)。

　　本文介紹的基于PCI總線的FPGA計算平臺的系統(tǒng)實現：通過在PC機上插入擴展PCI卡，對算法進行針對并行運算的設計，提升普通PC機對大計算量數字信號的處理速度。本設計采用5片FPGA芯片及相關周邊芯片設計實現這一并行高速計算平臺，并在該平臺上完成了DES和MD5等算法的加密和解密。文中通過基于MD5算法設計的加密方案(仿Yahoo郵箱的密碼校驗)進行暴力破解，驗證了本系統(tǒng)的可行性以及速度快、性價比高等顯著優(yōu)點。

　　1 系統(tǒng)結構

　　系統(tǒng)利用普通PC機或工控機進行控制、數據流下載和結果采集，大計算量的數字運算利用IP-CORE技術并行地在FPGA中進行。將數字信號處理的算法設計為一個單元模塊，并根據芯片的結構對布局和布線進行優(yōu)化，該單元模塊重復利用的技術被稱為IP-CORE技術。在本系統(tǒng)中利用TP-CORE的可重復利用性，通過仲裁邏輯調度數據的分配，從而實現算法的并行處理。

　　1.1 硬件結構

　　系統(tǒng)中采用5片ALTERA公司的STRATIX EP1Sl0FPGA芯片，其中4片作為數字信號處理算法CORE的載體(文中稱為算法FPGA);l片作為連接PC機與運算CORE的橋接芯片、加載程序、并行總線裁決和中斷判決等仲裁邏輯的載體。與PCI總線的接口使用PLX公司的PCI9054芯片。系統(tǒng)硬件結構如圖l所示。

　　1.2 邏輯結構

　　BRIDGE FPGA的程序采用自頂向下的設計方法，其邏輯結構如圖2所示，按功能可分為以下部分：頂層模塊PCI_FPGA_PARALLEL;與PCI9054的接口模塊PCI接口;數據緩存及仲裁部分：數據緩存模塊FIFO、寄存器模塊regpart、數據回傳模塊deserial、內部總線仲裁和流控模塊CORE接口等。

　　PCI接口部分實現與PCI9054芯片的接口時序，使得復用的地址和數據分開，產生地址空間的選取及使能信號，便于后端處理。

　　仲裁邏輯部分：

　　(1)實現對地址空間內數據緩沖區(qū)、各種寄存器的讀寫，以及根據配置寄存器的內容對算法CORE和橋FPGA做相應的操作(配置、啟動、停止、復位等)。

　　(2)利用緩沖區(qū)及FIF0的隊列長度信號wrusedw、rdusedw、full和empty進行數據流控制。數據由PC機下載時首先進入緩沖區(qū)，每一塊算法CORE均對應一個數據下行FIFO，由FIFO當前狀態(tài)來判定是否從緩沖區(qū)中取數。具體邏輯模型如圖3所示。