PC北橋端高速采集存儲系統(tǒng)研究

作者：時間：2011-07-19 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

系統(tǒng)與橋

本文引用地址：http://m.butianyuan.cn/article/187432.htm

　　透明橋系統(tǒng)是指整個系統(tǒng)中只含一個主機設備，其余所有設備都是以端點設備的形式出現(xiàn)。所有下游設備不能自發(fā)進行數(shù)據(jù)傳輸，只有在上位機引導下進行數(shù)據(jù)傳輸。采集卡可以通過DMA等方式將數(shù)據(jù)傳輸?shù)缴衔粰C的內(nèi)存中的某個區(qū)域，然后再將內(nèi)存中的數(shù)據(jù)存儲到磁盤陣列中。由于存儲和讀取同一塊內(nèi)存，因此在軟件上可以多開辟幾塊內(nèi)存，利用多線程規(guī)避系統(tǒng)順序執(zhí)行所帶來的延遲，提高傳輸和存儲的速度。

　　圖3 基于PCI-E Switch的非透明橋系統(tǒng)

　　PEX8616提供非透明橋，非透明端口保持處理器的電氣及邏輯隔離,可以防止主機列舉端口后面的設備,從而隔離其后的處理器及內(nèi)存空間。非透明端口允許打開窗口以交換數(shù)據(jù)，通過地址轉換,數(shù)據(jù)從端口的一側中傳輸另外一側。每個處理器把非透明端口的另一端當作一個下游設備，并把它映射到自己的地址空間。利用非透明端口的地址翻譯能力,處理器之間可以通過PCI-E總線進行通信。因此系統(tǒng)構建可以考慮引入非透明橋，在上位機存在的情況下，讓采集卡或者存儲卡也作為一個主機端，數(shù)據(jù)在采集存儲過程中可以直接繞開PC主機進行，當數(shù)據(jù)進行反演時，上位機再作為上游，對磁盤陣列進行操作和控制。

　　圖3為一種非透明橋的系統(tǒng)，其中包含兩個Host Bridge和PCI-E Root Complex，其中本地設備系統(tǒng)中的Root Complex連接到PCI-E Switch的一個NT端口上，從而在主系統(tǒng)的PCI結構中把它作為一個下游設備。PCI-E Switch連接兩個獨立的處理器域，本地設備的資源和地址對主系統(tǒng)是不可見的。允許本地處理器獨立地配置和控制其子系統(tǒng)。主系統(tǒng)和本地系統(tǒng)的時鐘完全獨立。主系統(tǒng)和本地系統(tǒng)的地址完全獨立，在主系統(tǒng)和本地系統(tǒng)之間可以進行地址翻譯。增加了隔離主系統(tǒng)、本地系統(tǒng)總線之間地址域的功能。

　　在構建采集存儲系統(tǒng)的過程中可以將采集模塊或者存儲模塊以構建本地系統(tǒng)的方式實現(xiàn)，從而可以在采集數(shù)據(jù)后直接對數(shù)據(jù)進行預處理然后再送到PCI-E總線進行存儲或者可以在存儲之后直接在本地系統(tǒng)進行回放或者提供網(wǎng)口訪問存儲數(shù)據(jù)等功能。

　　采集存儲系統(tǒng)的實現(xiàn)

　　系統(tǒng)結構

　　系統(tǒng)由PC主機、PCI-E Switch背板、采集卡和RAID存儲卡組成。在完成背板設計后，先利用一塊PEX8311接口芯片的采集卡，Rocket RAID 2680磁盤陣列卡，實現(xiàn)一種高速采集存儲的系統(tǒng)。然而因為普通的PC機箱的空間有限，如果將PCI-E Switch背板與上位機的接口直接以PCI-E金手指的形式，則當背板接入主機后，很難創(chuàng)造一個空間可以容納其他板卡插到背板上。并且由于磁盤陣列是由多個Western Digest WD3200AAJS的硬盤構成，發(fā)熱量也成為一個很顯著的問題。

　　因此本方案考慮通過引入Cable PCI-E來改善系統(tǒng)。Cable PCI-E是基于PCI-E用于服務器、臺式機和筆記本的下一代外圍總線，它具有以下的優(yōu)點：

　　• 成本較低，由于PCI-E廣泛用于各種主機;

　　• 高帶寬，Gen1 ×4 Cable的帶寬即達到1GB/s;

　　• 低延遲，300ns～700ns;

　　• 兼容性強，系統(tǒng)軟件上完全兼容PCI模式;

　　• Cable PCI-E至少由15種標準形成;

　　• 唯一可以同時應用于Chip-to-Chip、board-to-board和box-to-box的標準。

　　PCI-SIG標準組織將Cable PCI-E定義為一種基于PCI-E的基本規(guī)范的擴展，通過線纜化將PCI-E協(xié)議擴展到box-to-box應用和實現(xiàn)長距離的傳輸是產(chǎn)生Cable PCI-E標準的目的。Cable PCI-E提供一種簡單而且具有高性能的總線，方便擴展PC以及測試I/O等設備。本方案就是利用Cable PCI-E方便擴展設備的特點，將整個采集存儲系統(tǒng)完全分離到PC機箱外，最終可以獨立構建成一個機箱形成一種box-to-box的模式，使得整個系統(tǒng)的可擴展性很強，PCI-E ×4及其以下的COST采集板卡和存儲卡均可以很好的應用于本系統(tǒng)中。獨立的機箱也為磁盤陣列中的硬盤提供足夠的空間，系統(tǒng)的散熱也能得到很好的保障。

　　系統(tǒng)的結構圖如圖4所示，整個系統(tǒng)圍繞PCI-E Switch構建而成，通過兩個Cable PCI-E將系統(tǒng)的各個模塊獨立開來。由于采集卡采用的為PEX8311，故采集卡與PCI-E Switch連接的通道數(shù)為1，在后續(xù)的研究中可以升級采集的采集和接口速度從而實現(xiàn)整個系統(tǒng)的升級。磁盤陣列卡是一款消費類產(chǎn)品，Rocket RAID 2680不能提供HOST功能，因此本案構建的是一個透明橋系統(tǒng)。

　　圖4 PCI-E Switch采集存儲系統(tǒng)結構圖

　　數(shù)據(jù)的采集、傳輸和存儲

　　數(shù)據(jù)采集

　　采集板AD采用TI ADS6145芯片，采樣位數(shù)為14bit，最高采樣頻率為125Mbps。AD采集后的數(shù)據(jù)接入到Xilinx公司Spartan-3ADSP系列的FPGA芯片XC3SD3400A。因為PEX8311接口芯片可支持8位、16位、32位數(shù)據(jù)的傳輸，為了提高數(shù)據(jù)傳輸?shù)男?，同時也為了使得數(shù)據(jù)采集速率獲得相對提升。本設計中PEX8311中采用32位數(shù)據(jù)傳輸。所以在本方案FPGA數(shù)據(jù)流邏輯控制中，不僅要完成數(shù)據(jù)的緩存以及數(shù)據(jù)傳輸邏輯的控制，還要進行數(shù)據(jù)位的變換擴展，由14位數(shù)據(jù)擴展為32位數(shù)據(jù)。

　　數(shù)據(jù)傳輸和存儲

　　數(shù)據(jù)傳輸是指的從PEX8311到主機內(nèi)存的過程。本方案選擇DMA方式進行，由于PEX8311內(nèi)建兩個DMA通道。本方案使用其中的一個，DMA通道0。在安裝PLX提供的SDK以及驅動后，可以通過其提供的API開發(fā)包中的函數(shù)對PEX8311和PEX8616進行控制和訪問。一般的DMA傳輸過程是無需CPU的參與的，但是含Burst的DMA操作還是要通過CPU的參與的，與單獨的一次讀寫操作相比，Burst只需要提供一個起始地址就行了，以后的地址依次加1，而非Burst操作每次都要給出地址，以及需要中間的一些應答、等待狀態(tài)等等。如果是對地址連續(xù)的讀取，Burst效率高得多，但如果地址是跳躍的，則無法采用Burst操作。PEX8311的DMA傳輸支持Single Burst 、Burst-4LW和Infinite Burst三種突發(fā)方式，表1為三種突發(fā)方式在不同單次傳輸字節(jié)數(shù)的情況下的傳輸速度對比。

　　表1 DMA傳輸在三種突發(fā)方式下的速度對比(MB/s)

　　由表1數(shù)據(jù)可觀察出，采用后兩種突發(fā)方式進行DMA傳輸時，速度較普通DMA傳輸方式有明顯的提高，因此本方案采用Infinite Burst突發(fā)方式進行DMA傳輸，使用連續(xù)的地址，以提高DMA傳輸?shù)乃俣取?/p>

　　PLX公司SDK中提供的函數(shù)可對PEX8311和PEX8616進行一系列控制和操作，DMA通道的參數(shù)設置在打開DMA通道的時候一并完成，通過設置函數(shù)PlxPci_DeviceOpen()中的PLX_DMA_PROP結構體可以設置DMA傳輸?shù)耐话l(fā)方式、本地總線帶寬和傳輸方向等參數(shù)。在系統(tǒng)初始化過程中設置以上參數(shù)。當整個采集存儲過程完成時，則需要進行對整個工程的關閉工作，同樣是通過SDK中的函數(shù)PlxPci_DeviceClose()來關閉DMA通道。然后釋放開辟的所有內(nèi)存塊空間，并將指針賦NULL值。系統(tǒng)連續(xù)存儲的整個過程從開始到結束，雖然進行了很多個DMA傳輸?shù)牟僮鳎侵贿M行了一次DMA通道的打開和關閉，從而盡可能低的減小由于這部分時間帶來的速度影響。軟件流程如圖5所示。

　　圖5 采集存儲系統(tǒng)軟件流程圖

　　根據(jù)圖5可以觀察到系統(tǒng)引入了多線程技術，多線程技術的實現(xiàn)是通過分別創(chuàng)建兩個函數(shù)，一個控制DMA控制器進行連續(xù)的數(shù)據(jù)傳輸，另一個用于將內(nèi)存中的數(shù)據(jù)快速的存儲到磁盤陣列中，然后創(chuàng)建成為兩個線程。當準備開始進行數(shù)據(jù)傳輸?shù)臅r候，首先是設置DMA傳輸?shù)膮?shù)并打開DMA通道。在此過程中還需要申請多塊內(nèi)存空間進行緩存數(shù)據(jù)，由于使用多線程技術，因此一塊內(nèi)存空間不能同時供兩個函數(shù)同時讀寫，因此創(chuàng)建多個內(nèi)存塊，然后將兩個線程同時打開，對開辟的多個內(nèi)存塊依次進行讀寫操作，但是由于整個過程只包含一個極短的時間延遲，因此完全可以將整個讀寫內(nèi)存的過程近似的看成一個同時進行讀寫操作，因此達到提高存儲的速度的目的。

p2p機相關文章:p2p原理

新聞中心

PC北橋端高速采集存儲系統(tǒng)研究

評論

相關推薦

技術專區(qū)