新聞中心

EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 設(shè)計應(yīng)用 > RocketIO的高速串行通道設(shè)計與驗(yàn)證

RocketIO的高速串行通道設(shè)計與驗(yàn)證

作者:中國科學(xué)院光電技術(shù)研究所 吳威 蘇海冰 時間:2008-05-19 來源:《單片機(jī)與嵌入式系統(tǒng)應(yīng)用》 收藏

  引 言
 
  目前,多數(shù)計算機(jī)、處理設(shè)備和設(shè)備都采用,但隨著芯片性能不斷提升和系統(tǒng)越來越復(fù)雜,數(shù)據(jù)傳輸帶寬已成為提高系統(tǒng)性能的瓶頸。雖然增大寬度可以提高芯片與芯片之間、背板與背板之間的數(shù)據(jù)吞吐量,但是數(shù)據(jù)線的增多和傳輸速率的加快會使PCB布線的難度提高,并且增加了信號延時和時鐘相位偏移。高速串行互連技術(shù)成為提高數(shù)據(jù)傳輸帶寬的有效解決途徑。

本文引用地址:http://m.butianyuan.cn/article/82761.htm

  新的技術(shù)不斷涌現(xiàn),如新推出的標(biāo)準(zhǔn)有PCI-express、RapidI()、10Gigabit Ethernet Attachment Unit Interface(XAUI)、HyperTransport、Infini-Band、SATA等。新標(biāo)準(zhǔn)的快速發(fā)展及網(wǎng)絡(luò)與領(lǐng)域不斷增強(qiáng)的數(shù)字統(tǒng)一趨勢,對系統(tǒng)設(shè)計人員橋接這些標(biāo)準(zhǔn)和適應(yīng)不斷演化的標(biāo)準(zhǔn)提出了新的挑戰(zhàn),需要具有新一代系統(tǒng)集成和靈活性的可編程解決方案。Xilinx公司的Vir-tex-4 FX系列FPGA芯片內(nèi)置了收發(fā)器,能夠提供622 Mb/s~6.5 Gb/s的數(shù)據(jù)傳輸速率,并且支持多種高速串行協(xié)議,可以幫助設(shè)計人員方便、靈活、可靠地實(shí)現(xiàn)高速通信。

  1 設(shè)計要素

  1.1 時 鐘
 
  在Virtex-4 FX系列FPGA中每個 Multi-Gigabit Transceiver(MGT)有多個時鐘輸入。其中,參考時鐘有3種,根據(jù)不同的傳輸速率選擇不同的參考時鐘。GREFCLK適用于單個MGT組且數(shù)據(jù)傳輸率低于1 Gb/s的情況。REFCLK1和REFCLK2一般用于數(shù)據(jù)傳輸率高于1 Gb/s、低于6.5 Gb/s的情況。

  時鐘精度和時鐘抖動是評價時鐘質(zhì)量的兩個重要指標(biāo)。MGT模塊要求高精度的參考時鐘,MGT要求的時鐘精度為±350×10-6,MGT可容忍的輸入?yún)⒖紩r鐘抖動公差最大為40 ps,所以從DCM中出來的時鐘(大于±100ps)不能夠作為MGT的參考時鐘輸入。MGT的時鐘一般采用以下方案解決:從片外輸入的差分時鐘必須經(jīng)過模塊指定的差分時鐘引腳接入,然后經(jīng)過Rock-etIO模塊中的時鐘管理模塊GTllCLK_MGT轉(zhuǎn)化成單端時鐘,送到REFCLK1或REFCLK2作為MGT的參考時鐘。

  MGT模塊的輸出時鐘TXOUTCLK1、TXOUT-CLK2、RXRECCLK1、RXRECCLK2可以作為4個用戶使用的時鐘TXUSRCLK、TXUSRCLK2、RXUSRCLK、RX-USRCLK2的時鐘源;也可以作為DCM模塊的輸入,從而生成用戶所需的特定頻率的時鐘,提供給系統(tǒng)其他模塊使用。參考時鐘的頻率由串行傳輸速率和時鐘參數(shù)設(shè)置來決定。表1是該實(shí)驗(yàn)中關(guān)于時鐘參數(shù)的設(shè)置。

       

  1.2 復(fù) 位

  MGT模塊中的復(fù)位分為發(fā)送部分的復(fù)位和接收部分的復(fù)位。發(fā)送部分的復(fù)位主要包括TXPMARESET和TXPCSRESET;接收部分的復(fù)位主要包括RXPMARE-SET和RXPCSRESET。TXPMARESET復(fù)位用于復(fù)位PMA和重新初始化PMA功能。其引腳電平為高時,復(fù)位PLL控制邏輯和內(nèi)部的PMA分頻器,同時也使發(fā)送器PLL LOCK信號為低并且迫使TX PLL進(jìn)行校驗(yàn)。TXP-MARESET引腳電平為高至少要持續(xù)3個USRCLK時鐘周期。

  當(dāng)TXPCSRESET引腳電平為高時,TX PCS模塊被復(fù)位。TX PCS模塊包括:TX Fabric接口,8B/10B編碼器,10GBASE-R編碼器,TX緩沖器,64B/66B擾碼器和10GBASE-R自適應(yīng)同步器。TXPCSRESET復(fù)位與TXPMARESET復(fù)位是相互獨(dú)立,互不影響的。

  TXPCSRESET復(fù)位的要求如下:

  ①在TXPCSRESET復(fù)位時,TXUSRCLK和PCS的TXCLK時鐘必須已經(jīng)保持穩(wěn)定,以便初始化發(fā)送緩沖器。

 ?、赥XPCSRESET引腳電平為高,至少要持續(xù)3個TXUSRCLK或TXUSRCLK2時鐘周期。

 ?、墼赥XPCSRESET復(fù)位結(jié)束后,TX PCS模塊至少需要5個時鐘周期(以TXUSRCLK或TXUSRCLK2中最長的時鐘周期為準(zhǔn))來完成各個子模塊的復(fù)位。

  圖1是發(fā)送部分的復(fù)位時序圖。接收部分的復(fù)位時序圖和復(fù)位要求與接收部分類似,請參見Xilinx公司技術(shù)文檔ug076.pdf。

       

  2 MGT的模塊及原理介紹

  發(fā)送的并行數(shù)據(jù)經(jīng)過8B/10B編碼后,寫入發(fā)送端FIFO,然后轉(zhuǎn)換成串行差分?jǐn)?shù)據(jù)發(fā)送出去。接收端接收到的串行差分信號首先經(jīng)過接收端緩沖,然后經(jīng)過串并轉(zhuǎn)化器轉(zhuǎn)換成并行數(shù)據(jù),再經(jīng)過8B/10B解碼,寫入彈性緩沖,最后并行輸出。

  2.1 8B/10B編解碼器

  8B/10B編碼機(jī)制是由IBM公司開發(fā)的,已經(jīng)被廣泛采用。它是一種數(shù)值查找類型的編碼機(jī)制,可將8位的字符轉(zhuǎn)化為10位字符。轉(zhuǎn)化后的字符可以保證有足夠的跳變用于時鐘恢復(fù)。8B/10B編碼具有“0”和“1”出現(xiàn)的概率相等,直流基線漂移小,低頻分量小,功率譜帶寬較窄,抖動小,以及能夠檢測輸入數(shù)據(jù)中的錯誤等許多優(yōu)點(diǎn)。

  8B/10B編碼可以分為256個數(shù)據(jù)字符和12個控制字符。數(shù)據(jù)字符,標(biāo)為D,用于傳輸數(shù)據(jù);控制字符,標(biāo)為K,用于傳輸控制序列。12個控制字符用于對齊、控制,以及將帶寬劃分為子通道。

  2.2 comma字符檢測和對齊

  Virtex-4 RrocketIO有可編程的逗號檢測,以便于實(shí)現(xiàn)10位字符的各種通信協(xié)議和檢測,通過對MCOMMA_10B_VALUE、DEC_MCOMMA_DETECT、PCOMMA_10B_VALUE、DEC_PCOMMA_DETECT和COMMA_10B_MASK這些參數(shù)的設(shè)置,可以實(shí)現(xiàn)任意的8位或10位符號檢測。

  接收器在輸入數(shù)據(jù)流中掃描搜尋comma字符。如果找到,解串器就調(diào)整序列邊界以匹配檢測到的comma字符序列,且掃描是連續(xù)進(jìn)行的。一旦對齊確定,所有后續(xù)comma字符的對齊均已確定。在任意的序列組合里,comma字符序列必須是唯一的。常用的K字符是12個K字符中的一個或多個。由于K28.1、K28.5、K28.7這些字符的頭7位都是1100000,這種比特序列模式只可以在這些控制字符中出現(xiàn),因此,這些控制字符是非常理想的對齊序列。

  2.3 時鐘修正

  在時鐘/數(shù)據(jù)恢復(fù)電路的作用下,從接收的串行數(shù)據(jù)流中解出時鐘的頻率和相位,一般將它的20分頻時鐘作為恢復(fù)時鐘。在恢復(fù)時鐘作用下從串行數(shù)據(jù)經(jīng)過解串器產(chǎn)生并行數(shù)據(jù)作為8B/10B譯碼的輸入,譯碼后的數(shù)據(jù)進(jìn)入16×52位的接收緩沖器。輸入緩沖器的輸人數(shù)據(jù)速率是由PCS RXCLK的頻率決定的,而從緩沖器讀取端輸出的數(shù)據(jù)速率是由RXUSRCLK的頻率決定的。由于兩個時鐘會有差異,所以需要進(jìn)行時鐘修正。

  時鐘修正的基本原理是:在發(fā)送端,當(dāng)數(shù)據(jù)發(fā)送了一定的字節(jié)或數(shù)個數(shù)據(jù)包后,通過插入和發(fā)送一些特定的字節(jié)修正字符;在接收端,當(dāng)接收到這些字符后會自動地丟棄或者重復(fù)來補(bǔ)償時鐘的差異。時鐘修正的核心工作是在比特流中搜尋特定的字符序列。

  3 MGT的測試與驗(yàn)證

  本實(shí)驗(yàn)是在XilinX公司的ML405評估板上進(jìn)行的,使用2個MGT。其中,MGT1用來發(fā)送數(shù)據(jù)(通過mgt1_tx_n和mgt1_tx_p這對差分線),MGT0用于接收數(shù)據(jù)(通過mgt0_tx_n和mgt0_tx_p這對差分線)。使用串行ATA電纜(長約100 cm)將它們連接起來形成一個大環(huán)路,進(jìn)行數(shù)據(jù)讀回測試。MGT驗(yàn)證實(shí)驗(yàn)的硬件框圖如圖2所示。

        

  其中,gtll_init_tx模塊產(chǎn)生tx—pmareset、tx_pcsreset復(fù)位信號以及frame—gen模塊的復(fù)位信號;frame—gen模塊產(chǎn)生帶有comma字符的數(shù)據(jù)流,每次發(fā)送的數(shù)據(jù)位寬為32位;gtll_init_rx模塊產(chǎn)生rx_pmareset、rx_pcsreset復(fù)位信號以及frame_check模塊的復(fù)位信號;frame_check模塊用來將發(fā)送的數(shù)據(jù)與實(shí)際接收到的來自于MGT0的并行輸出端口的數(shù)據(jù)進(jìn)行比較,如果檢測到不一致,則frame_check模塊的ERR_COUNT計數(shù)器就加1,通過讀取該計數(shù)器的值和記錄MGT工作的時間就可以計算出該系統(tǒng)中MGT的錯誤率。

  假設(shè)MGT的錯誤率為δ,MGT的數(shù)據(jù)傳輸率為μ,MGT傳輸數(shù)據(jù)的有效時間為τ,ERR_COUNT計數(shù)器的計數(shù)值為E,則有:

        

  實(shí)驗(yàn)中測得,E=319,τ=3 600s,μ=3 Gb/s。將上述數(shù)值代入式(1),求得δ=2.957×10-11。通過取不同的時間τ,每個τ對應(yīng)做多次實(shí)驗(yàn),可以得到δ的范圍為[2.752×10-11,3.168×10-11]。通過該實(shí)驗(yàn)可以發(fā)現(xiàn)具M(jìn)GT的可靠性比較高,可以滿足我們的工程需求,具有很高的實(shí)際使用價值。

  結(jié) 語

  目前,系統(tǒng)對數(shù)據(jù)傳輸率的要求越來越高,高速串行互連技術(shù)由于將時鐘與數(shù)據(jù)合并進(jìn)行傳輸,從而解決了高速并行數(shù)據(jù)傳輸過程中時鐘和數(shù)據(jù)的抖動問題,提高了數(shù)據(jù)傳輸速率,降低了設(shè)計復(fù)雜性和成本,減少了引腳數(shù)量和PC板面積。Xilinx公司的Virtex-4 FX系列FPGA器件中所提供的用于實(shí)現(xiàn)高速串行互連的RocketIO IP核,具有使用方便、配置靈活、集成度高等優(yōu)點(diǎn),將它用于解決高速串行數(shù)據(jù)傳輸問題,既簡化了設(shè)計,又提高了系統(tǒng)的集成度和可靠性,有很好的應(yīng)用前景。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
分頻器相關(guān)文章:分頻器原理


評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉