核心路由器中多端口線卡調(diào)度的設計與實現(xiàn)

作者：時間：2007-08-29 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

引言

　　線路接口卡是核心路由器訪問線路與訪問設備間的一種設備接口，主要實現(xiàn)路由器接口上物理層和鏈路層的功能，必須實現(xiàn)無丟包線速處理，是路由器的關鍵部件之一。線卡主要關注以下幾個方面：排隊(如FIFO、Modified Deficit Round Robin)、擁塞控制(如加權隨機早期檢測)及其它特性(如訪問列表、訪問速率、數(shù)據(jù)流統(tǒng)計)。

　　IPv6路由器系統(tǒng)結(jié)構主要由線路接口、多功能轉(zhuǎn)發(fā)處理、高速交換網(wǎng)絡、內(nèi)部通信、主控和網(wǎng)管等部分組成。ATM多端口線卡作為IPv6核心路由器的重要線路接口，需要提供8個雙向的155MbpsATM光接口，支持64個永久虛連接。多端口線卡中多路數(shù)據(jù)的合路與分路需要建立一個良好的調(diào)度機制來保證數(shù)據(jù)包的線速處理與每一路數(shù)據(jù)的公平性。本文對ATM多端口線卡輸入和輸出兩個流向上的數(shù)據(jù)包調(diào)度進行了研究，提出了一種具有一定通用性的多端口線卡調(diào)度策略的設計實現(xiàn)方案。

輸入處理流向的調(diào)度策略

　　在對多端口線卡輸入處理流向調(diào)度策略的分析中，我們以ATM多端口線卡為研究對象。ATM多端口線卡支持8個ATM155M光接口，其中每接口支持 8個永久虛連接。

ATM多端口線卡需要對64路數(shù)據(jù)進行有效的調(diào)度，實現(xiàn)Gbps的線速處理。8路共64個虛連接ATM信元經(jīng)商用芯片PMC5380完成鏈路層處理后以共享總線形式向輸入鏈路控制電路傳送；64路虛連接信元流分路緩存形成完整CPCS-PDU后合路輸出，再經(jīng)過AAL5適配處理，送到轉(zhuǎn)發(fā)處理。根據(jù)輸入處理流程，由于ATM芯片內(nèi)部的FIFO緩存容量比較小，以及AAL5的處理機制，與路由器系統(tǒng)整包處理的機制產(chǎn)生了矛盾，因此必須在輸入鏈路的控制電路內(nèi)部設置64個較大的FIFO用來緩存整包，其中每一路FIFO用于緩存一個虛連接的數(shù)據(jù)包。因此高效公平的進行8路信元讀取、分路和64個虛連接FIFO輸出數(shù)據(jù)合路處理成為了必須要解決的問題。

　　為了保證8路64個虛連接的ATM信元傳送及處理的公平性，滿足路由器整包處理的需求，提出了基于信元的公平分片輪詢調(diào)度(Cell Round Robin Scheduling；CRR)和逐包輪詢調(diào)度(Packet Round Robin Scheduling；PRR)相結(jié)合的調(diào)度策略，如圖1所示。

圖1 輸入鏈路控制電路中的調(diào)度策略

　　采取基于信元的公平分片輪詢調(diào)度主要基于三方面考慮：一是基于信元操作，符合AAL5處理的需求；二是在采用ATM方式時，PM5380內(nèi)部的 FIFO只能夠緩存4個信元，深度有限；三是固定長度包的輪詢調(diào)度，其理論研究較成熟，也較易于實現(xiàn)，相比不定長包調(diào)度可以避免更多的意外情況，能夠確保較好的性能。

　　采取逐包輪詢調(diào)度，是為了解決AAL5中信元的處理機制路由器系統(tǒng)整包處理的機制之間的矛盾。在信元輸入處理時，將信元凈荷按其所屬的虛連接在相應的虛連接FIFO中依次緩存，直到虛連接FIFO中至少有一個完整CPCS-PDU才能被讀取；在虛連接FIFO的輸出側(cè)，采用逐包輪詢調(diào)度的方式對64 個虛連接FIFO進行讀取。在輸入流向的處理中，我們通過信元凈荷在虛連接FIFO中緩存，待完整CPCS-PDU構成后再逐包輪詢調(diào)度輸出的方式解決了上述問題。

　　整個輸入調(diào)度的實現(xiàn)參照圖1，逐個輪詢調(diào)度左側(cè)PM5380內(nèi)部的8個隊列，采用分片輪詢的方式，若輪詢到某一隊列時，其隊列深度大于53個字節(jié) (信元長度)，且對應的虛連接FIFO未滿，則輸出，否則該隊列輪空，切換到下一個隊列；同時輪詢調(diào)度右邊的64個隊列，采用逐包輪詢調(diào)度的方法，在64 個虛連接FIFO的輸出側(cè)進行高速切換讀取數(shù)據(jù)。

　　ATM多端口線卡輸入處理流向的調(diào)度策略具有一定的通用性，可以根據(jù)實際的情況，對于支持的ATM接口和虛連接數(shù)量進行改變：輸入的8個信元流可根據(jù)需要支持的接口數(shù)量由ATM接口中的8個變成16個、32個甚至更多，對更多接口的輸入信元流同樣能夠采用分片輪詢調(diào)度，根據(jù)不同虛連接提取出信元凈荷在虛連接FIFO中進行緩存；而虛連接FIFO的數(shù)量也可以根據(jù)我們需要支持的虛連接數(shù)量進行改變，采用逐包輪詢調(diào)度同樣能夠支持更多的虛連接。

輸出流向的調(diào)度策略

　　在ATM多端口線卡輸出處理流向上，由高速交換網(wǎng)絡送來的數(shù)據(jù)傳送速率最高可達2.5Gbit/s，遠大于線路接口輸出速率1244Mbit/s (8155Mbit/s)。以往的解決方案對這一問題進行了回避，采用“不能處理則丟包”的方法。這樣雖然降低了實現(xiàn)的難度，但對于高速交換網(wǎng)絡滿負荷傳送數(shù)據(jù)的情況，顯得無能為力，無法滿足QoS要求和對實時業(yè)務提供支持。由此可見，緩存管理機制和調(diào)度策略在此的重要性。

我們在以往解決方案的基礎上進行了改進，提出了基于門限的調(diào)度策略(Threshold Based Scheduling Policy；TBSP)、帶有優(yōu)先級的逐包輪詢調(diào)策略(Racket Round Robinwith Priority；PPRR)、分類隨機早期探測機制(Classification Based Random Early Detection；CBRED)和公平分片輪詢調(diào)度策略(Cell Round Robin Scheduling；CRR)相結(jié)合的方案。

　　如圖2所示，圖左側(cè)是輸出緩存中數(shù)據(jù)包隊列，圖右側(cè)是本接口的8個線路接口FIFO，用于存儲去往各個線路接口的數(shù)據(jù)包，數(shù)據(jù)包隊列和線路接口 FIFO中間是調(diào)度機。根據(jù)數(shù)據(jù)包頭所帶的線路接口指示，數(shù)據(jù)包被送往相應的FIFO中。假設輸出緩存隊列隊頭的數(shù)據(jù)包要送往FIFO01，而FIFO1 已滿不讓寫入，就會發(fā)生隊頭阻塞。此時若是采取等待直到FIFO1允

許寫入，就會使后續(xù)到達的數(shù)據(jù)包丟棄，如果丟棄的數(shù)據(jù)包是去往其他線路接口，而相應的 FIFO卻并沒有滿指示，就造成了不合理丟包；若是不等待讀出并直接丟棄該包，緩存器的作用便無法充分發(fā)揮。這都將導致處理的丟包率增加和吞吐量下降。為了降低系統(tǒng)丟包率和提高吞吐量，我們提出了一種基于門限的調(diào)度策略(Threshold Based Scheduling Policy；TBSP)。TBSP原理如圖2所示，其策略描述如下：

　　(1)在輸出緩存中設置門限T；
(2)當隊列深度小于T時，若發(fā)生隊頭阻塞，數(shù)據(jù)包暫時存放在輸入緩存中；
(3)在隊列深度到達T時若隊頭對應的FIFO滿指示失效，則讀出數(shù)據(jù)包并寫入相應FIFO；
(4)當隊列深度到達T時若隊頭對應的FIFO滿指示依然有效，讀出該數(shù)據(jù)包并丟棄。

圖2 TBSP調(diào)度示意圖

　　以上只是解決了輸出緩存中數(shù)據(jù)包的輸出調(diào)度問題，而處理機過來的協(xié)議包也要經(jīng)過調(diào)度送往不同線路接口。由于協(xié)議包的速度遠遠小于數(shù)據(jù)包的速度，也小于線路接口的傳輸速度，因此不存在丟包問題。但考慮到協(xié)議包要優(yōu)先發(fā)送，我們便提出了帶有優(yōu)先級的逐包輪詢調(diào)度策略(Racket Round Robinwith Priority；PPRR)。

　　完成優(yōu)先輪詢調(diào)度的合路數(shù)據(jù)包需在隊列里進行緩存，而傳統(tǒng)的先進先出(FIFO)隊列管理使用簡單的尾丟棄策略，使得隊列長度成波浪形變化，導致路由器的吞吐量降低和通信的延遲抖動非常大。為避免這種情況發(fā)生，因此輸出緩存管理采用了分類隨機早期探測機制(Classification Based Random Early Detection；CBRED)，其原理如圖3所示。根據(jù)Diff-Serv模型的丟包策略，在多端口線卡中將所有業(yè)務根據(jù)其對包丟失率的要求分為三類，分別為低優(yōu)先級、中優(yōu)先級和高優(yōu)先級。

圖3 分類隨機早期探測(CBRED)原理示意圖

　　在輸出緩存中設立兩個門限M1、M2(M1

圖4 輸出存儲器管理機制與調(diào)度策略

　　整個輸出鏈路控制電路設計采取的存儲器管理機制和調(diào)度策略如圖4所示(隊列0表示輸入緩存中的單播數(shù)據(jù)包，隊列1表示組播數(shù)據(jù)包，隊列2表示協(xié)議包)，其描述如下：

　　(1)隊列0、隊列1或隊列2每讀出一個整包后，優(yōu)先查詢隊列2，其次是隊列0，隊列1的優(yōu)先級最低；
(2)若隊列2有整包指示且相應FIFO滿指示無效，則讀出整包并寫入相應FIFO；
(3)若隊列2有整包指示但相應FIFO滿指示有效，先查詢隊列0狀態(tài)，隊列0的包調(diào)度也采取TBSP策略，如果隊列0仍未被讀取，則查詢隊列1狀態(tài)，隊列1的包調(diào)度同樣采取TBSP策略；
(4)優(yōu)先逐包輪詢調(diào)度后的合路包在輸出緩存中進行緩存，采用分類隨機早期探測機制對緩存進行管理；
(5)輸出鏈路中的8個FIFO與商用芯片之間采用CRR調(diào)度策略。

　　在優(yōu)先逐包輪詢調(diào)度的實現(xiàn)中，我們設置了一系列的組合邏輯來完成上述的功能，如圖5所示。協(xié)議數(shù)據(jù)、單播和組播FIFO的讀取優(yōu)先級由優(yōu)先調(diào)度控制，當協(xié)議FIFO中有完整包時且對應接口FIFO未滿，則輸出該協(xié)議包，直到協(xié)議FIFO中無完整包或?qū)涌贔IFO已滿，將優(yōu)先級交給單播 FIFO；如果單播FIFO內(nèi)有完整包且對應接口FIFO未滿，則輸出一個完整的單播包；如果對應FIFO滿，則由門限設置單元提供的門限T分別與單播 FIFO內(nèi)數(shù)據(jù)深度比較，決定當查詢到單播FIFO時，是否進行讀取或丟包操作。我們采用比較器來實現(xiàn)深度的比較，比較器的輸出為3位，每一位指示一種狀態(tài)，即單播FIFO內(nèi)數(shù)據(jù)深度是大于、小于或等于門限T。如果小于T，對應的接口FIFO滿，則等待，將優(yōu)先級交給組播FIFO；如果大于或等于T，對應接口FIFO滿失效，則輸出該FIFO的一個包，將優(yōu)先級交給組播FIFO，否則丟棄當前的數(shù)據(jù)包，也將優(yōu)先級交給組播FIFO。

對組播FIFO執(zhí)行的操作與單播的情況類似，在這不再贅述。循環(huán)一圈后，優(yōu)先級又交還給協(xié)議FIFO，重新開始上述操作。TBSP門限T的設置需基于兩方面的綜合考慮：網(wǎng)絡中各種包長的分布和本模塊要求的處理時間。在實現(xiàn)中，我們使用了FPGA片內(nèi)的2塊BLOCKSelectRAM組成TBSPFIFO(TBSPFIFO的位寬為36位，深度為1000)，通過實際中多次的單板調(diào)試和系統(tǒng)聯(lián)調(diào)，并對測試結(jié)果進行分析比較后，我們把T的門限設為640，這是隊列深度為1000的時候，實際運行中的最優(yōu)值。

優(yōu)先逐包輪詢調(diào)度實現(xiàn)流程

圖5 優(yōu)先逐包輪詢調(diào)度實現(xiàn)流程

　　在分類隨機早期探測機制的具體電路實現(xiàn)中，我們根據(jù)兩級丟包門限M1、M2控制QoSFIFO的寫入操作，以保證更高優(yōu)先級包的可靠傳輸。如圖6所示，我們在對QoSF

IFO進行寫入整包的之前監(jiān)控QoSFIFO內(nèi)有效數(shù)據(jù)的長度，與門限M1、M2比較，根據(jù)比較的結(jié)果結(jié)合當前包內(nèi)部格式頭部的優(yōu)先級字段(包優(yōu)先級由轉(zhuǎn)發(fā)處理提供，并在ATM接口將8個優(yōu)先級轉(zhuǎn)化為3個丟包優(yōu)先級)，決定當前數(shù)據(jù)包是否寫入QoSFIFO。若當QoSFIFO內(nèi)緩存隊列深度不超過門限M1時，所有到達的包均寫入QoSFIFO；當緩存隊列的深度超過門限M1但不超過門限M2時，丟棄低優(yōu)先級的包，中、高優(yōu)先級的包仍寫入QoSFIFO；若一個緩存隊列的深度已超過門限M2，但緩存隊列未滿時，丟棄低、中優(yōu)先級的包，高優(yōu)先級的包仍寫入QoSFIFO；一旦緩存隊列滿時，丟棄所有包。QoSFIFO的寫使能信號是控制寫入數(shù)據(jù)和丟棄數(shù)據(jù)的關鍵，我們采用比較結(jié)果和優(yōu)先級字段結(jié)合的方式，由包頭信號同步置位，包尾信號延遲一個周期同步清零產(chǎn)生一個數(shù)據(jù)包長的高電平，與寫入判決信號和延遲一個周期的包尾信號共同產(chǎn)生的寫允許信號相與產(chǎn)生FIFO的寫使能。這樣就實現(xiàn)了寫入或丟棄的數(shù)據(jù)正好是一個整包，避免影響對其它數(shù)據(jù)包的正常操作。關于CBRED機制的兩個門限M1和M2，對此僅作定性考慮，結(jié)合工程經(jīng)驗，設置M1= L/2，M2=3L/4，其中L=2000(所選FIFO的深度)。這一結(jié)果是在實際測試中，通過不斷的分析比較得出的最優(yōu)值。

圖6 分類隨機早期探測實現(xiàn)示意圖

　　ATM多端口線卡輸出處理流向的調(diào)度策略同樣具有一定的通用性,可以根據(jù)實際的情況,對優(yōu)先逐包調(diào)度隊列數(shù)量和輸出接口數(shù)量進行改變,滿足多種需求。

測試結(jié)果與分析

　　ATM多端口線卡參加了國家863“十五”期間重大課題“高性能IPv6路由器基礎平臺及實驗系統(tǒng)”的系統(tǒng)測試，為高性能IPv6路由器提供ATM信元與IP數(shù)據(jù)包的數(shù)據(jù)格式轉(zhuǎn)換的功能，其吞吐量測試結(jié)果見圖7。根據(jù)測試結(jié)果，當接口平均速率小于1244Mbit/s時，在測試中各種包長的條件下(40byte～1518byte)，ATM多端口線卡實現(xiàn)了無丟包線速處理。

　　ATM多端口線卡的輸入鏈路控制電路中應用并實現(xiàn)了分片輪詢調(diào)度和逐包輪詢調(diào)度相結(jié)合的策略，結(jié)合整個線卡的測試結(jié)果，充分證明這種策略是切實可行的，且能保證效率；輸出鏈路控制電路中將TBSP策略與CBRED機制有機地結(jié)合起來，可以較好提高系統(tǒng)吞吐量和降低丟包率，實現(xiàn)QoS和實時業(yè)務的時延控制，并且在工程上是易于實現(xiàn)的。

小結(jié)

　　本文中，為了保證一定的公平性，滿足整包處理的需要，提出了公平的分片輪詢(CRR)和即時的逐包輪詢(PRR)相結(jié)合的調(diào)度策略；分析了多端口線卡調(diào)度和存儲器管理中存在的問題，提出了一種基于門限的調(diào)度策略(TBSP)，較好地解決了降低系統(tǒng)丟包率和提高吞吐量的問題；為了滿足QoS要求和保證實時業(yè)務的時延特性，將TBSP策略與CBRED機制有機地結(jié)合起來，可以降低系統(tǒng)丟包率，而且能夠在一定程度上滿足不同業(yè)務的QoS要求。本文中存儲器管理機制和調(diào)度策略均在ATM多端口線卡中得以工程實現(xiàn)，且具有通用性，在支持的輸入接口和連接數(shù)量上進行增減，可以滿足多種多端口線卡的調(diào)度需求。

新聞中心

核心路由器中多端口線卡調(diào)度的設計與實現(xiàn)

評論

相關推薦

技術專區(qū)