基于FPGA的TCP粘合設計實現(xiàn)
為完成數(shù)據(jù)包的映射,該部分需要實現(xiàn)兩個功能:ACK序列號轉(zhuǎn)換和雙方轉(zhuǎn)換信息的存儲。
在TCP粘合過程中,由于TCP粘合系統(tǒng)送給客戶端的ACK序列號和后端服務器送給客戶端的ACK序列號不相同,因此要進行ACK序列號的轉(zhuǎn)換,同時要重新計算數(shù)據(jù)包的TCP/IP校驗和。
現(xiàn)假設客戶端發(fā)送了請求連接的SYN數(shù)據(jù)包,而客戶端返回給客戶端的SYN序列號為地址管理單元分配給該連接的地址A0,而當系統(tǒng)和服務器建立鏈接時服務器端返回的SYN序列號為A1,則根據(jù)這兩個序列號可計算差值A為:A=A0-A1。
以后通信的過程中,只要將服務器發(fā)送給系統(tǒng)的序列號加上A就能夠轉(zhuǎn)換成為系統(tǒng)送給客戶端的序列號,這樣就完成了服務器端向客戶端發(fā)送數(shù)據(jù)的轉(zhuǎn)換,反之就可以完成客戶端向服務器發(fā)送數(shù)據(jù)的轉(zhuǎn)換。
對于數(shù)據(jù)包的校驗和轉(zhuǎn)換而言,由于校驗和本質(zhì)上是加法運算,所以只需要在原來的校驗和基礎上加上序列號之差(或減去一個差值)即可完成校驗和的轉(zhuǎn)換。
在同一個通信過程中,ACK序列號轉(zhuǎn)換、校驗和的轉(zhuǎn)換、發(fā)起連接的SYN、GET數(shù)據(jù)包和定時器標志位等信息都需要存儲,由于每個數(shù)據(jù)流需要存儲的內(nèi)容較多,單一的地址已經(jīng)無法滿足存儲要求。此處存儲管理采用頁面式的管理方式。將整個存儲空間分為若干頁面,每個數(shù)據(jù)流信息存入一個頁面中。SSRAM的存儲格式如圖5所示。
3 性能分析
該架構已在試驗系統(tǒng)上實現(xiàn),接收端為兩個GE口。相對于采用TCP粘合的應用代理服務器來說(其中代理服務器CPU Pentium IV 2GHz),具體的性能對比如表1所示。
從上表可以看出在最大連接數(shù)方面,在本系統(tǒng)中采用一個18Mbit的CAM,它能夠提供的最大地址空間為288K×144bit,只能支持288K的連接數(shù)。對于服務器的最大連接數(shù)來說,SYN和GET數(shù)據(jù)包需要經(jīng)過軟件協(xié)議解析。因此當最大連接數(shù)達到582K時CPU的利用率將達到90%以上[3],無法再處理新的連接。從上述分析中可以看出,由于受硬件資源的限制,硬件系統(tǒng)可以支持的最大連接數(shù)小于代理服務器。但是在實際的網(wǎng)絡傳輸過程中,一個HTTP連接持續(xù)的時間一般為幾百個毫秒,在硬件系統(tǒng)達到每秒21K的連接數(shù)時,能夠承受的一個HTTP最大持續(xù)時間為13秒,遠遠大于實際HTTP連接的持續(xù)時間,因此硬件系統(tǒng)支持的最大連接數(shù)是夠用的。當代理服務器采用千兆網(wǎng)卡來接收數(shù)據(jù)時,由于數(shù)據(jù)需要經(jīng)過上層協(xié)議解析,因此實際能夠接收的數(shù)據(jù)量只能夠達到300Mbps。假設每次平均請求512B,則代理服務器能夠支持的最大每秒連接數(shù)大約為7K;而當硬件系統(tǒng)工作在133MHz,內(nèi)部采用32bit總線傳輸時,整個系統(tǒng)的帶寬達到4Gbit,同時系統(tǒng)內(nèi)部采用流水線方式,能夠線速處理1Gbps數(shù)據(jù)的接收,假設平均每次請求512B,則硬件系統(tǒng)能夠處理的每秒最大連接數(shù)達到21K,因此在單位時間內(nèi)能夠處理的連接數(shù)量會高于代理服務器。
隨著HTTP訪問量的不斷增大,對于訪問數(shù)據(jù)包的分流粒度要求越來越細。本文提出的基于硬件實現(xiàn)的TCP粘合系統(tǒng),在TCP粘合技術的基礎上,利用硬件的高速處理特性,可以達到2個GE口收發(fā)(2Gbps)的線速處理性能。同時能夠較好地基于內(nèi)容來區(qū)分數(shù)據(jù)流,從而避免了后端服務器數(shù)據(jù)的重新分發(fā)。
評論