用單片機(jī)實(shí)現(xiàn)SRAM工藝FPGA的加密應(yīng)用
在現(xiàn)代電子系統(tǒng)設(shè)計(jì)中,由于可編程邏輯器件的卓越性能、靈活方便的可升級(jí)特性,而得到了廣泛的應(yīng)用。由于大規(guī)模高密度可編程邏輯器件多采用sram工藝,要求每次上電,對(duì)fpga器件進(jìn)行重配置,這就使得可以通過(guò)監(jiān)視配置的位數(shù)據(jù)流,進(jìn)行克隆設(shè)計(jì)。因此,在關(guān)鍵、核心設(shè)備中,必須采用加密技術(shù)保護(hù)設(shè)計(jì)者的知識(shí)產(chǎn)權(quán)。
本文引用地址:http://m.butianyuan.cn/article/21585.htm1 基于sram工藝fpga的保密性問(wèn)題
通常,采用sram工藝的fpga芯片的的配置方法主要有三種:由計(jì)算機(jī)通過(guò)下載電纜配置、用專用配置芯片(如altera公司的epcx系列芯片)配置、采用存儲(chǔ)器加微控制器的方法配置。第一種方法適合調(diào)試設(shè)計(jì)時(shí)要用,第二種和第三種在實(shí)際產(chǎn)品中使用較多。第二種方法的優(yōu)點(diǎn)在于外圍電路非常簡(jiǎn)單,體積較小,適用于不需要頻繁升級(jí)的產(chǎn)品;第三種方法的優(yōu)點(diǎn)在于成本較低,升級(jí)性能好。
以上幾種方法在系統(tǒng)加電時(shí),都需要將配置的比特流數(shù)據(jù)按照確定的時(shí)序?qū)懭雜ram工藝的fpga。因此,采用一定的電路對(duì)配置fpga的數(shù)據(jù)引腳進(jìn)行采樣,即可得到配置數(shù)據(jù)流信息。利用記錄下來(lái)的配置數(shù)據(jù)可對(duì)另一塊fpga芯片進(jìn)行配置,就實(shí)現(xiàn)了對(duì)fpga內(nèi)部設(shè)計(jì)電路的克隆。典型
的克隆方法見圖1。
由于sram工藝的fpga上電時(shí)的配置數(shù)據(jù)是可以被復(fù)制的,因此單獨(dú)的一塊fpga芯片是無(wú)法實(shí)現(xiàn)有效加密的。fpga芯片供應(yīng)商對(duì)位數(shù)據(jù)流的定義是不公開的,因此無(wú)法通過(guò)外部的配置數(shù)據(jù)流信息推測(cè)內(nèi)部電路。也就是說(shuō),通過(guò)對(duì)fpga配置引腳的數(shù)據(jù)進(jìn)行采樣可得到配置信息。但也不能知道內(nèi)部電路結(jié)構(gòu)。如果在配置完成后使fpga處于非工作狀態(tài),利用另外一塊保密性較強(qiáng)的cpu產(chǎn)生密碼驗(yàn)證信息與fpga進(jìn)行通信,僅在驗(yàn)證成功的情況下使能fpga正常工作,則能有效地對(duì)設(shè)計(jì)進(jìn)行加密。具體電路結(jié)構(gòu)見圖2。
系統(tǒng)加電時(shí),由單片機(jī)對(duì)sram工藝的fpga進(jìn)行配置。配置完成時(shí),fpga內(nèi)部功能塊的使能端為低,不能正常工作。此時(shí),單片機(jī)判斷到配置完成后,將aset信號(hào)置為高電平,使能fpga內(nèi)的偽碼發(fā)生電路工作;同時(shí),單片機(jī)產(chǎn)生一個(gè)偽碼驗(yàn)證信息,在fpga中將兩路偽碼進(jìn)行比較,兩者完全匹配時(shí),fpga內(nèi)部電路正常工作,否則不能正常工作。加密電路主要利用了配置完成后處于空閑狀態(tài)的單片機(jī)和fpga內(nèi)部分邏輯單元,沒有增加硬件成本。
由上述討論可知,系統(tǒng)的加密能力主要由cpu的加密能力決定。這就要求cpu的加密算法要足夠復(fù)雜,使得對(duì)驗(yàn)證信息的捕獲與識(shí)別足夠困難。最常見的加密算法就是產(chǎn)生兩個(gè)偽隨機(jī)序列發(fā)生器:一個(gè)位于sram工藝的fpga內(nèi);另一個(gè)位于cpu內(nèi)。當(dāng)兩者匹配時(shí),通過(guò)驗(yàn)斑點(diǎn)。對(duì)pn碼有兩點(diǎn)要求:一方面,要求偽隨機(jī)序列的長(zhǎng)度足夠長(zhǎng),使得要捕獲整個(gè)序列不太可能;另一方面,偽隨機(jī)序列的線性復(fù)雜度要足夠高,使推測(cè)偽隨機(jī)序列的結(jié)構(gòu)不易實(shí)現(xiàn)。
通常采用的偽隨機(jī)碼發(fā)生器的反饋電路如圖3所示。實(shí)際中,可采用級(jí)數(shù)較高的線性反饋移位寄存器來(lái)產(chǎn)生偽隨機(jī)碼。如采用40級(jí)線性移位寄存器產(chǎn)生的最大序列的周期為2?40=10?12。若將所有偽隨機(jī)碼截獲并存儲(chǔ),就需要1000gb的存儲(chǔ)空間;若碼速率為50kbps,捕獲時(shí)間將長(zhǎng)達(dá)5555小時(shí);當(dāng)增加移位寄存器的級(jí)數(shù)時(shí),所需的存儲(chǔ)空間和捕獲時(shí)間都會(huì)呈指數(shù)增長(zhǎng),以至于難以實(shí)現(xiàn)。采用較為簡(jiǎn)單的線性反饋電路被推測(cè)出反饋結(jié)構(gòu)的可能性較大,因此實(shí)際的系統(tǒng)中,除了級(jí)數(shù)要較多之外,往往通過(guò)對(duì)多個(gè)線性移位寄存器產(chǎn)生的偽碼進(jìn)行特定運(yùn)算產(chǎn)生長(zhǎng)碼,以增加所產(chǎn)生偽碼的線性復(fù)雜度。
3 fpga內(nèi)的校驗(yàn)工作電路在此采用40級(jí)線性反饋移位寄存器來(lái)產(chǎn)生偽隨機(jī)碼,特征多項(xiàng)式為20000012000005(八進(jìn)制表示)。其移位寄存器表示形式為:bin=b23?xor?b21xorb2xorb0,fpga內(nèi)工作電路見圖4。
在上電之后,單片機(jī)將圖4中的電路配置在fpga中。配置完成后,單片機(jī)發(fā)送的aset信號(hào)由低電平跳變?yōu)楦唠娖?,使得fpga內(nèi)的pn碼產(chǎn)生電路開始工作,并于cpu發(fā)送過(guò)來(lái)的pn碼進(jìn)行比較。比較結(jié)果一致就使能user_design模塊正常工作。其中pll_bitsys模塊用來(lái)發(fā)生verify_pn的位同步時(shí)鐘,采用微分鎖相原理實(shí)現(xiàn)。各種參考資料都有較多介紹,在此不再詳述。
compare_pn模塊完成對(duì)單片機(jī)發(fā)送的偽隨機(jī)碼和pnma_producer模塊產(chǎn)生的偽隨機(jī)碼的比較:當(dāng)兩路相同,輸出1,不同時(shí)輸出0;若兩路偽碼完全匹配,則恒定輸出1,使user_design電路正常工作,否則,輸出為類似于偽碼的信號(hào),使user_design電路不能正常工作。
4 fpga內(nèi)的偽隨機(jī)碼產(chǎn)生電路
pnma_producer模塊和來(lái)產(chǎn)生偽隨機(jī)碼,采用移位寄存器實(shí)現(xiàn),具體電路見圖5。
lpm_shiftreg為移位寄存器模塊。移位寄存器aset端為異步置位端,高電平有效,即aset為高時(shí),將初值85置入移位寄存器內(nèi),lpmshiftreg模塊的“direction”設(shè)置為“right”即移位方向?yàn)橛乙啤[39..0]表示40位移位寄存器的各個(gè)狀態(tài),shiftin為串行輸入,shiftin為q0、q2、q21、q23四個(gè)狀態(tài)異或運(yùn)算的結(jié)果。
系統(tǒng)加電時(shí),單片機(jī)將aset置為低電平,經(jīng)過(guò)一個(gè)非門,變成高電平使移位寄存器處于置位狀態(tài)。在配置完成后,單片機(jī)將aset信號(hào)置為高電平,經(jīng)非門使移位寄存器正常工作。
利用移位寄存器電路產(chǎn)生偽隨機(jī)碼的電路非常簡(jiǎn)單,反饋邏輯也便于修改。 5 單片機(jī)驗(yàn)證偽碼的程序
在位尋址區(qū)(20h~2fh)定義了字節(jié)變量word1、word2、word3、word4、word5,用來(lái)存儲(chǔ)移位寄存器的40個(gè)狀態(tài)。其中q0對(duì)應(yīng)word1.0,q1對(duì)應(yīng)word1.1……q39對(duì)應(yīng)word5.7。同時(shí),在位尋址區(qū)定義了word6、word7、word8、word9,用來(lái)進(jìn)行后面的反饋邏輯計(jì)算
。
單片機(jī)一上電,首先將aset腳清零,同時(shí),也將pnma腳清零,將初值55h作為移位寄存器的初始狀態(tài),接著完成fpga的上電配置工作。配置完成后,單片機(jī)檢測(cè)來(lái)自fpga的外部中斷confdone。如果配置完成,confdone為高電;否則,為低電平。在檢測(cè)到confdone為高電平,即配置完成后,單片機(jī)將aset腳置為1,使能fpga內(nèi)的偽碼發(fā)生電路工作,單片機(jī)產(chǎn)生偽隨機(jī)碼的流程。配置完成后,首先將q0輸出到pnma引腳,接著計(jì)算反饋邏輯輸入,將參與反饋運(yùn)算的幾個(gè)狀態(tài)運(yùn)算結(jié)果存在中間變量mid_vary中。然后,對(duì)各個(gè)狀態(tài)進(jìn)行右移,為了提高運(yùn)算效率,使用了帶進(jìn)位c的字節(jié)循環(huán)右移指令。移位完成后,將mid_vary存入q39,再將新的q0輸出到pnma引腳,程序循環(huán)執(zhí)行產(chǎn)生偽隨機(jī)碼。
單片機(jī)核心源程序如下:
clr aset;單片機(jī)上電后將aset位清0
clr pnma
mov word1,#55h
mov word2,#0
mov word3,#0
mov word4,#0
mov word5,#0;將55h作為移位寄存器的初值peizhi:
……;進(jìn)行fpga的配置工作
jb confdone,pnproduce;根據(jù)confdone判斷配置是否完成
ljmp peizhi;否則繼續(xù)配置
pnproduce:setb aset;配置完成后,將aset腳置1
xmqloop:mov c,q0
mov pnma,c;將q0輸出到pnma引腳,作為pn碼
mov c,q0
mov word6.0,c;用word6單元的0位來(lái)存q0的狀態(tài)
mov c,q2
mov word7.0,c;用word7單元的0位來(lái)存q2的狀態(tài)
mov c,q21
mov word8.0,c;用word8單元的0位來(lái)存q21的狀態(tài)
mov c,q23
mov word9.0,c;用word9單元的0位來(lái)存q23的狀態(tài)
mov acc,word6
xrl a,word7
xrl a,word8
xrl a,word9;通過(guò)異或指令,計(jì)算反饋邏輯
mov c,acc.0;反饋邏輯為qin=q0
;xor q2 xor q21 xor q23
mov mid_vary,c;將運(yùn)算后的狀態(tài)存到mid_vary中右移運(yùn)算
mov acc,word1
rrc a;移位q7~q0
mov word1,a;移位后,保存到word1單元中
mov acc,word2
rrc a;移位q15~q8
mov word2,a;移位后,保存到word2單元中
mov q7,c;將q8的值賦到q7
mov acc,word3
rrc a;移位q23~q16
mov word3,a;移位后,保存到word3單元中
mov q15,c;將q16的值賦到q15
mov acc,word4
rrc a;移位q31~q24
mov word4,a;移位后,保存到word4單元中
mov q23,c;將q24的值賦到q23
mov acc,word5
rrc a;移位q39~q32
mov word5,a;移位后,保存到word5單元中
mov q31,c;將q32的值賦到q31
mov c,mid_vary;將前面反
饋計(jì)算的值賦給q39mov q39,c
ljmp xmaloop??;繼續(xù)產(chǎn)生下一代pn碼元
6 其它加密方法介紹及比較
對(duì)sram工藝的fpga進(jìn)行加密,除了可以利用單片機(jī)實(shí)現(xiàn)外,還可以用e2prom工藝的cpld實(shí)現(xiàn)。與用單片機(jī)實(shí)現(xiàn)相比,利用cpld的優(yōu)點(diǎn)在于可實(shí)現(xiàn)高速偽碼,但要在硬件電路中增加一塊cpld芯片,使整個(gè)硬件電路復(fù)雜化,增加了成本。本文提供的加密方法考慮到配置完成后單片機(jī)處于空閑狀態(tài),此時(shí)利用單片機(jī)進(jìn)行加密,不需要增加任何電路成本,使得整個(gè)系統(tǒng)硬件結(jié)構(gòu)十分簡(jiǎn)潔。本文提出采用長(zhǎng)偽隨機(jī)碼來(lái)實(shí)現(xiàn)加密。如果采用其它的算法產(chǎn)生驗(yàn)證信息,并增加單片機(jī)與fpga工作時(shí)信息實(shí)時(shí)交互,使得獲取驗(yàn)證信息的難度足夠大,也可以達(dá)到類似的加密效果。
評(píng)論