AES算法的快速硬件設(shè)計與實現(xiàn)

作者：北京電子科技學(xué)院李雪梅時間：2008-07-10 來源：電子設(shè)計應(yīng)用

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　信息安全是計算機科學(xué)技術(shù)的熱點研究領(lǐng)域，數(shù)據(jù)加密則是信息安全的重要手段。隨著可編程技術(shù)的飛速發(fā)展及高速集成電路的不斷出現(xiàn)，采用FPGA實現(xiàn)加密算法已受到越來越廣泛的關(guān)注和重視[1][2]。與傳統(tǒng)的軟件加密方法相比，硬件加密的優(yōu)點是：(1)安全性好，不易被攻擊；(2)計算速度快，效率高；(3)成本低，性能可靠。加密系統(tǒng)中體現(xiàn)數(shù)據(jù)傳輸速度的一個重要性能指標(biāo)是數(shù)據(jù)吞吐量，計算公式為：(數(shù)據(jù)長度M/時鐘個數(shù)N)×時鐘頻率F。提高數(shù)據(jù)吞吐量是改善加密系統(tǒng)性能的關(guān)鍵，也是加密算法硬件實現(xiàn)技術(shù)的重要內(nèi)容。

本文引用地址：http://2s4d.com/article/85545.htm

　　AES算法作為DES算法的替代者應(yīng)用非常廣泛，其硬件實現(xiàn)方法已有不少討論，主要是通過提高算法頻率來提高吞吐量。但是在實際運行中，為了保證整個加密系統(tǒng)的穩(wěn)定性，通常全局時鐘頻率較低，不可能達到算法的仿真頻率，如PCI接口電路時鐘頻率只有33MHz，因此實際數(shù)據(jù)吞吐量仍然較低。本文根據(jù)AES算法的結(jié)構(gòu)特點及硬件系統(tǒng)的特點，提出一種快速的AES算法IP核設(shè)計方法。該方法采用優(yōu)化設(shè)計輪函數(shù)和流水線技術(shù)，在較低的系統(tǒng)時鐘頻率下，通過減少分組運算時鐘數(shù)目來獲得更高的吞吐量和更快的傳輸速度。

　　1 AES算法

　　AES是美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)提出的高級加密標(biāo)準(zhǔn)[4]。2000 年10月，NIST宣布將比利時人Joan Daemen和Vicent Rijinen提交的Rijndael算法作為高級加密標(biāo)準(zhǔn)(AES)。該算法設(shè)計簡單，與公鑰密碼算法不同，沒有復(fù)雜的乘法運算，易于實現(xiàn)，靈活性強，輪函數(shù)良好的并行特性有利于硬件設(shè)計與實現(xiàn)。AES算法是一種迭代型分組密碼，其分組長度和密鑰長度均可變，各自可以獨立指定為128bit、 192bit、256bit。本文主要討論分組長度和密鑰長度為128bit的情況。

　　AES算法是將輸入的明文(或密文)分成16個字節(jié)，在第一個Add Round Keys變換后進入10輪迭代。前9輪完全相同，依次經(jīng)過字節(jié)代替(Substitute Bytes)、行移位(Shift Rows)、列混合(Mix Columns)、輪密鑰加(Add Round Keys)，最后一輪則跳過了Mix Column。解密過程與加密過程類似，但執(zhí)行順序與描述內(nèi)容有所不同，因此AES算法的加解密過程需要分別實現(xiàn)。圖1給出了AES算法的加解密過程。關(guān)于AES算法的詳細描述請參見參考文獻[4]。

　　2 AES算法優(yōu)化設(shè)計

　　2.1 硬件選擇

　　Cyclone器件是Altera公司推出的成本最低的SRAM工藝FPGA，容量為2 910～20 060個邏輯單元(LE)和多達288kbit的M4K memory block。每個LE都有一個四輸入的LUT查找表、可編程寄存器和具有進位選擇能力的進位鏈，可實現(xiàn)任何四輸入變量的函數(shù)，能夠進行大量邏輯運算，非常適合作為加密算法的硬件載體。設(shè)計中所使用的開發(fā)工具是QuartusII4.2，FPGA芯片選擇Cyclone器件的EP1C12Q240C8，基于 Verilog HDL語言實現(xiàn)。

　　2.2 密鑰擴展單元優(yōu)化設(shè)計

　　密鑰擴展是將初始密鑰作為種子密鑰，經(jīng)過字節(jié)代換、字節(jié)移位、輪常數(shù)計算、字異或等過程，計算產(chǎn)生10輪迭代子密鑰。有文獻提出計算密鑰時密鑰擴展和加密過程同步執(zhí)行，這樣做會節(jié)約 FPGA的存儲器資源。但筆者認(rèn)為在算法運行過程中，擴展密鑰進程始終運行會增加FPGA芯片的動態(tài)功耗。另外，AES算法解密運算是從最后一輪子密鑰開始，只有擴展出所有子密鑰才能啟動解密運算，因此制約了解密過程的實現(xiàn)。通常情況下初始密鑰不會頻繁改變，加/解密多包數(shù)據(jù)時可共享密鑰擴展結(jié)果，同時由于Cyclone器件存儲器資源豐富，為存放子密鑰提供了足夠的空間。因此本文采用更普遍的做法，將所有子密鑰擴展后保存在RAM中，使用時依次從RAM 中讀取。這種方式不受加解密實現(xiàn)過程的限制，靈活性強，非常適合于加密算法的FPGA實現(xiàn)。

　　從RAM中讀取子密鑰需要時間，為了避免算法第一個Add Round Key過程帶來的延時，可以將第一組子密鑰(初始密鑰)和最后一組子密鑰(解密過程第一組子密鑰)在寫入RAM的同時，分別保存在兩組寄存器中。如圖2所示，加/解密時直接利用寄存器結(jié)果進入算法第一輪迭代，保證算法在10個時鐘內(nèi)完成10輪迭代，從而減少Add Round Key的時間。