模塊化免疫神經(jīng)網(wǎng)絡(luò)模型在計算機病毒分類檢測中的
在該模型中,每個神經(jīng)元的基本性質(zhì)相同,但具體形式不同。因此,每個神經(jīng)元的激活函數(shù)被設(shè)計成可變形式,也就是說,激活函數(shù)的基本性質(zhì)保持不變,但具體的形式應(yīng)該可以通過調(diào)整函數(shù)的參數(shù)來改變,任一神經(jīng)元i的激活函數(shù)可設(shè)計成:
本文引用地址:http://2s4d.com/article/202688.htm3 抗體自體庫的建立
隨機獲取一組輸入向量抗原X,按照式(1)產(chǎn)生與X最匹配的中心序列k,把k添加到抗體群中。由于計算機病毒入侵檢測中在某段時間出現(xiàn)相同的入侵行為的概率較高,可根據(jù)網(wǎng)絡(luò)使用情況,進行最快速度的匹配運算,而不需要進行學(xué)習(xí)功能。
抗體自體庫主要由選擇抗體集、交叉抗體集和變異抗體集組成。
1)選擇抗體集的設(shè)計:是保證免疫算法種群優(yōu)勝劣汰的重要抗體集,且有較多的實現(xiàn)。
2)交叉抗體集的設(shè)計:交叉就是把2個父個體的部分結(jié)構(gòu)加替換重組而生成新個體的操作,其目的是能在下一代產(chǎn)生新的優(yōu)化抗體集。
3)變異抗體集的設(shè)計:因免疫算法中變異抗體集以輔助手段出現(xiàn),故采用本位變異的方法即可。
4 仿真實驗
其訓(xùn)練方法如圖4。
4.1 仿真訓(xùn)練初始數(shù)據(jù)的收集
目前世界上很多研究機構(gòu)和研究人員致力于計算機病毒入侵檢測方面的研究和系統(tǒng)開發(fā),提供了一些測試資料集合,包括網(wǎng)絡(luò)資料、基于主機的審計資料和系統(tǒng)調(diào)用序列。
網(wǎng)絡(luò)傳輸協(xié)議/網(wǎng)絡(luò)協(xié)議(TCP/IP)對需要組織傳輸?shù)馁Y料包進行打包。TCP層在包中加入了頭信息如:源埠、目的埠、序列號、ACK確認號、偏移量、SYN、FIN、窗口和緊急指針等。含有TCP頭信息的包被送到IP層,加IP資料包頭如:包頭長度、服務(wù)類型、資料包長度、分段偏移量、生存期、協(xié)議類型、源地址和目標(biāo)地址等。而正常和異常的數(shù)據(jù)包都在網(wǎng)上傳輸,其特征是有差別的。
為測試改進后的網(wǎng)絡(luò)在病毒入侵檢測應(yīng)用中的效果,采用了具有30萬條數(shù)據(jù)記錄的測試數(shù)據(jù)集,每條數(shù)據(jù)包括了網(wǎng)絡(luò)數(shù)據(jù)包的包頭信息、網(wǎng)絡(luò)連接信息和數(shù)據(jù)信息等,每條數(shù)據(jù)包含96位的二進制代碼。其中前32位二進制為源IP地址,32-64位二進制為目標(biāo)IP地址,64-96位二進制表示了一些數(shù)據(jù)信息,每個數(shù)據(jù)被標(biāo)記為異?;蛘哒!T摂?shù)據(jù)源由MATLAB利用random()函數(shù)產(chǎn)生一組隨機的小數(shù),因為考慮到是二進制運算,規(guī)定:
這樣隨機產(chǎn)生的二進制串96個為一組,模擬的IP數(shù)據(jù)包,一共產(chǎn)生96萬個二進制串組合。
4.2 抗體自體庫仿真訓(xùn)練(自體庫的建立)
使用這1萬條數(shù)據(jù)進行自體庫的建立和神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。在不斷調(diào)整抗體自體庫的同時,使自體庫的解空間在最大程度上得到提高,最后趨近與一個穩(wěn)定的自體庫接集合。利用建立好的抗體檢測庫檢測未知的29萬條數(shù)據(jù)紀錄。仿真試驗算法如下:
4.3 病毒入侵檢測算法的仿真訓(xùn)練
建立起自體庫后,進行病毒入侵檢測算法的仿真試驗,步驟如下:
首先,引入新的一組數(shù)據(jù)向量,與自體庫也就是所謂的記憶細胞匹配,如果在一定的閾值范圍內(nèi)匹配度很高,則認為該向量為入侵行為,并把匹配度提升1;相反,如果匹配度不高,則找出記憶細胞里與之親和力較大的進行權(quán)值的調(diào)整,達到兩者之間的最優(yōu)匹配度,然后把新的向量作為抗體集合加入到記憶細胞,重復(fù)操作,完成后統(tǒng)計結(jié)果。
檢測算法仿真程序如下:
評論