關(guān) 閉

新聞中心

EEPW首頁 > 安全與國防 > 設(shè)計(jì)應(yīng)用 > 基于小波包變換和壓縮感知的人臉識別算法

基于小波包變換和壓縮感知的人臉識別算法

作者:魏嬌龍 時(shí)間:2014-03-27 來源:電子產(chǎn)品世界 收藏

  引言

本文引用地址:http://2s4d.com/article/235426.htm

  是一個(gè)經(jīng)典的模式識別問題。壓縮感知理論的出現(xiàn)和發(fā)展,給帶來了新的啟發(fā),使得基于稀疏表示的技術(shù)得到了廣泛研究。傳統(tǒng)的基于稀疏表示的人臉識別是利用壓縮感知超完備庫下的稀疏表示,將訓(xùn)練圖片直接構(gòu)造為冗余字典,再求解重構(gòu)算法下的最優(yōu)稀疏線性組合系數(shù),然后根據(jù)這些系數(shù)來對人臉圖像進(jìn)行分類。

  鄭軼、蔡體健[1]針對人臉求解稀疏表示時(shí)正交匹配追蹤算法運(yùn)算度高,提出了一種改進(jìn)的算法,加快了逆矩陣和大矩陣乘積的求解,但在構(gòu)成訓(xùn)練字典時(shí)對光照[2]、表情[3]、姿態(tài)[4]等考慮較少。Allen Y. Yang[5]等針對壓縮感知基于最小一范數(shù)求解最優(yōu)稀疏表示時(shí)算法運(yùn)算度高,提出了一種凸優(yōu)化算法,取得了不錯的識別率,但仍然是超完備庫下的稀疏表示。平強(qiáng)、莊連生[6]等針對人臉識別姿態(tài)問題提出了基于仿射變換的人臉分塊稀疏表示,提升了算法的識別性能,但仿射變換和分塊稀疏表示都增加了運(yùn)算復(fù)雜度。

  本文針對上述字典構(gòu)成問題,提出基于基函數(shù)字典下的稀疏表示,尋找一個(gè)正交基,使得信號表示的稀疏系數(shù)盡可能的少,小波基符合這一要求,同時(shí)能提取人臉低頻、高頻四個(gè)頻帶的特征,包括人臉的整體特征和局部紋理特征,小波包多層變換后還可以2n的速度對人臉圖像進(jìn)行降維。本文在運(yùn)用壓縮感知時(shí),只利用壓縮感知對高維人臉圖片進(jìn)行降維,不進(jìn)行重構(gòu)算法尋求最優(yōu)稀疏解,大大降低了算法的復(fù)雜度。實(shí)驗(yàn)結(jié)果表明本算法與相關(guān)算法比較識別率較高,運(yùn)算時(shí)間基本無劣勢,對訓(xùn)練樣本的數(shù)目要求較低。

  1 基本理論

  1.1 小波變換的基本理論

  小波變換是一種變換分析方法,它將原始圖像與小波基函數(shù)進(jìn)行內(nèi)積運(yùn)算,圖像經(jīng)小波分解后可得到一個(gè)近似分量和三個(gè)方向的細(xì)節(jié)分量,三個(gè)細(xì)節(jié)分量分別具有高度的局部相關(guān)性,而整體相關(guān)性能最大限度地消除。選擇小波基時(shí)具體要考慮小波基的正交性,使得各子帶間數(shù)據(jù)相關(guān)性最小;緊支性使應(yīng)用精度較高,不需要人為截?cái)鄶?shù)據(jù);小波基的對稱性也是十分重要的,因?yàn)榭梢詷?gòu)造緊支的正則小波基,從而具有線性相位[7]。

  區(qū)別于小波變換,它不僅對信號的低頻分量進(jìn)行連續(xù)分解,而且對高頻分量也進(jìn)行連續(xù)分解,不僅可得到許多分辨率較低的低頻分量,而且也可得到許多分辨率較低的高頻分量,如圖1所示,這種變換稱之為 [8]。

  圖1中,箭頭向左表示當(dāng)前層低通濾波變換,箭頭向右表示當(dāng)前層高通濾波變換。

  1.2 壓縮感知理論

  壓縮感知理論[9]指出,只要信號是可壓縮的或在某個(gè)變換域是稀疏的,那么就可以用一個(gè)與變換基不相關(guān)的觀測矩陣將變換所得高維信號投影到一個(gè)低維空間上。壓縮感知信號稀疏表示主要有兩個(gè)方向[10],一是基函數(shù)字典下的稀疏表示,二是超完備庫下的稀疏表示。稀疏信號通過觀測矩陣投影如公式(1)所示:

 

  其中為觀測矩陣,為稀疏信號,為信號經(jīng)觀測矩陣投影后所得列向量。

  將壓縮感知作為特征提取的方法,必須保證觀測矩陣不會把兩個(gè)不同的稀疏信號映射到同一個(gè)采樣集合中,這就要求從觀測矩陣中抽取的每M個(gè)列向量構(gòu)成的矩陣是非奇異的,同時(shí)需要保證觀測矩陣和稀疏基不相干。

  2 本文稀疏表示的人臉識別算法

  本文將小波包變換和壓縮感知結(jié)合應(yīng)用于人臉識別,具體識別過程如圖2所示。

  2.1 二層小波包分解構(gòu)成基函數(shù)字典

  根據(jù)前文描述小波包變換,2D-WPT 是一維離散小波變換的擴(kuò)展,其實(shí)質(zhì)是將二維信號在不同尺度上進(jìn)行分解,得到原始信號的近似分量和細(xì)節(jié)分量。原始圖像經(jīng)過1層2D-DWT分解后圖像被分成4個(gè)部分:近似部分,水平細(xì)節(jié),垂直細(xì)節(jié)以及對角細(xì)節(jié)。

  近似部分是對人臉的全局描述,主要受光照、姿態(tài)和位置影響,三個(gè)細(xì)節(jié)分量是對人臉的局部細(xì)節(jié)描述,主要受表情和遮擋飾物(如眼鏡,胡須等)的影響[11]。每部分圖像大小為原始圖像的四分之一大小,對圖像起到了降維的作用。

  圖3是對一幅大小為100×100的人臉圖像進(jìn)行小波變換的結(jié)果。

  圖3(a)為原始人臉圖像,圖(b)為對原始圖像進(jìn)行的一層小波分解,分別為原始圖像的低頻分量(左上)垂直高頻分量(右上)、水平高頻分量(左下)和對角高頻分量(右下),圖(c)為低頻分量進(jìn)行兩層分解。上述小波變換選取的小波基為db1,考慮了小波基的緊支撐、高階消失矩和對稱性,db1是比較適合對人臉圖像進(jìn)行小波變換的小波基,大量實(shí)驗(yàn)也證明了db1在進(jìn)行人臉重構(gòu)時(shí),平均重構(gòu)誤差是最小的,即db1更適合提取人臉特征,證明了分析的正確性。

  本文進(jìn)行了小波包的分解,既完成了基于基函數(shù)字典下的稀疏表示,也提取了人臉識別的整體信息和局部細(xì)節(jié)信息。在構(gòu)成基函數(shù)字典時(shí),需將低頻、高頻分量分別構(gòu)成列向量,最后組成一個(gè)大的列向量,保留其中的結(jié)構(gòu)信息。

  小波包變換采用兩層分解,取第二層分解結(jié)果作為特征,使得圖像維數(shù)得到降低,進(jìn)而也使得降維時(shí)壓縮感知的運(yùn)算量大大減少。如果小波包分解層數(shù)過多,會造成計(jì)算耗時(shí),同時(shí)圖像信息也會因?yàn)槎啻畏纸舛糠謥G失。

  2.2 壓縮感知降維

  人臉圖像經(jīng)小波包變換構(gòu)成基函數(shù)字典后,信息具有稀疏性,同時(shí)包含人臉表情、姿態(tài)等細(xì)節(jié)信息,從而用壓縮感知進(jìn)行進(jìn)一步的有效信息的提取和降維,將基函數(shù)字典矩陣與觀測矩陣運(yùn)算后得到一個(gè)維數(shù)較低的向量,作為人臉的最終特征向量。最后本文用訓(xùn)練圖像和測試圖像特征向量之差二范數(shù)分類器進(jìn)行分類,得到了良好的識別效果。

  本文選用的觀測矩陣為哈達(dá)瑪矩陣,它是由+1和-1元素構(gòu)成的正交方陣,它的任意兩行(或兩列)都是正交的,即保證了觀測矩陣是非奇異的,符合壓縮感知對觀測矩陣的要求,同時(shí)哈達(dá)瑪矩陣也便于硬件實(shí)現(xiàn)。

  本文算法應(yīng)用于人臉識別具體做法描述如下:

  (1)輸入c類N個(gè)訓(xùn)練樣本,進(jìn)行二層小波包分解將訓(xùn)練樣本投映到小波域,進(jìn)而構(gòu)成基函數(shù)字典訓(xùn)練空間A;

  (2)給定一個(gè)測試圖像,用二層小波包分解將其投映到小波域空間,進(jìn)而構(gòu)成測試空間x;

  (3)將訓(xùn)練樣本的字典空間按結(jié)構(gòu)排成列向量,運(yùn)用壓縮感知計(jì)算 (i=1,2…N)將Yi的每一列作為最終進(jìn)行比較的特征向量;

  (4)將測試圖像小波域的測試空間按結(jié)構(gòu)排成列向量,運(yùn)用壓縮感知計(jì)算:;

  (5)在每個(gè)最終特征向量上用 (i=1,2…N)計(jì)算特征向量之差的二范數(shù);

  (6)若,則x與第i個(gè)訓(xùn)練樣本為同一類。

  3 實(shí)驗(yàn)結(jié)果

  選用Yale人臉數(shù)據(jù)庫和ORL人臉數(shù)據(jù)庫[12]作為實(shí)驗(yàn)素材,其中Yale A人臉總數(shù)165,15類,大小為,影響識別因素為光照、表情、姿態(tài)、飾物。訓(xùn)練樣本為每類4幅圖片,測試圖像為每類其他7幅人臉。ORL人臉總數(shù)為400,40類,大小為,影響識別的因素為姿態(tài)。訓(xùn)練樣本為每類3幅圖片,測試圖片為每類其他7幅人臉。實(shí)驗(yàn)環(huán)境為Intel Core2 Duo CPU--E7500 2.93GHz,2.00GB RAM,matlab7.0(R2009a)。

  為驗(yàn)證本文算法的識別率和運(yùn)行時(shí)間的有效性進(jìn)行了實(shí)驗(yàn),并與基于壓縮感知的FOMP人臉識別算法[1]進(jìn)行了比較。如表1所示為Yale A 人臉識別結(jié)果,其中運(yùn)行時(shí)間為105幅測試圖像運(yùn)行總時(shí)間。如表2所示為ORL人臉識別結(jié)果,其中運(yùn)行時(shí)間為240幅測試圖像運(yùn)行總時(shí)間。

  (1)由表1實(shí)驗(yàn)結(jié)果,本文算法因進(jìn)行了小波包變換構(gòu)成基函數(shù)字典,提取了整體特征和局部細(xì)節(jié)特征,對表情、姿態(tài)的變化魯棒性高一些,進(jìn)而識別率有一定優(yōu)勢。雖然本文未進(jìn)行運(yùn)算量高的正交匹配算法尋找最優(yōu)稀疏解,小波包變換也能起到降維作用,但由于進(jìn)行小波包變換占用時(shí)間,使得本算法時(shí)間上仍有一定劣勢。

  (2)由表2實(shí)驗(yàn)結(jié)果,得知兩個(gè)算法的識別率都有提升,說明壓縮感知對姿態(tài)有一定的魯棒性,而本文算法識別率上仍然有一定優(yōu)勢,說明小波包變換構(gòu)成基函數(shù)字典,增強(qiáng)了算法的姿態(tài)魯棒性。

  (3)通過對表1實(shí)驗(yàn)結(jié)果分析,發(fā)現(xiàn)本算法錯誤識別的人臉圖像大多光照較弱或光照不均勻,說明本文算法對光照的魯棒性能較差。分析其原因,在光照較差的情況下,圖像是人臉的概貌,紋理信息較弱,使得小波包變換不能有效的提取細(xì)節(jié)特征,影響了識別率。

  4 結(jié)束語

  本文提出了一種基于小波包變換和壓縮感知的人臉識別算法,與傳統(tǒng)方法相比,本文采用基函數(shù)字典表示,將小波包變換和壓縮感知相結(jié)合,充分利用了小波包變換和壓縮感知的優(yōu)勢,克服其缺點(diǎn),使得識別率得到了提升,時(shí)間復(fù)雜度也得到了有效的控制。同時(shí)本算法不需要對圖片進(jìn)行預(yù)處理,對遮擋物、表情有很好的魯棒性。但本文算法對光照的魯棒性能較差,還需要進(jìn)一步研究加以改善。

  參考文獻(xiàn):

  [1]鄭軼,蔡體健.稀疏表示的人臉識別及其優(yōu)化算法[J].華東交通大學(xué)學(xué)報(bào),2012,29(1):10-14

  [2]Wagner A,Wright J.Toward a practical face recognition system: robust alignment and illumination by sparse representation[J]. IEEE Transactions on Pattern Analysis and Mac-hine Intelligence,2012,34(2):372-386

  [3]Hsieh C K,Lai S H.Expression-invariant face recognition with Constrained optical flow warping[J].IEEE Transactions on Multimedia,2009,11(4):600-610

  [4]Huang J,Yuen P C.Choosing Parameters of kernel subspace LDA for recognition of face images under pose and illumination variations[J].IEEE Transactions on Cybernetics,2007,37(4):847-862

  [5]Yang A Y,Zhou Z H.Fast L1-Minimization Algorithms for Robust Face Recognition[J].IEEE TRANSACTIONS ON IMAGE PROCESSING,2013,22(8):3234-3246

  [6]平強(qiáng),莊連生,等.姿態(tài)魯棒的分塊稀疏表示人臉識別算法[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2011,41(11):975-981

  [7]李月琴,栗蘋,等.無線電引信信號去噪的最優(yōu)小波基選擇[J].北京理工大學(xué)學(xué)報(bào),2008,28(8):723-726

  [8]Chan W L,Choi H,Baraniuk R G.Coherent multiscale image processing using dual-tree quaternion wavelets[J].IEEE Transactions on Image,2008,17(7):1069-1082

  [9]Inoue K,Kuroki Y.Illumination-robust face recognition via sparse representation[C].IEEE of Visual Communications and Image Processing, 2011:1-4

  [10]Donoho D.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306

  [11]Soulard R,Carre P. Quaternionic wavelets for texture classification[J]. Pattern Recognition Letters,2011,32(13)1669-1678

  [12]Oliver research laboratory[DB/OL].http//www.uk.research.att.Com/data/att_faces.Zip.Cambridge

全息投影相關(guān)文章:全息投影原理


關(guān)鍵詞: 小波包變換 人臉識別 201404

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉