基于單演主方向中心對(duì)稱局部二值模式的單樣本人臉識(shí)別
作者/ 楊毅 楊恢先 唐金鑫 張書豪 湘潭大學(xué) 物理與光電工程學(xué)院(湖南 湘潭 411105)
本文引用地址:http://2s4d.com/article/201708/363626.htm楊毅(1992-),男,碩士,研究方向:模式識(shí)別。
摘要:本文針對(duì)單樣本情況下傳統(tǒng)人臉識(shí)別方法在姿態(tài)、表情和光照等變化下識(shí)別效果不佳的問題,提出一種基于單演主方向中心對(duì)稱局部二值模式的單樣本人臉識(shí)別模式的單樣本人臉識(shí)別算法。首先用多尺度的單演濾波器提取人臉圖像單演局部幅值和局部方向信息,并求取主方向,生成主方向模式圖;然后用CS-LBP算子進(jìn)行編碼,得到特征;最后對(duì)不同單演尺度空間中的特征分塊統(tǒng)計(jì)特征直方圖并運(yùn)用直方圖相交進(jìn)行分類識(shí)別。在AR、Extend Yale B人臉數(shù)據(jù)庫的實(shí)驗(yàn)結(jié)果表明,該算法簡(jiǎn)單有效,對(duì)光照、表情、部分遮擋變化具有較好的魯棒性。
引言
近年來,人臉識(shí)別由于具有友好、非侵犯性等優(yōu)點(diǎn)成為機(jī)器視覺和圖像處理領(lǐng)域的研究熱點(diǎn),并在經(jīng)濟(jì)、司法、安保領(lǐng)域得到了廣泛的應(yīng)用[1]。在多數(shù)實(shí)際的應(yīng)用場(chǎng)合下,數(shù)據(jù)庫只能采集到單幅人臉圖像作為訓(xùn)練樣本,如身份證、護(hù)照、駕駛證等數(shù)據(jù)庫[2]。在這種單樣本的情況下,一些具有代表性的傳統(tǒng)人臉識(shí)別算法就很難取得理想的效果。目前,單樣本人臉識(shí)別的研究主要集中在提取不變特征、樣本擴(kuò)張、特征子空間擴(kuò)展、圖像增強(qiáng)和三維識(shí)別等方面[3]。
中心對(duì)稱局部二值模式(Center symmetric local binary pattern,CS-LBP)是一種對(duì)LBP改進(jìn)的有效局部紋理描述算子,CS-LBP的特征維數(shù)少于LBP,節(jié)省特征提取與匹配時(shí)間。文獻(xiàn)[4]中,Ngoc-Son Vu 等人提出了基于圖像梯度的主方向模式 (Patterns of Dominant Orientations, PDO)特征提取算法,也取得了不錯(cuò)的識(shí)別效果。文獻(xiàn)[5]提出一種基于Gabor 的二元模式方法(Local gabor binary patterns, LGBP),雖然LGBP 的識(shí)別率與魯棒性比LBP大為增強(qiáng),但得到40幅不同的Gabor特征,其時(shí)間和空間的復(fù)雜度是驚人的[6]。單演信號(hào)作為一維信號(hào)在二維空間的拓展,能夠有效地將圖像正交分解為幅值,相位和方向信息[7]。單演濾波所需要的時(shí)間和空間復(fù)雜度遠(yuǎn)遠(yuǎn)小于Gabor濾波[8]。文獻(xiàn)[9]將單演和局部二值模式(Monogenic binary patterns,MBP)用于人臉識(shí)別,取得了很好的實(shí)驗(yàn)效果。但只是在像素層次對(duì)單演幅值進(jìn)行編碼,缺乏對(duì)區(qū)域變化信息的把握能力,且沒利用到單演方向信息。為了能充分利用單演幅值和單演方向信息,且在文獻(xiàn)[9]的啟發(fā)下,提出了一種基于單演主方向中心對(duì)稱局部二值模式(Monogenic dominant orientations center-symmetric local binary pattern,MDOCSBP)的單樣本人臉識(shí)別方法。首先利用人臉圖像的單演局部幅值和局部方向來獲取主方向模式圖,然后采用CS_LBP對(duì)主方向圖進(jìn)行編碼得到MDOCSBP特征,最后分塊統(tǒng)計(jì)MDOCSBP特征直方圖并運(yùn)用直方圖相交進(jìn)行分類識(shí)別。
單演信號(hào)是一維解析信號(hào)的二維擴(kuò)展,以一種旋轉(zhuǎn)不變的方式來描述圖像的局部幅度、局部方向和局部相位信息。單演信號(hào)是建立在Riesz變換的基礎(chǔ)上的,Riesz變換是Hilbert變換的二維擴(kuò)展。
2 主方向的求取
2011 年 Ngoc-Son Vu 等人提出了基于圖像梯度的 PDO 特征提取算法。文獻(xiàn)[9]中,主方向的計(jì)算是在圖像的梯度圖上完成的,是指細(xì)胞單元(cell)內(nèi)像素的梯度方向累積變化最多的方向,即該cell的主方向。受其啟發(fā),本文對(duì)單演特征中的局部幅度和局部方向信息進(jìn)行與之相似的處理。針對(duì) Cell 內(nèi)每個(gè)像素,以該像素處的單演幅值為權(quán)值,為該像素單演方向所在的直方圖通道Δθ進(jìn)行加權(quán)投票,通道數(shù),其中直方圖的峰值所對(duì)應(yīng)方向即為cell中心像素的主方向θm。
(9)
式中,表示向下取整。
Cell單元內(nèi)各像素點(diǎn)主方向求取如圖1所示。
3 中心對(duì)稱局部二值模式
CS-LBP是在LBP基礎(chǔ)上采用中心對(duì)稱思想對(duì)圖像進(jìn)行編碼的局部紋理描述算子。在半徑為R的圓形鄰域內(nèi),CS-LBP算子通過比較以中心像素點(diǎn)gc為中心的像素值對(duì)gi與gi+4(i=0,1,2,3)的灰度值大小,大于等于0時(shí)相應(yīng)的二進(jìn)制編碼位則為1,反之為0。并將二進(jìn)制數(shù)轉(zhuǎn)化為十進(jìn)制數(shù)得到CS-LBP值。記作CS-LBP(P,R)。本文算法采用CS-LBP(8,4)。LBP與CS-LBP特征提取過程如圖2所示。
LBP與CS-LBP的編碼公式為:
式中,(P,R)表示圓鄰域,R為圓的半徑,P為圓周上像素點(diǎn)個(gè)數(shù),且N=P,gc為中心點(diǎn)像素,gi為圓周上的P個(gè)像素在(P,R)鄰域內(nèi)。由式(10)和式(11) 可知,CS-LBP編碼方式得到的二進(jìn)制數(shù)長(zhǎng)度為L(zhǎng)BP的一半,從而使CS-LBP在提取的特征維數(shù)、計(jì)算開銷方面具有較明顯的優(yōu)勢(shì)。
4 人臉的MDOCSBP特征
1)采用尺度為S的單演濾波器對(duì)人臉圖像進(jìn)行濾波,MDOCSBP算法固定采用尺度為3的單演濾波器,即S=(1,2,3)。則每個(gè)尺度下都能得到局部幅值A(chǔ)S、局部方向θS兩種模式圖;
2)對(duì)同一尺度下的單演幅值和單演方向,以單演幅值為權(quán)值對(duì)單演方向所在的直方圖通道Δθ進(jìn)行加權(quán)投票求取單演主方向θm;
3)對(duì)產(chǎn)生S尺度下的主方向圖進(jìn)行CS-LBP(P,R)編碼得到MDOCSBP模式圖;
4)將同一張人臉的得到的S張MDOCSBP模式圖分別進(jìn)行分塊,通過實(shí)驗(yàn)確定其最優(yōu)分塊數(shù),計(jì)算每一小塊的統(tǒng)計(jì)直方圖特征并將所有分塊的直方圖特征串聯(lián)起來構(gòu)成人臉圖像的MDOCSBP特征。
5 人臉特征匹配
算法用最近鄰分類器進(jìn)行人臉匹配,人臉圖片之間的相似度通過直方圖相交的方式來衡量。若兩幅圖片的直方圖特征向量分別為H1、H2,則兩個(gè)圖片的相似度為:
(13)
6 實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證MDOCSBP算法的有效性,實(shí)驗(yàn)在均已被剪裁好的AR人臉庫、Extend Yale B人臉庫上進(jìn)行測(cè)試。
AR人臉庫實(shí)驗(yàn)統(tǒng)一選取人臉庫中每個(gè)人的第一幅圖像作為訓(xùn)練樣本, 測(cè)試集由4個(gè)子集組成, 分別為表情變化集、光照變化集、遮擋集A和遮擋集B。Extend Yale B人臉庫實(shí)驗(yàn)分別從不同光照情況下各子集隨機(jī)選取3幅人臉作為測(cè)試集,識(shí)別率為測(cè)試20次的平均值。AR、Extend Yale B人臉庫部分圖像如圖4、圖5所示。
評(píng)論