基于Gabor小波與RBF神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別新方法

作者：時(shí)間：2009-08-10 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

1 引言
人臉 識(shí)別是人類最杰出的認(rèn)知能力之一，讓汁算機(jī)具有人的智能，使它可以象人類一樣辨認(rèn)人，一直是眾多計(jì)算機(jī)科學(xué)工作者追求的目標(biāo)。人臉 識(shí)別作為一種應(yīng)用前景十分廣泛的身份鑒別方法，是模式識(shí)別領(lǐng)域極富挑戰(zhàn)性的一個(gè)熱點(diǎn)研究問題。
人臉圖像由于受光照、表情以及姿態(tài)等因素的影響，同一個(gè)人的臉像矩陣差異也比較大，人臉識(shí)別所選取的特征必須對(duì)上述因素具備一定的穩(wěn)定性和不變性。Gabor小波是Gabor變換與小波理論相結(jié)合的產(chǎn)物，它繼承了小波變換的多分辨率特性，同時(shí)具有GaborN數(shù)本身所具有的局域性和方向性。VD Malsburg小組最先將Gabor小波引入人臉識(shí)別領(lǐng)域，應(yīng)用Gabor小波與彈性圖匹配技術(shù)相結(jié)合取得了良好的識(shí)別效果。Gabor小波核函數(shù)具有與哺育動(dòng)物大腦皮層簡(jiǎn)單細(xì)胞的二維反射區(qū)相同的特性，即具有較強(qiáng)的空間位置和方向選擇性，并且能夠捕捉對(duì)應(yīng)于空間和頻率的局部結(jié)構(gòu)信息；Gabor濾波器對(duì)于圖像的亮度和對(duì)比度變化以及人臉姿態(tài)變化具有較強(qiáng)的健壯性，并且它表達(dá)的是對(duì)人臉識(shí)別最為有用的局部特征。
提高神經(jīng)網(wǎng)絡(luò)的泛化能力問題是RBF網(wǎng)絡(luò)的一個(gè)重要研究方向。目前，提高網(wǎng)絡(luò)泛化能力的研究主要集中在如何選取恰當(dāng)?shù)木W(wǎng)絡(luò)規(guī)模，即網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)問題上。關(guān)于RBFN絡(luò)結(jié)構(gòu)設(shè)計(jì)，一個(gè)公認(rèn)的指導(dǎo)原則是Moody準(zhǔn)則，即：在沒有其它先驗(yàn)知識(shí)的情況下，與給定樣本一致的規(guī)模最小的網(wǎng)絡(luò)就是最好的選擇。
本文充分利用人臉特征矢量的相對(duì)分布信息，提出了一種新的聚類初始化方法，能使RBFN絡(luò)逼近于Moody準(zhǔn)則下的最優(yōu)結(jié)構(gòu)，從而保證該網(wǎng)絡(luò)具有較好的泛化能力。由于在隱層參數(shù)固定的條件下，線性方程組的最小二乘解就是全局最優(yōu)解，所以本文采用混合學(xué)習(xí)算法：由線性最小二乘法計(jì)算隱層和輸出層之間的連接權(quán)值，由梯度下降法調(diào)整隱層神經(jīng)元的中心和寬度。這種方法與單純采用梯度下降法相比，學(xué)習(xí)速度更快，而且可以避免局部極小值問題。同時(shí)提出了一種有效的學(xué)習(xí)速率估算方法，使得RBF網(wǎng)絡(luò)的整個(gè)學(xué)習(xí)過程具備自適應(yīng)能力。

2 基于Gabor小波的人臉特征提取
2．1 構(gòu)造Gabor小波
Gabor小波核函數(shù)定義如下：

本文引用地址：http://2s4d.com/article/157900.htm

上式表示一個(gè)經(jīng)過高斯包絡(luò)調(diào)制過的正弦波，其中控制高斯窗口的寬度以及正弦波的波長(zhǎng)，φ控制整個(gè)濾波器的方向，改變?chǔ)湛梢詫?duì)濾波器進(jìn)行旋轉(zhuǎn)，σ為高斯窗的寬度與正弦波的波長(zhǎng)之比。ψk經(jīng)過平移、旋轉(zhuǎn)和尺度變化形成一個(gè)自相似的函數(shù)族，即Gabor濾波器組。
對(duì)于數(shù)字圖像，需要把參數(shù)k的模||k||和方向參數(shù)φ進(jìn)行離散化，通常在5個(gè)對(duì)數(shù)空間頻率v∈{0…，4}8個(gè)方向μ∈{0，…，7}上采樣。針對(duì)人臉圖像本文通過實(shí)驗(yàn)確定在2個(gè)空問頻率v∈{1，2}和8個(gè)方向μ∈{0，…，7}上進(jìn)行采樣，形成16個(gè)Gabor濾波器。
2．2 人臉圖像Gabor濾波
將人臉灰度圖像插值為128×128(記為I)，再分別與各個(gè)Gabor濾波器進(jìn)行卷積，得到人臉圖像的Gabor小波表示：

稱Oμ，v(z)為Gabor人臉，其中z=(x，y)為相對(duì)于頻譜中心的相對(duì)坐標(biāo)值。通過二維快速傅立葉變換，將時(shí)域卷積變換為頻域乘積運(yùn)算以提高計(jì)算速度。
2．3 小波分解降維
每幅Gabor人臉圖像Oμ，v(z)都是與I(z)同樣大小的復(fù)數(shù)矩陣，取其幅值系數(shù)作為特征。通過參數(shù)μ，v的變化，Oμ，v(z)表達(dá)不同頻率和方向的人臉特征信息，將一幅人臉的全部Gabor特征組成矢量，則人臉的原始特征數(shù)據(jù)高達(dá)262144維，后續(xù)處理非常困難。ChenKiun Liu分別取采樣因子ρ=4，16,64進(jìn)行下采樣處理，所得識(shí)別結(jié)果相差很小，所以采樣法最低可以得到4096維。而小波變換是一種常用的圖像壓縮方法，與采樣法相比具有能量和信息損失小的優(yōu)點(diǎn)。Harmon指出16×16的圖像對(duì)于人臉識(shí)別是最基本的。因而，本文對(duì)Gabor人臉進(jìn)行3次小波分解，將其低頻近似圖按行連接起來(lái)組成列矢量，并將全部列矢量依次連接起來(lái)，即為一幅人臉的低維Gabor特征列矢量。
2．4 主分量分析
設(shè)n為訓(xùn)練樣本數(shù)目，Xi表示第i幅人臉圖像的L維Gabor特征列矢量，則訓(xùn)練樣本集的總體散布矩陣表示為：

式中為樣本均值。由于St為實(shí)對(duì)稱矩陣(L×L)，可將St化成對(duì)角形的特征值，P為正交變換矩陣，且特征值均非負(fù)值，令λ1≥λ2≥…λL≥0，λl對(duì)應(yīng)的正交歸一化特征向量為ul，則u1，u2，…，uL可以構(gòu)成RL空間的一組標(biāo)準(zhǔn)正交基，在該正交特征空間中，人臉樣本Xi可以表示為：

選用前r(rL)個(gè)較大特征值對(duì)應(yīng)的特征向量作為正交基底(主分量)，將Xi向該正交空間的子空間投影則有：

得到Pi=xi(1)，xi(2)，…，xi(r)為一組坐標(biāo)系數(shù)，代表了Xi在新特征子空間中的位置，可將r維投影系數(shù)Pi作為人臉特征矢量輸入分類器進(jìn)行識(shí)別。

3 基于RBF神經(jīng)網(wǎng)絡(luò)的分類器設(shè)計(jì)
RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示，它是一種三層前向網(wǎng)絡(luò)，其中r、u和s分別為輸入層、隱層和輸出層的節(jié)點(diǎn)數(shù)。

為隱層第k個(gè)神經(jīng)元的中心，則隱層節(jié)點(diǎn)k的輸出為：
式中||?||表示歐氏范數(shù)。當(dāng)RBF選用高斯核函數(shù)時(shí)，其輸出為：

式中σk為隱層第k個(gè)神經(jīng)元的寬度。輸出層第j個(gè)節(jié)點(diǎn)的輸出值yj為：

式中W(j，k)為隱層節(jié)點(diǎn)k到第j個(gè)輸出節(jié)點(diǎn)的連接權(quán)值。
3．1 RBF網(wǎng)絡(luò)初始化
RBF神經(jīng)網(wǎng)絡(luò)可看作是從特征子空間到類的映射，因此輸入層的節(jié)點(diǎn)數(shù)與輸入特征矢量的維數(shù)r相等，輸出層的節(jié)點(diǎn)數(shù)就是待分類樣本的類別數(shù)。隱層節(jié)點(diǎn)的選取是一個(gè)開放的問題，在理想情況下，隱層節(jié)點(diǎn)數(shù)取得最小值為樣本類別數(shù)。每個(gè)人最多對(duì)應(yīng)2～3個(gè)隱層節(jié)點(diǎn)，隱層聚類的初始化過程如下：
1)先假設(shè)每人收斂于一個(gè)聚類中心，將隱層節(jié)點(diǎn)數(shù)初始化為輸出層節(jié)點(diǎn)數(shù)。
2)隱層第k個(gè)神經(jīng)元的中心Ck為k類特征矢量的均值。
3)計(jì)算k類各個(gè)樣本到中心Ck的距離，以最遠(yuǎn)點(diǎn)Pk(f)到中心的距離作為σk的初值。
4)計(jì)算各個(gè)聚類中心j到聚類中心k的距離：

其中，最小距離為：

根據(jù)dmin(k，l)與dk，dl的關(guān)系，可將k類分為如下幾種情況：
a)若dk+dl≤dmin(k，l)，則k類與其它類沒有重疊，如圖2(a)所示；
b)若dk+dl>dmin(k，l)，則k類與其它類相交。進(jìn)一步分為兩種情況：
i)dk一dldmin(k，l)，如圖2(b)所示；
ii)dk一dl≥dmin(k，l)，如圖2(c)所示，表示k類包含其它類，可能導(dǎo)致RBF神經(jīng)網(wǎng)絡(luò)分類錯(cuò)誤。
5)對(duì)每類樣本，依次按照以下兩個(gè)規(guī)則進(jìn)行判別并細(xì)分：
i)包含規(guī)則：若dk+dl>dmin(k，l)且dk一dl≥dmin(k，l)，則k類包含其它類，必須將k類細(xì)分為兩個(gè)聚類；
ii)正確歸類規(guī)則：若k類包含其它類樣本的個(gè)數(shù)大于1，必須將k類細(xì)分為兩個(gè)聚類。

矢量控制相關(guān)文章:矢量控制原理

新聞中心

基于Gabor小波與RBF神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別新方法

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)