基于聚類算法人臉識(shí)別方法的研究
RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)調(diào)整
本文引用地址:http://2s4d.com/article/115695.htm定義誤差函數(shù)為:
其中,lky和lkt表示在輸出層ky節(jié)點(diǎn)上對(duì)應(yīng)第l個(gè)訓(xùn)練樣本的實(shí)際輸出值和理想輸出值。通過(guò)線性最小二乘法求解最佳連接權(quán)值*W。
RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練收斂性能,如圖2的實(shí)例所示。圖2為RBF神經(jīng)網(wǎng)絡(luò)誤差輸出曲線圖,圖中的橫軸表示RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練的迭代次數(shù),縱軸表示RBF神經(jīng)網(wǎng)絡(luò)實(shí)際誤差的輸出值,即訓(xùn)練迭代一次新網(wǎng)絡(luò)的輸出值與原先網(wǎng)絡(luò)按誤差函數(shù)公式(2)計(jì)算得到的結(jié)果。實(shí)驗(yàn)條件為在Yale數(shù)據(jù)庫(kù)中,選取15個(gè)類別的人臉圖像,每個(gè)類別選取11張人臉圖像作為訓(xùn)練樣本,提取每個(gè)人臉圖像的特征值數(shù)量為90,對(duì)應(yīng)于網(wǎng)絡(luò)的訓(xùn)練集為一個(gè)165×90的矩陣時(shí),得到RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練的誤差函數(shù)輸出情況。在具體實(shí)驗(yàn)中,設(shè)定RBF神經(jīng)網(wǎng)絡(luò)停止參數(shù)訓(xùn)練調(diào)整的條件為:當(dāng)前一次系統(tǒng)輸出誤差值與當(dāng)前系統(tǒng)輸出誤差值的變化量相差小于0.01時(shí),RBF神經(jīng)網(wǎng)絡(luò)停止參數(shù)訓(xùn)練調(diào)整。圖2表明,RBF 神經(jīng)網(wǎng)絡(luò)的誤差輸出值下降得很快,在迭代過(guò)程不到15次的情況下,誤差曲線就進(jìn)入系統(tǒng)誤差值輸出相差較小的范圍內(nèi),收斂速度較快。
聚類算法的仿真實(shí)驗(yàn)
參數(shù)設(shè)定值的不同,將對(duì)基于聚類算法的人臉圖像識(shí)別的結(jié)果產(chǎn)生影響,例如對(duì)子圖像劃分的個(gè)數(shù)、子圖像奇異值向量保留的個(gè)數(shù)、聚類因數(shù)α、γ因數(shù)的選取等。對(duì)不同參數(shù)初始化時(shí)設(shè)定不同的數(shù)值,將得到的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比和綜合分析,進(jìn)而確定包括輸入層、輸出層、隱含層節(jié)點(diǎn)數(shù)目及其核函數(shù)的選取等在內(nèi)的合理的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),確定包括貝葉斯分類器的權(quán)值分配、閾值選取等在內(nèi)的合適融合策略,以便進(jìn)行深入的研究。
實(shí)驗(yàn)中,訓(xùn)練樣本為Yale人臉庫(kù)中的每人前6張照片,共90張,測(cè)試樣本為每人的后5張照片,共75張。樣本完整訓(xùn)練誤差容限為1,訓(xùn)練最大次數(shù)為120。
(1)在γ因數(shù)取為0.8、子圖像的數(shù)目為32塊、保留子圖像的奇異值個(gè)數(shù)為10的條件下,測(cè)試不同聚類因數(shù)α取值、不同聚類個(gè)數(shù)(即RBF神經(jīng)網(wǎng)絡(luò)隱含節(jié)點(diǎn)個(gè)數(shù))情況下的識(shí)別率。如圖3中data1所示。
實(shí)驗(yàn)結(jié)果表明,隨著聚類因數(shù)α的增大,聚類個(gè)數(shù)也在增多,當(dāng)α>3.0以后,識(shí)別率趨于穩(wěn)定。而且,在RBF神經(jīng)網(wǎng)絡(luò)中隱含層節(jié)點(diǎn)數(shù)增多的情況下,會(huì)加大RBF神經(jīng)網(wǎng)絡(luò)的計(jì)算負(fù)擔(dān)。因此,最終選擇聚類因數(shù)α=3.5,來(lái)進(jìn)一步研究子圖像權(quán)重的賦值。
(2)在聚類因數(shù)α取為3.5、子圖像的數(shù)目為32塊、保留子圖像的奇異值個(gè)數(shù)為10的條件下,測(cè)試不同γ因數(shù)情況下的識(shí)別率,如圖3中data2所示(data2與data3重合)。實(shí)驗(yàn)結(jié)果表明,在γ因數(shù)逐漸增大的情況下,識(shí)別率隨之逐漸提高并趨于穩(wěn)定。因此,最終選擇γ=0.8,來(lái)進(jìn)一步研究子圖像權(quán)重的賦值。
(3)在聚類因數(shù)α取為3.5、γ因數(shù)取為0.8、子圖像的數(shù)目為32塊的條件下,測(cè)試每個(gè)子圖像保留不同奇異值個(gè)數(shù)時(shí)識(shí)別率的情況,如圖3中data3所示。實(shí)驗(yàn)結(jié)果表明,在子圖像的奇異值個(gè)數(shù)增加的情況下,識(shí)別率的有所增加并趨于穩(wěn)定。最終選擇保留子圖像的奇異值個(gè)數(shù)為10,來(lái)進(jìn)一步研究子圖像權(quán)重的賦值。
(4)在聚類因數(shù)α取為3.5、γ因數(shù)取為0.8的條件下,測(cè)試保留不同奇異值特征個(gè)數(shù)時(shí)識(shí)別率的情況。如圖3中data4所示,其中,每個(gè)子圖像保留奇異值的個(gè)數(shù)×子圖像數(shù)目=每幅圖像的奇異值特征個(gè)數(shù)。
實(shí)驗(yàn)結(jié)果表明,人臉圖像劃分的子圖像數(shù)目較多的情況下,識(shí)別率較高,而且當(dāng)子圖像的數(shù)目達(dá)到32塊時(shí),識(shí)別率已經(jīng)趨于穩(wěn)定狀態(tài)。人臉圖像劃分的子圖像數(shù)目不宜過(guò)多,這樣會(huì)使每幅人臉圖像的奇異值特征個(gè)數(shù)過(guò)大,進(jìn)而增加RBF神經(jīng)網(wǎng)絡(luò)的計(jì)算負(fù)擔(dān)。最終選擇子圖像的數(shù)目為32塊的情況,來(lái)進(jìn)一步研究子圖像權(quán)重的賦值。
仿真實(shí)驗(yàn)結(jié)果分析
基于上述仿真實(shí)驗(yàn)數(shù)據(jù)進(jìn)行參數(shù)設(shè)定,在人臉識(shí)別仿真系統(tǒng)中測(cè)試情況如圖4所示。
根據(jù)實(shí)驗(yàn)結(jié)果確定聚類因數(shù) α=3.5、γ=0.8、保留子圖像的奇異值個(gè)數(shù)為10。人臉圖像的子圖像數(shù)目對(duì)應(yīng)于RBF神經(jīng)網(wǎng)絡(luò)輸入空間的維數(shù)r,樣本庫(kù)中的人臉圖像類別數(shù)對(duì)應(yīng)于輸出空間的維數(shù)s,每類人臉圖像樣本的子圖像的特征空間數(shù)目對(duì)應(yīng)隱含層節(jié)點(diǎn)數(shù)u,根據(jù)上述實(shí)驗(yàn)結(jié)果調(diào)整u不超過(guò)120。對(duì)人臉圖像進(jìn)行分塊,在樣本數(shù)量很大、維數(shù)很高的情況下,有效地減少了計(jì)算量。但是,子圖像數(shù)目不宜過(guò)多,否則增加神經(jīng)網(wǎng)絡(luò)計(jì)算負(fù)擔(dān),識(shí)別率也會(huì)有所下降。
結(jié)語(yǔ)
本文研究了基于聚類算法的人臉識(shí)別方法。根據(jù)人臉圖像劃分子圖像的數(shù)目和所選定的訓(xùn)練或測(cè)試人臉圖像的類別數(shù)的情況,確定RBF神經(jīng)網(wǎng)絡(luò)的輸入層、輸出層的節(jié)點(diǎn)數(shù);根據(jù)RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練識(shí)別效果,通過(guò)調(diào)整中間隱含層節(jié)點(diǎn)數(shù)、核函數(shù)及其中心點(diǎn)和寬度,通過(guò)基于聚類算法的人臉識(shí)別仿真實(shí)驗(yàn),具體量化了中間隱含層節(jié)點(diǎn)數(shù)與子圖像的對(duì)應(yīng)關(guān)系、每幅子圖像中奇異值向量的保留個(gè)數(shù)、聚類因數(shù)的選取等各項(xiàng)參數(shù),為進(jìn)一步根據(jù)各個(gè)子圖像權(quán)值的合理分配,提高人臉識(shí)別的識(shí)別精度和良好的識(shí)別速度提供了有效的參數(shù)支持。
評(píng)論