基于人臉形狀特征的精確定位解析方案
1研究背景
本文引用地址:http://2s4d.com/article/160599.htm生物識(shí)別技術(shù)是目前最為方便與安全的識(shí)別系統(tǒng)。生物識(shí)別是依靠人體的身體特征來(lái)進(jìn)行身份驗(yàn)證的一種解決方案。由于與傳統(tǒng)的生物識(shí)別技術(shù)相比,人臉識(shí)別因具有更為簡(jiǎn)便、準(zhǔn)確、經(jīng)濟(jì)及可擴(kuò)展性良好等眾多優(yōu)勢(shì)而普遍為人們所看好,被廣泛應(yīng)用于安全驗(yàn)證、監(jiān)控、控制等各個(gè)方面。但到目前為止,能夠滿足人們需求的理想系統(tǒng)尚未出現(xiàn)[1]。
根據(jù)FERET’97 測(cè)試報(bào)告[2],目前的人臉識(shí)別算法對(duì)于不同的攝像機(jī)、不同的光照條件和年齡變化的適應(yīng)能力非常差。FRVT’2000評(píng)測(cè)[3]結(jié)果表明,人臉識(shí)別系統(tǒng)的性能與FERET’97的測(cè)試相比有了一定的進(jìn)步,但其識(shí)別性能對(duì)各種條件,如光照、老化、距離、姿態(tài)等,仍然離人們的期望值較遠(yuǎn)。
2問(wèn)題的提出
本文僅考慮單人正面靜態(tài)灰度圖像,著重考慮人臉圖像的檢測(cè)和定位,不考慮頭部的俯仰、旋轉(zhuǎn)以及穿戴、遮蔽的情況,而且頭部的傾斜不超過(guò)15°。
本文的研究工作主要是提出了結(jié)合人臉模板和人臉特征進(jìn)行人臉檢測(cè)的方法,對(duì)現(xiàn)有的人臉檢測(cè)與定位的方法提出了改進(jìn),進(jìn)而提取臉部特征,并在此基礎(chǔ)上實(shí)現(xiàn)了一個(gè)智能識(shí)別系統(tǒng)演示軟件。本文所采用的方法,主要是基于參數(shù)化的橢圓型人臉模板與基于眼睛及嘴巴幾何特征相結(jié)合的人臉定位方法,以及根據(jù)其眼睛、鼻部及嘴部的幾何特征參數(shù),對(duì)實(shí)驗(yàn)人臉庫(kù)進(jìn)行監(jiān)督下的分類和統(tǒng)計(jì)的人臉識(shí)別方法。所采用的人臉數(shù)據(jù)庫(kù)是BioID人臉庫(kù)。
3基于人臉識(shí)別技術(shù)的智能系統(tǒng)設(shè)計(jì)方案
人臉自動(dòng)識(shí)別系統(tǒng)包括下列主要技術(shù)環(huán)節(jié)[4],首先是人臉檢測(cè)和定位,即從輸入圖像中找到人臉及人臉存在的位置,并將人臉從背景中分割出來(lái),然后才是對(duì)歸一化的人臉圖像進(jìn)行特征提取與識(shí)別。這兩個(gè)環(huán)節(jié)的研究獨(dú)立性很強(qiáng)。由于在很多特定情況下,人臉檢測(cè)與定位的工作比較簡(jiǎn)單,因此“特征提取與識(shí)別”環(huán)節(jié)得到了更為廣泛和深入的研究;而近幾年來(lái)隨著人們?cè)絹?lái)越關(guān)心各種復(fù)雜情形下的人臉自動(dòng)識(shí)別系統(tǒng),人臉檢測(cè)與定位才得到了較多的重視。
評(píng)價(jià)一個(gè)人臉自動(dòng)識(shí)別系統(tǒng)的標(biāo)準(zhǔn),一個(gè)是誤識(shí)率即將某人錯(cuò)識(shí)別為其他人,另一個(gè)是虛警率即將其他人識(shí)別為這個(gè)人。這二者之間是存在矛盾的,所以在實(shí)際問(wèn)題中往往需要進(jìn)行某種折衷。這一點(diǎn)同樣適用于特征提取與識(shí)別環(huán)節(jié),但是對(duì)于人臉檢測(cè)與定位,我們一般則要求誤識(shí)率要盡可能低,因?yàn)檫@樣才可以保證所要識(shí)別的人不會(huì)在這一步就丟失。
常用的人臉識(shí)別實(shí)驗(yàn)庫(kù)以美國(guó)軍方的FERET 庫(kù)最為權(quán)威。另外如MIT、ORL 等庫(kù)也可以用來(lái)驗(yàn)證算法在某些方面的能力。目前尚沒(méi)有專門測(cè)試人臉檢測(cè)和定位算法的圖像庫(kù)。
4.1 人臉特征的檢測(cè)
特征檢測(cè)是人臉識(shí)別智能系統(tǒng)中的關(guān)鍵環(huán)節(jié),因?yàn)檠劬Α⒈亲雍妥彀偷忍卣骷辛巳四樀娜瞬糠中畔?。?duì)于人臉建模來(lái)說(shuō),不僅要檢測(cè)出這些特征,而且要準(zhǔn)確地加以定位。
假設(shè)人臉的姿態(tài)比較正,那么人臉上的特征是水平邊緣集中的區(qū)域。我們可以在低分辨率下提取水平邊緣,然后找到人臉區(qū)域內(nèi)富含這些邊緣的連通區(qū),作為人臉特征的候選區(qū)域。這些區(qū)域的位置和大小并不準(zhǔn)確,因?yàn)檫吘墮z測(cè)本身容易出現(xiàn)位置偏移,連通區(qū)的大小也隨閾值而變化。所以還需要進(jìn)一步修正上面的結(jié)果。對(duì)正面的人臉來(lái)說(shuō),眼睛、嘴巴等特征和整個(gè)人臉的尺寸之間存在先驗(yàn)的約束關(guān)系,這就是人臉結(jié)構(gòu)的恒常性,因此我們利用這些約束關(guān)系確定特征區(qū)域的大小。
圖1 眼睛輪廓模型
評(píng)價(jià)函數(shù)的選擇是關(guān)鍵。眼睛本身不具有—致的顏色信息,而邊緣信息比較豐富。因此,先對(duì)圖像進(jìn)行邊緣提取,然后作適當(dāng)尺度的閉運(yùn)算,就可以使眼睛內(nèi)部形成單一的高亮度區(qū)。在處理過(guò)的圖像中,眼睛內(nèi)部是高亮度區(qū),外部是低亮度區(qū)。因此可以定義評(píng)價(jià)函數(shù)如式(1)所示。其中D表示眼睛區(qū)域, 表示眼睛輪廓之外的帶狀區(qū)域, 表示輪廓之內(nèi)的帶狀區(qū)域。根據(jù)4段曲線表達(dá)式得到的眼睛區(qū)域可以初始化眼睛的輪廓,然后用最陡下降法迭代直至該輪廓收斂。
(1)
嘴巴輪廓的模型如圖2所示。由兩段四次曲線組成,曲線的參數(shù)有7個(gè):嘴巴的中心(x0,y0)、連接兩嘴角的直線傾角θ、上下半嘴的高度h1和h2、嘴角到嘴巴中心的距離w,以及上下半嘴的四次項(xiàng)系數(shù)q1和q2。
圖2 嘴巴輪廓的模型
嘴巴的評(píng)價(jià)函數(shù)比較容易確定,可以通過(guò)唇色和膚色的分割將嘴巴區(qū)分出來(lái)。評(píng)價(jià)函數(shù)的表達(dá)式如式(2)所示。各符號(hào)的含義與眼睛模型相似。
評(píng)論