一文讀懂人臉識別技術
近日,人臉識別技術因多次在抓逃犯的過程中“立功”,再度走“紅”。從20世紀60年代起,人臉識別研究開啟,發(fā)展到今天有哪些進展?該產(chǎn)業(yè)里的競爭,是人工智能投資泡沫帶來的浮躁,還是市場規(guī)模將持續(xù)突進?
本文引用地址:http://2s4d.com/article/201902/397451.htm何謂人臉識別技術?
20世紀60年代,人臉識別工程化應用研究正式開啟。初期的方法主要利用了人臉的幾何結構,通過分析人臉器官特征點及其之間的拓撲關系進行辨識。這種方法簡單直觀,但是一旦人臉姿態(tài)、表情發(fā)生變化,則精度嚴重下降。
如今的解決方案多是基于主動近紅外圖像的多光源人臉識別技術。它可以克服光線變化的影響,已經(jīng)取得了卓越的識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別。
劃重點!
1.人臉識別技術原理:
一是建立一個包含大批量人臉圖像的數(shù)據(jù)庫;二是通過各種方式來獲得當前要進行識別的目標人臉圖像;三是將目標人臉圖像與數(shù)據(jù)庫中既有的人臉圖像進行比對和篩選。
2.人臉識別技術流程:
(1)圖像的采集與預處理
人臉圖像的采集一般分為兩種途徑,有人臉圖像的批量導入和人臉圖像的實時采集;預處理的目的是在系統(tǒng)對人臉圖像的檢測基礎之上,對人臉圖像做出進一步的處理以利于人臉圖像的特征提取。
(2)人臉檢測
人臉檢測方法可分為三類,分別是基于膚色模型的檢測、基于邊緣特征的檢測、基于統(tǒng)計理論方法。
(3)人臉特征提取
目前主流的人臉識別系統(tǒng)可支持使用的特征通??煞譃槿四樢曈X特征、人臉圖像像素統(tǒng)計特征等,而人臉圖像的特征提取就是針對人臉上的一些具體特征來提取的。
(4)人臉識別和活體鑒別
實際的人臉識別系統(tǒng)一般需要增加活體鑒別環(huán)節(jié),因為生物特征識別的共同問題之一就是要區(qū)別該信號是否來自于真正的生物體,這種信號包括要求人左右轉頭,眨眼睛,開開口說句話等。
技術不斷發(fā)展
市場上應用最多的是三種方案,包括3D結構光方案、ToF 3D方案和雙目立體成像方案。
1.3D結構光技術
3D結構光技術(Structured Light)是通過光學手段獲取被拍攝物體的三維結構,再將獲取到的信息進行更深入的應用。這種方案在未來將很有前景,可拓展空間更加廣闊,比如5G通信、AR以及其他與3D建模等相關的領域都可以發(fā)揮它獨有的關鍵作用。
例如,iphone x/xr/xs/xsmax、oppo Find x、mate20pro等都是采用了3D結果光技術原理。
3D 結構光也有它的局限,相比傳統(tǒng)的攝像頭,3D 結構光可以工作的距離要短一些,最長距離一般在 1 米左右,OPPO給出的數(shù)據(jù)是60cm遠精度也能控制在±1mm范圍。
2.ToF
ToF(Time Of Flight,時差測距技術),簡單來說,是指發(fā)出一道經(jīng)過處理的光,碰到物體以后會反射回來,捕捉來回的時間,因為已知光速和調(diào)制光的波長,所以能快速準確計算出到物體的距離。
ToF技術的普及與發(fā)展指日可待,vivo已經(jīng)搶占先機,而且蘋果分析師也曾預測2019年iPhone也許會有重大創(chuàng)新就包括采用ToF技術。
3.雙目立體成像
雙目立體成像(Stereo System)是利用雙攝像頭拍攝物體,再通過三角形原理計算物體距離。已經(jīng)上市的華為nova3采用的就是雙目3D人臉識別方案。
雙目方案的原理最簡單,成本也比較低。
技術發(fā)展方向
結合三維信息:二維和三維信息融合使特征更加魯棒多特征融合
多特征融合:單一特征難以應對復雜的光照和姿態(tài)變化
大規(guī)模人臉比對:面向海量數(shù)據(jù)的人臉比對與搜索
深度學習:在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡強大的學習能力
寫在最后
隨著人工智能的發(fā)展,在全球信息化、云計算、大數(shù)據(jù)的背景下,生物識別技術的應用面會越來越大。其中人臉識別技術會朝著網(wǎng)絡化、云技術、多模式融合的趨勢發(fā)展。
國內(nèi)外巨頭紛紛加碼人臉識別技術,我國相關集成應用的企業(yè)就有數(shù)百家,至于誰家算法更勝一籌,并不是重點問題。此時,我們是否要考慮:避免熱點過度炒作,企業(yè)推出真正符合用戶需求、市場所需的技術服務,才是關鍵所在?
評論