下一代智能視頻監(jiān)控技術發(fā)展新方向
來在視頻監(jiān)控市場中,智能視頻分析技術成為熱點產(chǎn)品,諸如行為分析、車牌識別、人臉抓拍、客流統(tǒng)計等智能化技術,在城市管理、公共安全、銀行、交通等行業(yè)得到了較廣泛的應用,取得了很好的社會效益和經(jīng)濟效益,成為安防企業(yè)一個新的技術制高點和發(fā)展方向。
隨著智能化技術的普及使用,市場漸漸不再滿足于現(xiàn)有的智能化技術種類,而是尋求更新的算法、更豐富的業(yè)務應用、更整體化的系統(tǒng)應用,力求實現(xiàn)在應用的廣度、深度上的突破。為此,安防行業(yè)已經(jīng)開始進行對新一代智能視頻分析技術的研究,提出了一些新的產(chǎn)品形態(tài),新的應用模式,新的系統(tǒng)架構(gòu)。這些新技術、新產(chǎn)品正在逐漸與市場結(jié)合,探求新的發(fā)展空間。
智能視頻的創(chuàng)新方向
在基礎的智能監(jiān)控需求已經(jīng)得到滿足的情況下,智能視頻新技術集中向著幾個方向發(fā)展:
1、提升視覺感官體驗的技術,包括圖像防抖動、圖像增強等視頻預處理技術;
2、提升分析準確率的技術,主要是雙目識別技術;
3、改善系統(tǒng)應用性的技術,包括多球機聯(lián)動跟蹤等;
4、面向事后分析的技術,包括圖像復原、圖像濃縮檢索等技術。
以下分別就各項技術的實現(xiàn)、應用及前景做一些分析。
圖像增強技術
當前監(jiān)控系統(tǒng)面臨的重要問題,是受到各種干擾因素的影響,使得系統(tǒng)不能在全天候、全天時下運行,系統(tǒng)的可靠度低,LCC值不經(jīng)濟。這些干擾因素主要包括如白天環(huán)境下的虛光、泛光、逆光,低照度環(huán)境,監(jiān)控場景中強逆光的干擾,霧、灰霾等的大氣散射環(huán)境干擾,降雨、降雪、沙塵等氣象條件的影響。
圖像增強技術主要解決的問題,是通過算法對視頻源進行視覺改善處理,有效的改善畫質(zhì),提高圖像的清晰度,提高視覺可分辨性,使原本低質(zhì)量的圖像能夠滿足監(jiān)控需要,達到清晰可辨的程度。(如圖、圖2)
圖1:NASA的應用
圖2:道路監(jiān)控中的應用
圖像增強的技術實現(xiàn)途徑,是突出原有圖像中需要重點觀測的內(nèi)容,抑制非重點觀測內(nèi)容,通過對像素的灰度值運算處理生成一幅新的圖像,以改善視覺效果。圖像增強的關鍵技術問題有:
對不同自適應不同時刻、不同程度的干擾因素;
自適應不同的景深、視角、目標內(nèi)容;
有效分辨畫面內(nèi)容,充分保留局部細節(jié);畫面對比柔和,色彩過渡均衡,亮暗對比適中;色彩恒常性好,不受場景變化影響;
正常環(huán)境下不影響畫質(zhì);未增強的畫面不失真。
圖像增強的產(chǎn)品形態(tài),涵蓋了從前端、編碼端到后臺顯示端的處理。在產(chǎn)品定位上,可以分為兩個方向:普適性產(chǎn)品,重點是正常氣候下,不降質(zhì)。惡劣氣候下有改善,但不是最好。作為標配集成到各個設備中。專業(yè)級產(chǎn)品,重點解決在惡劣的情況,達到最好的效果。如霧天專用、深海專用、低照度專用、軍事專用等等作為專用設備,應用整合于特種行業(yè)。
圖像防抖動技術
圖像抖動是在交通領域經(jīng)常見到的問題,主要的成因是道路監(jiān)控中高架安裝方式帶來的較高頻率小幅抖動,以及車載移動監(jiān)控中由于攝像位置變化帶來的低頻大幅抖動。在模擬標清時代,主要會影響了大倍率下的圖像畫面,而在數(shù)字高清時代,在焦距達到20mm以上畫面就會明顯抖動,這對于監(jiān)控內(nèi)容的識別有明顯的影響。
圖像防抖動的解決途徑主要有幾種:
采用軟件技術進行處理:
l采集完整的傳感器圖像,圖像處理緩沖;
l為實現(xiàn)防抖,預留邊緣圖像,對中心圖像進行數(shù)字放大(圖像失真或模糊);
l使用預留邊緣圖像,對圖像進行補償,達到防抖效果(補償區(qū)域縮放,邊緣模糊);
硬件軟件結(jié)合的方式:
l為彌補圖像數(shù)字放大帶來的圖像模糊問題,使用更大像素的圖像傳感器;
l采用直接物理像素尺寸,對圖像抖動區(qū)域進行補償,避免圖像邊緣模糊。(如圖3)
圖3
圖像防抖動技術在前端球機產(chǎn)品中應用時,通常采用軟硬件結(jié)合的方式。技術關鍵點之一,是要克服圖像邊緣角落虛焦的現(xiàn)象。
雙目立體視覺技術
雙目立體視覺技術的核心目的,是提高識別的準確率。由于立體視覺技術形成的視場中帶有物體的三維幾何信息,因此能夠有效的設定檢測規(guī)則,排除光線、影子等干擾因素,大幅提高智能分析的準確度。如果說高清技術通過提升可用像素來提高分析的準確率,是戰(zhàn)術性的舉措,那么雙目立體視覺技術對視頻分析準確率的影響則是戰(zhàn)略性的。
雙目立體視覺技術是基于視差原理,并利用成像設備從不同的位置獲取被測物體的兩幅圖像,通過計算圖像對應點間的位置偏差,來獲取物體三維幾何信息的方法。(如圖4、圖5)
圖4
圖5
采用雙相機或多相機,對視場內(nèi)空間的自由運動體的三維位置坐標及姿態(tài)進行高精度的測量,確定運動目標的質(zhì)心位置,并根據(jù)標定結(jié)果對運動目標進行高精度跟蹤。
立體視覺技術的跟蹤,由于能夠辨識目標的三維坐標、姿態(tài)、相對距離、與背景環(huán)境的空間距離,因此能適應復雜的跟蹤背景環(huán)境。
多球機聯(lián)動跟蹤
多目標識別與跟蹤技術是以單球機智能跟蹤作為基礎,能夠同時實現(xiàn)對大范圍內(nèi)多個活動目標的智能識別與跟蹤,并對其中單個目標進行智能跟蹤的技術。
多目標識別與跟蹤技術在應用中,通常使用一臺固定攝像機,對廣域范圍內(nèi)目標進行的智能行為分析,并將同時監(jiān)控的多個目標按照既定的策略進行排序,并按照先后順序,指揮智能跟蹤球機逐個跟蹤監(jiān)控目標。與單目標跟蹤相比,多目標跟蹤技術的關鍵點是數(shù)據(jù)關聯(lián)問題,即建立一個統(tǒng)一的坐標系,使得固定攝像機可以將目標的坐標信息傳遞給跟蹤球機,實現(xiàn)聯(lián)動跟蹤。
多目標跟蹤的過程可以劃分為以下幾部分:
1、數(shù)據(jù)關聯(lián):在觀測數(shù)據(jù)和目標之間建立起對應關系。
常見的方法有最近鄰算法、聯(lián)合概率數(shù)據(jù)關聯(lián)濾波器、多假設跟蹤算法。
2、狀態(tài)估計:每個目標根據(jù)其對應的觀測進行狀態(tài)估計。
通常采用基于貝葉斯理論的方法,將多目標跟蹤問題轉(zhuǎn)化成對多個單目標的跟蹤過程,并建立相應的狀態(tài)空間模型。為每個目標分配一個單目標跟蹤器,相互獨立地跟蹤每個目標,通過設計一些特殊的方法來處理目標之間的交互和遮擋問題。
3、坐標傳遞:在主攝像機和球機間建立統(tǒng)一的坐標系。
在多目標監(jiān)控場景中,提取目標的位置和運動軌跡信息,發(fā)送給從攝像機,從攝像機根據(jù)目標的位置和運動軌跡信息跟蹤鎖定目標。
另外,多目標跟蹤技術在實際的應用中,還需要重點優(yōu)化和改進以下方面:提升算法的效率,以實現(xiàn)同時能夠跟蹤盡量多的目標;需要改進算法的抗干擾性能,以減輕光線變化、影子、目標間遮擋等常見的干擾因素;需要能夠?qū)γ總€目標排定警戒優(yōu)先級,以使球機在跟蹤時能夠及時切換到威脅等級更高的目標。
面向事后應用的智能技術
面對監(jiān)控系統(tǒng)中海量的錄像數(shù)據(jù),如何有效、高效的應用,減輕人工查看回放帶來的時效性差、成本高、疲勞問題,并在不同分辨率、不同清晰度的錄像中準確的辨別出需要獲取的信息,行業(yè)提供了視頻復原、視頻濃縮、視頻結(jié)構(gòu)化檢索等技術手段。
視頻復原
解決對模糊錄像的有效辨別問題。通過綜合應用超分辨率、銳化濾波、去模糊濾波、輪廓增強、降噪濾波、變形校正、色彩調(diào)整、時空分析、視頻標注、多視頻比對、視頻穩(wěn)定化等智能算法,對對焦不準、運動模糊、噪聲干擾等原因?qū)е碌哪:曨l進行處理,使之清晰可辨。(如圖6)
圖6
視頻濃縮
將視頻濃縮形成視頻片斷,不同時刻的目標“穿越時空”同時展現(xiàn)播放,使24小時的視頻被制作成一個簡短到幾分鐘濃縮視頻成為現(xiàn)實。視頻濃縮不僅濃縮的是事件的精華,也是活動事件的全部,沒有價值的視頻將被剔除。通過多分格快照技術,可以在幾秒中看完所有的活動目標成為可能,回溯原始視頻功能,瞬間鎖定目標在原始視頻中的位置。這些智能視頻分析功能的實現(xiàn)和應用將大大提高海量視頻監(jiān)控錄像分析的效率。(如圖7)
圖7
視頻分類檢索
傳統(tǒng)的視頻搜索功能主要是以物理條件的設定為主要搜索條件的,比如時間,日期等。而智能視頻檢索功能能夠通過認為設定的智能條件進行快速的視頻搜索。比如:特定場景的變化條件、嫌疑物體(人、車、其他特征物體)的出現(xiàn)等為搜索條件,進行特定視頻條件的智能搜索,結(jié)合其他智能視頻功能,可以使大量的無序信息在短時間內(nèi)形成有價值的證據(jù)鏈。(如圖8)
圖8:輸入“紅色衣服的人”檢索條件,比對得到相似度高的目標列表
視頻分類檢索技術未來的發(fā)展,應當是向著結(jié)構(gòu)化錄像存儲的方向,分步驟實現(xiàn)以下的技術目標:
1、結(jié)構(gòu)化數(shù)據(jù)的可檢索:卡口、電警采集的車牌信息,獨立的小系統(tǒng)。
2、非結(jié)構(gòu)化數(shù)據(jù)的可檢索:監(jiān)控攝像機采集的視頻信息,顏色、行為、人臉、車型等。
3、視頻采集時數(shù)據(jù)結(jié)構(gòu)化處理:在智能球機、IPC編碼時自動生成視頻數(shù)據(jù)庫,而不是簡單的錄像文件。
結(jié)構(gòu)化錄像存儲是未來的方向,但還需要解決以下以下關鍵的技術問題:視覺信息、高層語義信息數(shù)據(jù)描述技術、分類規(guī)范和信息索引技術、存儲組織和高效搜索技術、提高智能分析技術的準確度、智能技術的硬件產(chǎn)品化、異地查詢和交換技術等。
結(jié)束語
以上,對于當前和未來的一些新的智能化視頻技術的前景、實現(xiàn)、應用方式做了一些概要性的分析??梢灶A見的是,這些技術將與現(xiàn)有的各項智能技術不斷的融合,并擴展到各種產(chǎn)品形態(tài)中,應用在視頻監(jiān)控的各個環(huán)節(jié),進而變化為更多的智能化產(chǎn)品類型,更豐富的業(yè)務應用,更靈活的系統(tǒng)結(jié)構(gòu),從而推動智能視頻技術更深入的與行業(yè)用戶的業(yè)務需求相結(jié)合,為視頻技術開拓出更大的行業(yè)市場。
評論