博客專欄

EEPW首頁(yè) > 博客 > 一文讀懂圖像定位及跟蹤技術(shù)

一文讀懂圖像定位及跟蹤技術(shù)

發(fā)布人:傳感器技術(shù) 時(shí)間:2022-09-16 來(lái)源:工程師 發(fā)布文章

在科學(xué)技術(shù)日新月異的今天,人們對(duì)機(jī)器設(shè)備的智能性、自主性要求也越來(lái)越高,希望其完全替代人的角色,把人們從繁重、危險(xiǎn)的工作任務(wù)中解脫出來(lái),而能否像人一樣具有感知周圍環(huán)境的能力已成為設(shè)備實(shí)現(xiàn)智能化自主化的關(guān)鍵。


圖片


廣義的“圖像跟蹤”技術(shù),是指通過(guò)某種方式(如圖像識(shí)別、紅外、超聲波等)將攝像頭中拍攝到的物體進(jìn)行定位,并指揮攝像頭對(duì)該物體進(jìn)行跟蹤,讓該物體一直被保持在攝像頭視野范圍內(nèi)。狹義的“圖像跟蹤”技術(shù)就是我們?nèi)粘KU劦降模ㄟ^(guò)“圖像識(shí)別”的方式來(lái)進(jìn)行跟蹤和拍攝。


因?yàn)榧t外、超聲波等方式,都受環(huán)境的影響,而且要專門(mén)的識(shí)別輔助設(shè)備,在實(shí)際應(yīng)用中已經(jīng)逐步被“圖像識(shí)別”技術(shù)所替代。“圖像識(shí)別”是直接利用了攝像頭拍攝到的圖像,進(jìn)行NCAST圖像差分及聚類運(yùn)算,識(shí)別到目標(biāo)物體的位置,并指揮攝像頭對(duì)該物體進(jìn)行跟蹤。


圖像跟蹤系統(tǒng)采用特有的NCAST目標(biāo)外形特征檢測(cè)方法,被跟蹤者無(wú)需任何輔助設(shè)備,只要進(jìn)入跟蹤區(qū)域,系統(tǒng)便可對(duì)目標(biāo)進(jìn)行鎖定跟蹤,使攝像機(jī)畫(huà)面以鎖定的目標(biāo)為中心,并控制攝像機(jī)進(jìn)行相應(yīng)策略的縮放。系統(tǒng)支持多種自定義策略,支持多級(jí)特寫(xiě)模式,適應(yīng)性強(qiáng),不受強(qiáng)光、聲音、電磁等環(huán)境影響。


目標(biāo)物體的邊緣檢測(cè)



物體的形狀特征在大多數(shù)情況下變化不多,基于目標(biāo)形狀輪廓的跟蹤方法與基于區(qū)域的匹配方法相比,可以更精確的分割目標(biāo)。


邊緣是運(yùn)動(dòng)目標(biāo)的最基本特征,表現(xiàn)在圖像中就是指目標(biāo)周圍圖像灰度有階躍變化或屋頂變化的那些像素集合,它是圖像中局部亮度變化最顯著的部分。


圖片


邊緣檢測(cè)就是采用某種算法來(lái)定位灰度不連續(xù)變化的位置,從而圖像中目標(biāo)與背景的交界線。圖像的灰度變化可以用灰度梯度來(lái)表示。


梯度算子


梯度也即一階導(dǎo)數(shù),梯度算子對(duì)應(yīng)一階導(dǎo)數(shù)算子,一階導(dǎo)數(shù)也即梯度可以表示為:


圖片


圖像經(jīng)過(guò)邊緣檢測(cè)之后,還要經(jīng)過(guò)輪廓追蹤和輪廓表達(dá)。輪廓跟蹤的目的是得到邊緣像素的集合邊緣表。輪廓表達(dá)則是通過(guò)對(duì)邊緣表做一些處理,如擬合、統(tǒng)計(jì)及逼近等,得到目標(biāo)形狀特征的直觀表達(dá),為后續(xù)匹配提供模板信息。


輪廓跟蹤的思想是:


1、根據(jù)提取的圖像邊緣,找出輪廓上的像素;


2、根據(jù)這些像素的特征用一定的“跟蹤準(zhǔn)則”找出物體上的其他像素;


3、其跟蹤效果的好壞主要取決于起始點(diǎn)和跟蹤準(zhǔn)則的選取兩個(gè)因素。


跟蹤準(zhǔn)則:


按起始點(diǎn)選取準(zhǔn)則找到最左下方位的邊界點(diǎn)后,以其為起始點(diǎn),定義左上方為初始搜索方向,若該方向的點(diǎn)為黑點(diǎn)(特征點(diǎn)),則判其為邊界點(diǎn),否則沿順時(shí)針?lè)较蛐D(zhuǎn)搜索方向45度,依此類推,直到搜索到第一個(gè)黑點(diǎn)(特征點(diǎn))為止,然后再把該黑點(diǎn)(特征點(diǎn))作為新的邊界點(diǎn),逆時(shí)針?lè)较蛐D(zhuǎn)當(dāng)前搜索方向90度,用相同的方法繼續(xù)搜索下一個(gè)黑點(diǎn)(特征點(diǎn)),直到找到初始邊界點(diǎn)為止。若用箭頭表示搜索方向,那么該輪廓跟蹤算法可以用圖表示。


圖片


通過(guò)上述算法得到物體的邊緣表后,可以用其作為輪廓表達(dá),也可以對(duì)其進(jìn)行處理,用處理后的信息形式來(lái)表達(dá)輪廓。目前常用的輪廓表達(dá)有以下三種:逼近擬合曲線法、內(nèi)插擬合曲線法、統(tǒng)計(jì)特征法。


目標(biāo)圖像顏色檢測(cè)



為了對(duì)豐富多樣的色彩進(jìn)行表達(dá),人們用表示顏色的三個(gè)參數(shù)所構(gòu)成的三維空間來(lái)對(duì)圖像的顏色進(jìn)行描述,這個(gè)三維空間就是所謂的顏色空間。


如:RGB格式(紅、綠、藍(lán)三基色模型)、HSV格式(色度、飽和度、亮度模型)


RGB格式是工業(yè)界的一種顏色標(biāo)準(zhǔn),是通過(guò)對(duì)紅(R)、綠(G)、藍(lán)(B)三個(gè)顏色通道的變化以及它們相互之間的疊加來(lái)得到各式各樣的顏色的,RGB即是代表紅、綠、藍(lán)三個(gè)通道的顏色,這個(gè)標(biāo)準(zhǔn)幾乎包括了人類視力所能感知的所有顏色,是目前運(yùn)用最廣的顏色系統(tǒng)之一。


圖片


HSV格式:H參數(shù)表示色彩信息,即所處的光譜顏色的位置。該參數(shù)用一個(gè)角度量來(lái)表示,紅、綠、藍(lán)分別相隔120度。互補(bǔ)色分別相差180度。純度S為一比例值,范圍從0到1,它表示成所選顏色的純度和該顏色最大的純度之間的比率。S=0時(shí),只有灰度。V表示色彩的明亮程度,范圍從0到1。有一點(diǎn)要注意:它和光強(qiáng)度之間并沒(méi)有直接的聯(lián)系。


圖片


例如:采用直方圖來(lái)表達(dá)圖像的顏色分布特征:1、對(duì)顏色進(jìn)行量化;2、計(jì)算顏色落在各個(gè)小區(qū)間內(nèi)的像素?cái)?shù)量;3、對(duì)其進(jìn)行直方圖投影就可以得到圖像的顏色概率分布圖像。


圖片圖片


圖像濾波及形態(tài)學(xué)處理算法



運(yùn)動(dòng)目標(biāo)提取時(shí),為了消除相機(jī)采集的圖像中的噪聲、改善圖像質(zhì)量,使圖像變得更清晰,需要對(duì)圖像進(jìn)行濾波。幾種常見(jiàn)噪聲:高斯噪聲、加性噪聲及椒鹽噪聲等。


為了消除噪聲影響和突出圖像的一些特征,目前常用的方法有:鄰域均值濾波、中值濾波法等。


圖片


運(yùn)動(dòng)目標(biāo)提取完成后,得到的二值化圖像可能含有許多空洞和孤立的噪聲點(diǎn),為了更好地對(duì)目標(biāo)進(jìn)行定位和跟蹤,需要對(duì)得到的檢測(cè)結(jié)果進(jìn)行形態(tài)學(xué)處理。


形態(tài)學(xué)處理主要思想是:采用一個(gè)特定的結(jié)構(gòu)元素作為工具來(lái)度量和提取圖像特征(形狀、輪廓等),具體為看該結(jié)構(gòu)元素是否可以適當(dāng)有效地放入圖像內(nèi)部。目前常用的形態(tài)學(xué)運(yùn)算有:膨脹、腐蝕、開(kāi)啟和閉合操作。


圖像匹配



圖像匹配是指在多幅圖像之間尋找對(duì)應(yīng)關(guān)系的過(guò)程,具體為在一幀圖像中尋找與給定目標(biāo)最相似的圖像區(qū)域或在一批圖像中尋找與目標(biāo)最相似的圖像。


利用圖像匹配技術(shù)不僅可以檢測(cè)出搜索圖像中是否有目標(biāo)圖像,還可以獲得目標(biāo)在圖像中的相對(duì)位置信息。


匹配算法概括起來(lái)可以分為兩類:基于區(qū)域的匹配方法和基于特征的匹配方法。


基于區(qū)域的匹配方法


根據(jù)整幅圖像的灰度值信息,建立目標(biāo)模板和待匹配目標(biāo)圖像之間的相似性度量,然后采用相應(yīng)的搜索算法,尋找待匹配目標(biāo)圖像中相似性度量值最大的地方。


圖片


基于特征的匹配方法


提取圖像的特征,如特征點(diǎn)、邊緣、顏色、紋理等,對(duì)提取的特征進(jìn)行加工處理將其表達(dá)成特定的形式(向量、直方圖),對(duì)加工后的圖像特征采用一定的相似性度量準(zhǔn)則進(jìn)行匹配以建立目標(biāo)模板和待匹配圖像之間的對(duì)應(yīng)關(guān)系。


圖片


圖像跟蹤技術(shù)的應(yīng)用領(lǐng)域



目前,目標(biāo)跟蹤技術(shù)主要應(yīng)用于以下領(lǐng)域:


1、智能視頻監(jiān)控:基于運(yùn)動(dòng)識(shí)別(基于步法的人類識(shí)別、自動(dòng)物體檢測(cè)等),自動(dòng)化監(jiān)測(cè)(監(jiān)視一個(gè)場(chǎng)景以檢測(cè)可疑行為);交通監(jiān)視(實(shí)時(shí)收集交通數(shù)據(jù)用來(lái)指揮交通流動(dòng));


2、人機(jī)交互:傳統(tǒng)人機(jī)交互是通過(guò)計(jì)算機(jī)鍵盤(pán)和鼠標(biāo)進(jìn)行的,為了使計(jì)算機(jī)具有識(shí)別和理解人的姿態(tài)、動(dòng)作、手勢(shì)等能力,跟蹤技術(shù)是關(guān)鍵;


3、機(jī)器人視覺(jué)導(dǎo)航:在智能機(jī)器人中,跟蹤技術(shù)可用于計(jì)算拍攝物體的運(yùn)動(dòng)軌跡;


4、虛擬現(xiàn)實(shí):虛擬環(huán)境中3D交互和虛擬角色動(dòng)作模擬直接得益于視頻人體運(yùn)動(dòng)分析的研究成果,可給參與者更加豐富的交互形式,人體跟蹤分析是其關(guān)鍵技術(shù);


5、醫(yī)學(xué)診斷:跟蹤技術(shù)在超聲波和核磁序列圖像的自動(dòng)分析中有廣泛應(yīng)用,由于超聲波圖像中的噪聲經(jīng)常會(huì)淹沒(méi)單幀圖像有用信息,使靜態(tài)分析十分困難,而通過(guò)跟蹤技術(shù)利用序列圖像中目標(biāo)在幾何上的連續(xù)性和時(shí)間上的相關(guān)性,可以得到更準(zhǔn)確的結(jié)果。



*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

pid控制相關(guān)文章:pid控制原理




關(guān)鍵詞: 圖像定位

技術(shù)專區(qū)

關(guān)閉