三維掃描儀:機器視覺簡介
三維掃描儀機器視覺是研究用計算機來模擬生物外顯或宏觀視覺功能的科學(xué)和技術(shù)。機器視覺系統(tǒng)的首要目標是用圖像創(chuàng)建或恢復(fù)現(xiàn)實世界模型,然后認知現(xiàn)實世界。機器視覺系統(tǒng)獲取的場景圖像一般是灰度圖像,即三維場景在二維平面上的投影。此時,場景三維信息只能通過灰度圖像或灰度圖像序列來恢復(fù)處理,這種恢復(fù)需要進行多點對一點的映射逆變換。在信息恢復(fù)過程中,還需要有關(guān)的場景知識和投影幾何知識。
三維掃描儀機器視覺是一個相當新且發(fā)展十分迅速的研究領(lǐng)域,并成為計算機科學(xué)的重要研究研究領(lǐng)域之一。機器視覺是在20 世紀50 年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像分析和識別上,如光學(xué)字符識別、工件表面、顯微圖片和航空圖片的分析和解釋等。60 年代,Roberts (1965)通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進行描述。Roberts 的研究工作開創(chuàng)了以理解三維場景為目的的三維機器視覺的研究。Roberts對積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場景。于是,人們對積木世界進行了深入的研究。研究的范圍從邊緣、角點等待征提取,到線條、平面、曲面等幾何要素分析,—直到圖像明暗、紋理、運動以及成像幾何等,并建立了各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。到了70 年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)。
70 年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實驗室正式開設(shè)“機器視覺”(Machine Vision)課程,由國際著名學(xué)者B.K.P.Horn 教授講授.同時,MIT AI實驗室吸引了國際上許多知名學(xué)者參與機器視覺的理論、算法、系統(tǒng)設(shè)計的研究。David Marr 教授就是其中的一位。他于1973 年應(yīng)邀在MIT AI 實驗室領(lǐng)導(dǎo)一個以博士生為主體的研究小組,1977 年提出了不同于“積木世界”分析方法的計算視覺(computational vision)理論,該理論在80 年代成為機器視覺研究領(lǐng)域中的一個十分重要的理論框架。
Marr 視覺計算理論立足于計算機科學(xué),系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面業(yè)已取得的所有重要成果。是三維掃描儀視覺研究中迄今為止最為完善的視覺理論。Marr建立的視覺計算理論,使計算機視覺研究有了一個比較明確的體系,并大大推動了計算機視覺研究的發(fā)展。人們普遍認為,計算機視覺這門學(xué)科的形成與Marr 的視覺理論有著密切的關(guān)系。Marr 視覺計算理論將整個視覺過程所要完成的任務(wù)分成三個過程,而獲得這些表示的過程依次稱為初級視覺、中級視覺和高級視覺,如圖1 所示。
Marr 視覺過程中的三個階段
補充的Marr 理論框架
評論