博客專欄

EEPW首頁 > 博客 > 有關(guān)機(jī)器視覺的四個(gè)真相,你知道幾個(gè)?

有關(guān)機(jī)器視覺的四個(gè)真相,你知道幾個(gè)?

發(fā)布人:12345zhi 時(shí)間:2022-11-23 來源:工程師 發(fā)布文章

在人們從自然界獲取的各種信息中,視覺獲取量最高,約占總信息量的80%。隨著信息技術(shù)的發(fā)展,人類的視覺功能逐步被賦予計(jì)算機(jī)、機(jī)器人或其他智能機(jī)器。目前正處在行業(yè)風(fēng)口的機(jī)器視覺就是這樣一種技術(shù),它通過圖像處理實(shí)現(xiàn)自動(dòng)檢測和分析應(yīng)用,包括自動(dòng)檢測、過程控制和機(jī)器人導(dǎo)航等。目前,機(jī)器視覺(MV)技術(shù)已經(jīng)實(shí)現(xiàn)產(chǎn)品化。視覺傳感器、鏡頭、高速相機(jī)、光源、視覺軟件、圖像采集卡、視覺處理器等都變得越來越完善。在工業(yè)自動(dòng)化環(huán)境中,機(jī)器視覺越來越受到行業(yè)的關(guān)注,并被大量用于諸如自動(dòng)駕駛汽車、食品生產(chǎn)、包裝和物流、機(jī)器人和無人機(jī)等。

當(dāng)提到機(jī)器視覺時(shí),技術(shù)人員可能會(huì)很多理解,本文嘗試著從四個(gè)方面逐一解釋有關(guān)機(jī)器視覺應(yīng)了解的真相。

真相一:機(jī)器視覺≠計(jì)算機(jī)視覺

機(jī)器視覺是一種通過光學(xué)設(shè)備和非接觸傳感器自動(dòng)接收和處理真實(shí)物體圖像的設(shè)備,以獲取所需信息或控制機(jī)器人的運(yùn)動(dòng)。自20世紀(jì)50年代開始運(yùn)行,從1980年到1990年,這項(xiàng)技術(shù)真正開始起飛并逐漸普及。經(jīng)過數(shù)十年的發(fā)展,機(jī)器視覺已經(jīng)為它是什么以及它是如何工作的積累了各種定義。

自動(dòng)化成像協(xié)會(huì)(AIA)給出了一個(gè)更具廣義意味的定義,即:機(jī)器視覺包括所有工業(yè)和非工業(yè)應(yīng)用,其中硬件和軟件的組合為設(shè)備執(zhí)行基于圖像捕獲和處理的功能提供操作指導(dǎo)。而SearchEnterpriseAI則給出了機(jī)器視覺的狹義定義,將其稱之為“計(jì)算機(jī)的視覺能力”,該系統(tǒng)使用一個(gè)或多個(gè)攝像機(jī)、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號(hào)處理(DSP),將產(chǎn)生的數(shù)據(jù)傳輸?shù)接?jì)算機(jī)或機(jī)器人控制器。

在實(shí)際應(yīng)用中,機(jī)器視覺通常需要與其他先進(jìn)的技術(shù)協(xié)同工作,包括自然語言處理、機(jī)器人過程自動(dòng)化(RPA)、人工智能(AI)和機(jī)器學(xué)習(xí)(ML)等,以實(shí)現(xiàn)自動(dòng)化所需的“視覺”功能。你可以把機(jī)器視覺看作是自動(dòng)化的眼睛,AI和ML是大腦,RPA提供了完成工作所需的“鍵盤手”。近年來,自動(dòng)化的采用速度不斷加快,這對(duì)企業(yè)保持行業(yè)競爭力至關(guān)重要。如果把自動(dòng)化想象成“數(shù)字化員工”在工作,假如不增加機(jī)器視覺,那么所有這些“數(shù)字化員工”都會(huì)處于失明狀態(tài)。

計(jì)算機(jī)視覺也是近年來的行業(yè)大熱門,那么它與機(jī)器視覺又有什么關(guān)聯(lián)呢?宏觀來講,機(jī)器視覺是一種以新的方式與現(xiàn)有技術(shù)集成并應(yīng)用于解決現(xiàn)實(shí)世界問題的技術(shù)能力,是一門系統(tǒng)工程學(xué)科。而計(jì)算機(jī)視覺是計(jì)算機(jī)科學(xué)的一種形式,不是通過固定在機(jī)器人上的視覺設(shè)備如攝像頭等有形硬件來實(shí)現(xiàn)的。

更具體來說,機(jī)器視覺是一個(gè)系統(tǒng)的主體,而計(jì)算機(jī)視覺是系統(tǒng)的智能,是處理信息的大腦。沒有計(jì)算機(jī)視覺,機(jī)器視覺將無法工作。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)是通過機(jī)器視覺系統(tǒng)以更快的速度處理項(xiàng)目的三種技術(shù)。這三種技術(shù)可用于擴(kuò)大機(jī)器視覺對(duì)要定位的內(nèi)容的理解,使其成為機(jī)器視覺的寶貴資產(chǎn)。隨著計(jì)算機(jī)視覺技術(shù)的進(jìn)步,機(jī)器視覺潛在應(yīng)用的可能性也相應(yīng)增加。

值得注意的是,機(jī)器視覺與圖像處理同樣是兩個(gè)不同的概念,圖像處理是一個(gè)輸出圖像的過程,而機(jī)器視覺系統(tǒng)可以檢測和分類廣泛行業(yè)中的各種物體和項(xiàng)目,包括汽車、電子和半導(dǎo)體、食品和飲料、道路和車輛交通或智能運(yùn)輸系統(tǒng)(ITS)、醫(yī)療成像、包裝、標(biāo)簽和印刷、制****、電視廣播等,基于機(jī)器視覺的技術(shù)正在成為自動(dòng)化創(chuàng)建的核心。

真相二:硬件和軟件的發(fā)展促成了機(jī)器視覺的進(jìn)步

機(jī)器視覺是工業(yè)自動(dòng)化的眼睛。其主要工作流程是:系統(tǒng)通過機(jī)器視覺產(chǎn)品(如攝像頭、CMOS或CCD)將拍攝的目標(biāo)轉(zhuǎn)換為圖像信號(hào),然后將圖像信號(hào)傳輸?shù)綄S脠D像處理系統(tǒng)。根據(jù)像素分布、亮度和顏色等信息,再將圖像信號(hào)轉(zhuǎn)換為數(shù)字化信號(hào),最終使機(jī)器(機(jī)器人或其他工業(yè)工具)能夠完成制造和質(zhì)量驗(yàn)證等工業(yè)任務(wù)。

機(jī)器視覺是工業(yè)4.0的關(guān)鍵要素,它正以多種方式幫助工業(yè)自動(dòng)化系統(tǒng),例如通過改善庫存、檢測故障產(chǎn)品和提高制造質(zhì)量來提高效率。若要準(zhǔn)確地模擬人類的感知,機(jī)器視覺需要一系列設(shè)備和軟件的幫助。而這些軟硬件技術(shù)的不斷發(fā)展進(jìn)一步推動(dòng)了機(jī)器視覺技術(shù)的演進(jìn)。

#01 智能攝像頭

攝像頭(camera)是機(jī)器視覺系統(tǒng)中檢查物體或物品的主要設(shè)備。有時(shí),一個(gè)特定的檢查點(diǎn)可能需要安裝多個(gè)攝像頭,以確??梢哉_檢查每一個(gè)細(xì)節(jié)。當(dāng)機(jī)器視覺系統(tǒng)需要從圖像中捕獲和提取特定應(yīng)用程序的信息時(shí),這時(shí)就需要智能攝像頭的支持。智能攝像頭通常包含所有必要的通信接口,并可連接到Wi-Fi或服務(wù)器,以便傳輸捕獲的圖像數(shù)據(jù)。作為一種強(qiáng)大工具,深度學(xué)習(xí)能使系統(tǒng)設(shè)計(jì)師快速實(shí)現(xiàn)復(fù)雜且主觀決策的自動(dòng)化,同時(shí)有效提高產(chǎn)品質(zhì)量和產(chǎn)能。由Teledyne Flir公司提供的FLIR Firefly DL攝像頭,內(nèi)建的深度學(xué)習(xí)推斷使得該產(chǎn)品不再需要任務(wù)分類的主機(jī)系統(tǒng),大大降低了系統(tǒng)的成本和復(fù)雜性。Firefly DL攝像頭尺寸小巧、重量輕且功耗低,非常適合嵌入移動(dòng)、桌面和手持系統(tǒng)。

Teledyne公司FLIR Firefly DL攝像頭具有尺寸小巧、功耗低等特點(diǎn)(圖源:Teledyne)

圖1:Teledyne公司FLIR Firefly DL攝像頭具有尺寸小巧、功耗低等特點(diǎn)(圖源:Teledyne)

Omron Industrial Automation公司的S133 UVC彩色CMOS攝像頭同樣是一款智能攝像頭產(chǎn)品,它內(nèi)置CMOS傳感器,采用超緊湊結(jié)構(gòu),即插即用,是尋找具有機(jī)器視覺功能攝像頭的理想選擇。由于使用方便,S133 UVC彩色CMOS攝像頭深受工業(yè)/機(jī)器視覺應(yīng)用、汽車、生命科學(xué)等領(lǐng)域的歡迎。

S133 UVC彩色CMOS攝像頭(圖源:Omron)

圖2:S133 UVC彩色CMOS攝像頭(圖源:Omron)

#02 3D攝像頭

3D攝像頭可以在圖像中顯示被檢測物的深度,以顯示圖像的不同角度。通過在機(jī)器視覺系統(tǒng)中使用3D攝像頭,將帶來不同的視角和深度感知。飛行時(shí)間(ToF)攝像頭是使用飛行時(shí)間原理測量距離的3D攝像頭。ToF成像技術(shù)允許它在不掃描物體的情況下進(jìn)行3D成像,該技術(shù)通??筛采w幾米到約40米的距離,每秒最多100張圖像,距離分辨率約為5到10毫米,橫向分辨率約為200 x 200。

歷史上,因?qū)oF的準(zhǔn)確性存在一些質(zhì)疑,人們通常將其視為精度較低的3D傳感技術(shù)。當(dāng)然,近些年很多頭部企業(yè)已經(jīng)開發(fā)出高達(dá)130萬像素的高分辨率產(chǎn)品,用于機(jī)器視覺系統(tǒng)的高精度ToF攝像頭能顯著提高生產(chǎn)的靈活性和自動(dòng)化程度。索尼公司的IMX556 DepthSense ToF傳感器采用CAPD和背面照明(BSI)技術(shù),與市場上現(xiàn)有的ToF解決方案相比,能夠提供精確到毫米的精度,在6米工作距離下,以30fps的速度提供640 x 480的分辨率。

索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細(xì)更快速的幀率重建被測物體(圖源:Sony)

圖3:索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細(xì)更快速的幀率重建被測物體(圖源:Sony)

Texas Instruments的OPT8241飛行時(shí)間 (ToF) 傳感器,將ToF傳感與模數(shù)轉(zhuǎn)換器和可編程定時(shí)發(fā)生器(TG)相結(jié)合,該器件能以高達(dá)150幀/秒的幀速率提供320 x 240分辨率的圖像。內(nèi)置的TG可控制復(fù)位、調(diào)制和讀出數(shù)字化序列。同時(shí),TG具備可編程性,可靈活優(yōu)化各項(xiàng)深度感知性能指標(biāo),例如功率、運(yùn)動(dòng)穩(wěn)健性、信噪比和環(huán)境消除等。

TI公司OPT8241 ToF傳感器系統(tǒng)框圖(圖源:TI)

圖4:TI公司OPT8241 ToF傳感器系統(tǒng)框圖(圖源:TI)

#03 視覺傳感器

視覺傳感器是機(jī)器視覺系統(tǒng)的核心,是最大化環(huán)境特性的來源,其核心設(shè)備是CCD、CMOS等圖像傳感器。這些分辨率較高的視覺傳感器通常能夠生成包含更多像素的圖像,非常有助于提高圖像質(zhì)量,更容易識(shí)別視覺細(xì)節(jié)。

長期以來,CCD傳感器是捕獲高質(zhì)量、低噪聲圖像的主流技術(shù)。但是CCD傳感器的制造成本很高,因此價(jià)格普遍較高,功耗也要比CMOS傳感器高很多。如今,CMOS傳感器技術(shù)已經(jīng)發(fā)展到可以快速接近CCD技術(shù)的質(zhì)量和功能,并且價(jià)格更低,體積更小,功耗更低。CMOS相機(jī)的幀速率通常要高于CCD相機(jī),對(duì)于那些依賴實(shí)時(shí)圖像處理進(jìn)行自動(dòng)化或圖像數(shù)據(jù)分析的機(jī)器視覺系統(tǒng)而言,此功能至關(guān)重要。另外,CMOS傳感器比CCD傳感器對(duì)紅外波長更敏感,CMOS芯片和相機(jī)制造商利用這一優(yōu)勢可捕獲紅外線,為圖像識(shí)別提供了額外的成像能力。兩相權(quán)衡,CMOS傳感器可能更加適合機(jī)器視覺應(yīng)用。

安森美(onsemi)AR0130是一款1/3英寸CMOS數(shù)字圖像傳感器,有源像素陣列為1280H x 960V,使用滾動(dòng)快門讀數(shù)捕獲圖像。該產(chǎn)品包括復(fù)雜的相機(jī)功能,如自動(dòng)曝光控制,窗口,以及視頻和單幀模式。AR0130能夠拍攝非常清晰的數(shù)字圖像,并且能夠捕獲連續(xù)視頻和單幀,尤其適合高性能機(jī)器視覺應(yīng)用。

#04 光源

作為一種輔助成像設(shè)備,光源對(duì)成像質(zhì)量往往起到至關(guān)重要的作用。以LED照明產(chǎn)品為例,它們具有更高的靈活性,具有可調(diào)角度和附加波長,更一致的光譜響應(yīng)。市場上有多種波長和形狀的光源可供選擇,產(chǎn)品的選擇并不難。

#05 圖像采集卡

圖像采集卡通常以電腦插卡的形式存在,它的主要工作是將圖像輸出傳送到計(jì)算機(jī)主機(jī)。圖像采集卡需要將來自相機(jī)的模擬或數(shù)字信號(hào)轉(zhuǎn)換為特定格式的圖像數(shù)據(jù)流,還可以控制相機(jī)的一些參數(shù),例如觸發(fā)信號(hào)、曝光/積分時(shí)間、快門速度等。圖像采集卡通常針對(duì)不同類型的相機(jī)具有不同的硬件結(jié)構(gòu),同時(shí)也具有不同的總線形式,如PCI、PCI64、Compact PCI、PC104、ISA等。

#06 視覺處理軟件

機(jī)器視覺軟件用于完成輸入圖像數(shù)據(jù)的處理,然后通過一定的計(jì)算就可以得到需要的結(jié)果。通用機(jī)器視覺軟件以C/C++圖像庫、ActiveX控件和基于圖形的編程環(huán)境等形式出現(xiàn),可以專用,例如僅用于LCD檢測、BGA檢測、模板對(duì)齊等,或通用,包括定位、測量、條形碼/字符識(shí)別、斑點(diǎn)檢測等。

真相三:機(jī)器視覺市場發(fā)展迅速,汽車行業(yè)功不可沒

機(jī)器視覺在自動(dòng)化方面的價(jià)值在于它能夠快速高效地捕獲和處理大量文檔、圖像和視頻,其數(shù)量和速度遠(yuǎn)遠(yuǎn)超過人類的能力。

廣闊的應(yīng)用前景和巨大的市場潛力決定了機(jī)器視覺必將是一個(gè)不斷增長的市場,Markets and Markets的數(shù)據(jù)表明,機(jī)器視覺的市場規(guī)模預(yù)計(jì)將從2020年的107億美元增長到2025年的147億美元,復(fù)合年增長率為6.5%。

根據(jù)grand view research的數(shù)據(jù),2021年,全球機(jī)器視覺市場規(guī)模為132.3億,預(yù)計(jì)2022年至2030年將以7.7%的復(fù)合年增長率(CAGR)增長。汽車、食品和飲料、制****和化工以及包裝領(lǐng)域?qū)σ曈X引導(dǎo)機(jī)器人系統(tǒng)的需求是推動(dòng)市場增長的主要?jiǎng)恿?。其中,汽車行業(yè)依然是全球最大的機(jī)器視覺系統(tǒng)采用者,在2021年,來自汽車行業(yè)的收入份額超過了15.0%,預(yù)計(jì)未來幾年仍將繼續(xù)穩(wěn)步增長。

按照行業(yè)劃分,2020年--2030年美國機(jī)器視覺市場發(fā)展趨勢(圖源:grand view research)

圖5:按照行業(yè)劃分,2020年--2030年美國機(jī)器視覺市場發(fā)展趨勢(圖源:grand view research)

真相四:機(jī)器視覺在機(jī)器人應(yīng)用中將大顯身手

在市場范圍和應(yīng)用方面,機(jī)器視覺有很多機(jī)會(huì)可以擴(kuò)展。這些機(jī)會(huì)需要一些想象力,這意味著機(jī)器視覺不僅僅是取代技術(shù)人員的眼睛,而是充分利用機(jī)器人完成技術(shù)人員無法完成的任務(wù)。機(jī)器視覺使得機(jī)器人擁有實(shí)時(shí)、高細(xì)節(jié)地“看到”的能力,它允許機(jī)器人根據(jù)對(duì)象或環(huán)境的綜合視圖做出決策。如今,機(jī)器人在世界上的使用越來越多。當(dāng)機(jī)器人配備機(jī)器視覺時(shí),會(huì)給它們帶來更高的精確度、方向感和理解力,能夠更準(zhǔn)確地抓取物品,以更高的精度放置物品,并更快地執(zhí)行更復(fù)雜的任務(wù)。

機(jī)器視覺在機(jī)器人應(yīng)用中正變得越來越重要,根據(jù)自動(dòng)化促進(jìn)協(xié)會(huì)(A3)最近的一份報(bào)告,與2020年相比,機(jī)器人和機(jī)器視覺市場在2021年第二季度取得了實(shí)質(zhì)性增長。工業(yè)機(jī)器人已經(jīng)被廣泛使用,隨著協(xié)作機(jī)器人的出現(xiàn)和3D機(jī)器視覺的快速發(fā)展,它們將被更多地結(jié)合使用。

機(jī)器視覺體現(xiàn)的是一種技術(shù)能力,自動(dòng)化、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等其他能力也是如此。這是一種可以集成到其他技術(shù)和流程中的能力,用以造福行業(yè)并提高業(yè)務(wù)效率?,F(xiàn)在的機(jī)器人已經(jīng)越來越多地內(nèi)置機(jī)器視覺,機(jī)器視覺使機(jī)器人能夠執(zhí)行更復(fù)雜的任務(wù)。如果沒有機(jī)器視覺告訴機(jī)器人物品的確切位置,這些任務(wù)是不可能完成的。機(jī)器視覺是釋放自動(dòng)化全部潛力的關(guān)鍵,為智能自動(dòng)化添加了更多智能。

來源:貿(mào)澤電子

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。




相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉