博客專欄

EEPW首頁(yè) > 博客 > 視覺(jué)/視覺(jué)慣性SLAM最新綜述:領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比(2)

視覺(jué)/視覺(jué)慣性SLAM最新綜述:領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比(2)

發(fā)布人:計(jì)算機(jī)視覺(jué)工坊 時(shí)間:2021-07-26 來(lái)源:工程師 發(fā)布文章

4.3. Mapping

建圖塊是指完全初始化新檢測(cè)到的特征位置所需的操作,以便它可以位于環(huán)境的 3D 重建中,即地圖。實(shí)際上,在位姿跟蹤部分,我們假設(shè)地圖上存在 3D 定位地標(biāo)。然而,單目相機(jī)不能僅使用一次觀察來(lái)確定特征的深度,而是需要幾幀。與相機(jī)軌跡類似,我們可能希望估計(jì)地標(biāo)位置的不確定性,以在初始化后對(duì)其進(jìn)行細(xì)化或?qū)⑺鼈儼谌謨?yōu)化中。使用僅“部分初始化”的地標(biāo)也很有趣,因?yàn)樗鼈円呀?jīng)包含一些信息,例如在 PTAM [27] 中。直接方法本身不映射特征,但它們將捕獲幀的每個(gè)像素(像素深度圖)建圖。

建圖塊可以用 3D 地標(biāo)參數(shù)化來(lái)描述??梢允褂玫芽栕鴺?biāo) (XYZ),但這種選擇會(huì)導(dǎo)致嚴(yán)重的非高斯概率密度函數(shù),并且會(huì)降低準(zhǔn)確性和一致性。或者,齊次點(diǎn) (HP)、錨定齊次點(diǎn) (AHP) 和逆深度參數(shù)化 (IDP) 可抑制非線性并縮短初始化周期 [42]。

如 [42] 中所述,IDP 通過(guò) 6 維向量對(duì)反距離點(diǎn) p 進(jìn)行編碼,該向量包含對(duì)應(yīng)于“錨點(diǎn)” p0=(x0,y0,z0) 的初始化時(shí)間的歐幾里得光學(xué)中心,即仰角和方位角,它們定義了初始光線 (e,a) 的方向和從 p0 到 3D 點(diǎn) p 的歐幾里得距離 d 的倒數(shù) p。IDP 點(diǎn)可以通過(guò)使用矢量 V=(u,v,w) 和距離 p=||v||/d 的光線方向直接編碼來(lái)參數(shù)化,從而避免對(duì)角度(e,a)。這對(duì)應(yīng)于 AHP 參數(shù)化(7 個(gè)參數(shù))。HP 類似于 AHP,但不需要錨點(diǎn);相反,使用相機(jī)的原點(diǎn),導(dǎo)致只有 4 個(gè)參數(shù) V 和 p。假設(shè)相機(jī)位置的不確定性很小,使用這種參數(shù)化可以獲得類似的結(jié)果。[42] 中的研究詳細(xì)介紹了這些參數(shù)化,并給出了它們對(duì) EKF-SLAM 結(jié)果影響的基準(zhǔn)。

三角化的 3D 點(diǎn)是通過(guò)將來(lái)自至少兩幀的 2D 圖像對(duì)應(yīng)關(guān)系的反向投影光線相交來(lái)確定的。實(shí)際上,它們從未真正相交,這導(dǎo)致地標(biāo)位置存在不確定性區(qū)域??梢酝ㄟ^(guò)兩種方式減少這種不確定性??梢允褂酶嗟挠^測(cè)值,或者來(lái)自更遠(yuǎn)距離的光線可以改善定位。理想情況下,光線應(yīng)以 90° 角相交以到達(dá)一個(gè)小的不確定圓,而不是一個(gè)拉伸的橢圓??梢蕴^(guò)幀,直到 3D 點(diǎn)位置的平均不確定性降低到給定閾值以下以緩解此問(wèn)題。選定的幀通常對(duì)應(yīng)于關(guān)鍵幀。另請(qǐng)注意,遠(yuǎn)距離點(diǎn)更難以準(zhǔn)確建圖。

建圖過(guò)程與 DTAM [34] 等直接方法略有不同。目標(biāo)是通過(guò)為每個(gè)像素分配深度值,將捕獲的幀變成“深度圖”。它再次基于多視圖重建。對(duì)于關(guān)鍵幀中的每個(gè)像素,都會(huì)跟蹤一條像素射線,它對(duì)應(yīng)于該像素的可能深度范圍。與該關(guān)鍵幀重疊的所有幀池用于“觀察”像素射線。能量函數(shù)最小化,例如用于空間正則化的光度誤差和先驗(yàn)數(shù)據(jù)的 L1 范數(shù)和估計(jì)實(shí)際像素深度。RGB-D vSLAM 方法的建圖過(guò)程更直接,因?yàn)樯疃仁侵苯痈袘?yīng)的。在每一幀中輸入深度圖。然后通過(guò)融合所有深度圖來(lái)詳細(xì)闡述環(huán)境的 3D 模型。這可以通過(guò)重疊掃描或通過(guò)執(zhí)行融合方法來(lái)完成。

許多 SLAM 方法使用與環(huán)境中檢測(cè)到的特征相對(duì)應(yīng)的稀疏表示來(lái)重建場(chǎng)景。稠密貼圖更常見(jiàn)于雙目和 RGB-D 相機(jī)或激光掃描。最近的一項(xiàng)工作 [43] 創(chuàng)建了稠密結(jié)構(gòu)的稠密地圖建模。

4.4. Loop Closure

閉環(huán)是 SLAM 的支柱。它通過(guò)將先前訪問(wèn)過(guò)的位置的位姿與當(dāng)前位姿重新連接來(lái)消除自上次閉環(huán)以來(lái)累積的漂移。優(yōu)化和增量方法比基于粒子濾波和卡爾曼濾波等更成功,因?yàn)樗鼈冊(cè)谲壽E估計(jì)上向后傳播閉環(huán)數(shù)據(jù)。關(guān)鍵幀圖經(jīng)典地用于在并行方法中使用集束調(diào)整 (BA) 來(lái)校正姿勢(shì)。在 [44] 中,作者綜合了 BA 的 vSLAM 方法技術(shù),并在附錄中給出了集束調(diào)整主要發(fā)展的歷史概述。最先進(jìn)的 SLAM 系統(tǒng)通常用[45] 解決非線性最小二乘問(wèn)題或 [46] 來(lái)優(yōu)化 BA 中基于圖的非線性誤差函數(shù)。但是這些系統(tǒng)使用一些最后的測(cè)量值來(lái)實(shí)時(shí)估計(jì)位姿。為了使用先前的優(yōu)化并減少計(jì)算,增量求解器(例如 [47])以實(shí)時(shí)方法解決非線性估計(jì)問(wèn)題。每次使用底層因子圖的稀疏結(jié)構(gòu)添加新的測(cè)量值時(shí),它們都會(huì)更新環(huán)境的估計(jì)模型。

閉環(huán)是一個(gè)兩步過(guò)程。首先,它從閉環(huán)檢測(cè)開(kāi)始,也稱為位置識(shí)別。位置識(shí)別過(guò)程可以用來(lái)解決軌道丟失恢復(fù)的問(wèn)題,一般采用閉環(huán)線程。大多數(shù)方法使用詞袋方法將新關(guān)鍵幀與先前獲取的視圖數(shù)據(jù)庫(kù)進(jìn)行比較。“詞袋”是指一組描述符,用于識(shí)別圖像中的補(bǔ)丁,如 [48] 提出的 DBoW2 方法,基于 FAST [31] 和稍加修改的 BRIEF 特征 [49]。框架和數(shù)據(jù)庫(kù)之間相似詞的目錄搜索非??焖俸透咝?。一旦發(fā)現(xiàn)潛在的相似性,多個(gè)驗(yàn)證步驟會(huì)驗(yàn)證它是否對(duì)應(yīng)于一個(gè)閉環(huán)。其次,閉環(huán)校正地圖和位姿。計(jì)算兩個(gè)視圖之間的轉(zhuǎn)換并融合 3D 點(diǎn)。然后使用(局部)BA 沿著整個(gè)位姿圖和地圖分布關(guān)閉回環(huán)所需的計(jì)算。閉環(huán)過(guò)程的計(jì)算量可能很大。它通常在專用線程中完成。

5. vSLAM 方法的歷史回顧

圖 3 顯示了 vSLAM 發(fā)展的年表,包括三個(gè)時(shí)期。第一個(gè)時(shí)期,這里標(biāo)記為“經(jīng)典時(shí)期”,專注于解決 SLAM 問(wèn)題。提出了幾個(gè)數(shù)學(xué)公式,首次有效地應(yīng)用了SLAM。第二個(gè)時(shí)期,SLAM 研究的重點(diǎn)轉(zhuǎn)向了基于視覺(jué)的方法。提出了幾種 vSLAM 設(shè)計(jì),并將新硬件(例如 GPU、RGB-D 相機(jī)和雙目相機(jī))集成到該過(guò)程中。這個(gè)“vSLAM 時(shí)期”與 [14] 所說(shuō)的 SLAM 的“算法分析”時(shí)期一致。研究了 vSLAM 的基本特性,例如收斂性和一致性。vSLAM 成為開(kāi)發(fā) SLAM 方法的核心?!暗谌龝r(shí)期”致力于提高vSLAM的魯棒性。目標(biāo)是提高 vSLAM 的可靠性,以支持越來(lái)越多的現(xiàn)實(shí)生活應(yīng)用程序(例如,無(wú)人機(jī))。特別是,這個(gè)“第三時(shí)期”引入了 viSLAM 方法。

5.png

圖3 具有里程碑和三個(gè)時(shí)期的 vSLAM 歷史概述:從 SLAM 問(wèn)題到 vSLAM,vSLAM 算法發(fā)展,以及 viSLAM 的出現(xiàn)。

5.1. The Classical Age

定位的歷史始于 1960 年卡爾曼濾波的引入 [50],并在 1979 年由 Mayeck 通過(guò)擴(kuò)展卡爾曼濾波(EKF) [51] 擴(kuò)展到非線性系統(tǒng)。SLAM 問(wèn)題在 1980 年代提出 [1, 2, 52],并在 1995 年證明收斂 [53]。在此期間,制定了一些 SLAM 方法,主要使用激光遙測(cè)儀、從不同來(lái)源計(jì)算的里程計(jì)并使用 EKF 實(shí)現(xiàn),例如 Smith 等人早在 1988 年提出的方法(EKF-SLAM [38])。直到 2003 年戴維森等人提出 MonoSLAM [21] 之前,單目相機(jī)的使用非常罕見(jiàn)。他們僅使用一個(gè)網(wǎng)絡(luò)攝像頭、一臺(tái)通用計(jì)算機(jī)就實(shí)現(xiàn)了它,并且沒(méi)有里程計(jì)測(cè)量。這是第一個(gè)使用單個(gè)低成本視覺(jué)傳感器的實(shí)時(shí) SLAM 方法。定位和建圖在 3D 中執(zhí)行,而 SLAM 基于 EKF。為了解決初始化新點(diǎn)的問(wèn)題,Davison 等人提出了一種基于粒子濾波器的新方法,以減少新檢測(cè)到的視覺(jué)地標(biāo)的景深不確定性。MonoSLAM 為所謂的 vSLAM 鋪平了道路。

每個(gè) EKF-SLAM,甚至是著名的 MonoSLAM,都存在復(fù)雜性,地圖特征的數(shù)量是二次的。為緩解該問(wèn)題進(jìn)行了許多嘗試,尤其是通過(guò)將地圖劃分為多個(gè)部分并在優(yōu)化過(guò)程中僅使用活動(dòng)子地圖。它們都沒(méi)有提供令人滿意的一致性與計(jì)算成本的折衷。2002 年,在 Montemerlo 等人 [23] 提出的 FastSLAM 中,使用 Rao-Blackwellized 粒子濾波器代替 EKF。這種方法有效地降低了對(duì)數(shù)縮放的復(fù)雜性,并成功轉(zhuǎn)換為單目 vSLAM,即 Eade 和 Drummond 在 2006 年提出的可擴(kuò)展單目 SLAM [22]。

5.2. The Golden Age of vSLAM

即使 FastSLAM 方法的最小復(fù)雜度也嚴(yán)重限制了 SLAM 應(yīng)用,尤其是捕獲大量特征的 vSLAM。vSLAM 的最大突破是 Klein 等人在 2007 年引入了具有并行跟蹤和建圖 (PTAM) 的基于關(guān)鍵幀的解決方案 [27]。在其他改進(jìn)中,這種新方法實(shí)現(xiàn)了任務(wù)并行化、更好地利用全局優(yōu)化、減少了跟蹤漂移,更重要的是一種具有自由可擴(kuò)展性的存儲(chǔ)特征的新方法。如今,幾乎所有 vSLAM 算法都基于 PTAM 的概念。

vSLAM 通過(guò)集成高效的閉環(huán)方法、全局優(yōu)化和基于關(guān)鍵幀和剔除的內(nèi)存管理,以及多線程并行化實(shí)時(shí)執(zhí)行過(guò)程,變得越來(lái)越可靠。因此,可以提出新的設(shè)計(jì)和硬件選擇,擴(kuò)大 SLAM 的可能性。由用例需求驅(qū)動(dòng)的 vSLAM 開(kāi)發(fā)成為可能。在此期間提出的主要 vSLAM 實(shí)現(xiàn)在第 6 節(jié)中有詳細(xì)說(shuō)明。

5.3. The Third Age: Improving the Robustness

在第三個(gè)時(shí)期,vSLAM 繼續(xù)發(fā)展,尤其是針對(duì)特定場(chǎng)景提高魯棒性。相機(jī)和 IMU 的耦合(viSLAM)成為一個(gè)重要的研究課題。在 2010 年代初期,考慮了現(xiàn)有 vSLAM 方法中 IMU 數(shù)據(jù)的松耦合 [54]。但混合濾波器迅速演變?yōu)椤熬o耦合”視覺(jué)慣性方法的設(shè)計(jì),現(xiàn)在在配備 IMU 和相機(jī)的系統(tǒng)中非常流行。緊耦合 viSLAM 的一個(gè)重要改進(jìn)是 2007 年由 Mourikis 和 Roumeliotis [25] 提出的 MSCKF(多態(tài)約束卡爾曼濾波器),在 2013 年通過(guò) MSCKF 2.0 改進(jìn) [24],引入了新版本的卡爾曼濾波器,該濾波器在一個(gè)外感受器中結(jié)合了超時(shí)觀察更新。還創(chuàng)造了其他非凡的方法。其中包括使用線而不是點(diǎn)特征來(lái)避免與運(yùn)動(dòng)模糊相關(guān)的問(wèn)題,自 PTAM 以來(lái)仍在使用。其他作品使用 RGB-D 相機(jī)并在應(yīng)用 SLAM 算法之前過(guò)濾與移動(dòng)物體相關(guān)的數(shù)據(jù)以提高魯棒性 [55, 56]。其他方法使用基于光流的方法來(lái)檢測(cè)和丟棄動(dòng)態(tài)特征[57]來(lái)緩解動(dòng)態(tài)問(wèn)題。一個(gè)結(jié)合 SLAM 和深度學(xué)習(xí)技術(shù)的新研究領(lǐng)域正在這個(gè)領(lǐng)域上出現(xiàn)。深度學(xué)習(xí)技術(shù)檢測(cè)移動(dòng)物體并支持 ORB-SLAM2 算法來(lái)構(gòu)建準(zhǔn)確的地圖并在動(dòng)態(tài)環(huán)境中定位移動(dòng)機(jī)器人 [58]。在 [59] 中,作者出于相同目的使用語(yǔ)義分割和 RGB-D 相機(jī)。Rosinol 等人和 Yang 等人 [60, 61] 發(fā)表了使用語(yǔ)義分割和 SLAM 算法的最新作品。

當(dāng)可以多次訪問(wèn)同一地點(diǎn)時(shí),MapLab [62] 的工作允許大規(guī)模合并不同會(huì)話的不同地圖。輸出地圖可用于從一個(gè)會(huì)話到另一個(gè)會(huì)話。

也許最近最有趣的趨勢(shì)之一是使用事件相機(jī),即仿生相機(jī),以避免運(yùn)動(dòng)模糊的影響。由于事件攝像機(jī)的使用還很晚,因此不包括在我們的分類中。然而,Rosinol 等人于 2018 年發(fā)表的結(jié)果。關(guān)于 Ultimate SLAM [63] 混合使用基于事件的相機(jī)和視覺(jué)慣性里程計(jì)似乎非常有前途,并渴望為 vSLAM 開(kāi)辟新的可能性。

最近的一項(xiàng)工作 [64] 優(yōu)化局部和全局集束調(diào)整給出了可用于 viSLAM 算法以提高全局一致性的有希望的結(jié)果。

6. 建議的分類方法

幾種方法推動(dòng)了我們的分類工作。6.1 節(jié)根據(jù)輸入對(duì) vSLAM 方法進(jìn)行分組。第 6.2 節(jié)根據(jù)耦合級(jí)別對(duì) viSLAM 方法進(jìn)行分組。最后,第 6.3 節(jié)根據(jù)硬件要求、算法類型和實(shí)現(xiàn)特征比較了主要的 v/viSLAM 方法。它通過(guò)根據(jù)應(yīng)用程序要求對(duì) v/viSLAM 性能進(jìn)行交叉分析來(lái)完成。

6.1. Classification of vSLAM Methods

vSLAM 方法根據(jù)輸入的性質(zhì)分為三類:基于特征的、直接的和基于 RGB-D 的,如第 4 節(jié)所述。由于基于 RGB-D 的方法涉及特定的硬件,因此被視為一個(gè)完整的類別。圖 4 顯示了選擇一些主要識(shí)別方法的分類結(jié)果。

6.png

圖4 主要 vSLAM 方法的時(shí)間順序分類

6.1.1. Feature-Based Methods

單目 EKF-SLAM MonoSLAM [21] 和粒子濾波器可擴(kuò)展單目 SLAM [22],即單目 FastSLAM,屬于基于特征的方法。突破性的并行跟蹤和建圖 (PTAM) [27] 屬于同一類別。提出了對(duì) PTAM 的幾種改編。例如,[65] 中介紹了邊緣特征的使用。另一個(gè)重要的方法是 ORB-SLAM [37]。

6.1.2. Direct Methods

第一個(gè)重要的直接方法是 2011 年的稠密跟蹤和建圖 (DTAM) [34]。它是稠密單目 vSLAM 方法的先驅(qū),并于 2015 年通過(guò) MobileFusion [66] 應(yīng)用于智能手機(jī)。從 2016 年開(kāi)始,一種更新的方法是直接稀疏里程計(jì) (DSO) [33]:一種視覺(jué)里程計(jì)方法,它提出直接輸入處理但稀疏建圖以進(jìn)行更輕量的處理。另一個(gè)主要的 vSLAM 方法是 2013 年和 2017 年的半直接視覺(jué)里程計(jì)(SVO)[67],它結(jié)合了 VO 框架中直接和間接輸入搜索的優(yōu)點(diǎn)。2014 年的大規(guī)模直接單目 SLAM(LSD-SLAM)[35] 是最早使用半稠密建圖來(lái)解決大型環(huán)境的方法之一。

6.1.3. RGB-D Methods

RGB-D 方法還包括幾種主要算法。2011 年,KinectFusion [68] 旨在使用 Microsoft Kinect 構(gòu)建干凈、準(zhǔn)確的環(huán)境 3D 重建。2013 年的稠密 vSLAM [69] 側(cè)重于利用密集地圖進(jìn)行精確定位。2015 年的 ElasticFusion [70] 是一種“以地圖為中心”的方法,它更側(cè)重于構(gòu)建的 3D 模型的幾何精度,而不是位姿圖的構(gòu)建。

6.2. Classification of viSLAM Methods

直接和間接特征可用于對(duì) viSLAM 方法進(jìn)行分類。其他綜述也根據(jù)它們是基于濾波器還是基于優(yōu)化的方法對(duì) viSLAM 方法進(jìn)行了分類 [15]。但大多數(shù)主要的 viSLAM 方法實(shí)際上都是基于特征的方法,而 viSLAM 主要處理混合問(wèn)題。因此,圖 5 所示的分類是基于視覺(jué)和慣性數(shù)據(jù)的耦合水平。我們區(qū)分兩個(gè)層次:松耦合和緊耦合。

7.png

圖5 主要視覺(jué)-慣性 SLAM 方法的時(shí)間分類。

6.2.1. Loose Coupling

松耦合方法分別處理 IMU 和圖像測(cè)量,并使用這兩種信息來(lái)跟蹤位姿。Weiss 等人 [54] 處理圖像以計(jì)算連續(xù)位姿之間的 VO,然后將后者與慣性測(cè)量融合。還可以過(guò)濾 IMU 測(cè)量值以估計(jì)在基于圖像的估計(jì)算法中融合的旋轉(zhuǎn)。松耦合的視覺(jué)慣性里程計(jì)方法是 2014 年 [71] 提出的全局多傳感器融合(磁力計(jì)、壓力高度計(jì)、GPS 、激光掃描儀等)的一部分。松耦合的 IMU-相機(jī)融合早在 2000 年代初就已經(jīng)開(kāi)始了。SOFT-SLAM 算法 [72] 是一種松耦合的 viSLAM 方法,它實(shí)際上使用 IMU 數(shù)據(jù)來(lái)減少可用的計(jì)算時(shí)間。它實(shí)時(shí)構(gòu)建稠密地圖并在 MAV 上運(yùn)行。

6.2.2. Tight Coupling

緊耦合方法不是融合基于視覺(jué)和慣性的算法的輸出,而是直接融合視覺(jué)和慣性原始數(shù)據(jù),以提高準(zhǔn)確性和魯棒性。MSCKF [25] 和 MSCKF 2.0 [24] 既健壯又非常輕便,與 ROVIO [26] 一起屬于這一類,后者是一種基于 EKF 的直接 VIO 方法。Open Keyframe-Based Visual Inertial System (OKVIS) [73] 和 S-MSCKF [17] 是著名的雙目 VIO 方法,而 Vins-Mono [74] 是真正的 viSLAM 而不僅僅是 VIO 方法。Kimera [60] 也基于 VIO 方法,但它還包括一個(gè)位姿圖優(yōu)化器,在不同的線程中,用于全局軌跡估計(jì)、一個(gè) 3D 網(wǎng)格重建模塊和一個(gè) 3D 度量語(yǔ)義重建模塊。VIORB [75] 基于 ORB-SLAM [76]。它的前端使用 ORB 提取特征,而其后端運(yùn)行圖形優(yōu)化。但它的主要興趣在于一種新的 IMU 初始化方法,首先估計(jì)陀螺儀的偏差,近似尺度和重力(不考慮加速度計(jì)偏差),然后估計(jì)加速度計(jì)偏差(經(jīng)過(guò)尺度和重力方向細(xì)化),最后是速度矢量,它包括并行方法中的全局優(yōu)化和閉環(huán)。大多數(shù)最近的 viSLAM 方法都是緊耦合的 [15],如 [77] 提出的方法,它使用前向和后向光流來(lái)處理圖像特征。

6.3. Comparison of vSLAM and viSLAM from the Usage Point of View

根據(jù)硬件要求、算法類型和實(shí)現(xiàn)特點(diǎn),主要v/viSLAM方法在表2中進(jìn)行了比較。表 3 展示了每種方法在描述常見(jiàn)用例性質(zhì)的五個(gè)關(guān)鍵特征方面的最新性能。表 3 是通過(guò)閱讀引用的出版物并使用以下標(biāo)準(zhǔn)對(duì)其性能評(píng)估結(jié)果進(jìn)行分類而編制的。

(i) 長(zhǎng)期實(shí)驗(yàn)特征評(píng)估該方法如何處理長(zhǎng)時(shí)間實(shí)驗(yàn)。即使在小環(huán)境中,vSLAM 也會(huì)不斷收集新的關(guān)鍵幀,這意味著長(zhǎng)期實(shí)驗(yàn)可能會(huì)導(dǎo)致關(guān)鍵幀和地圖特征的數(shù)量不斷增加。定義一個(gè)好的關(guān)鍵幀選擇策略和內(nèi)存管理方法很重要;

(ii) 大尺度環(huán)境特征判斷該方法對(duì)大環(huán)境的擴(kuò)展能力(即積累的特征越多,地標(biāo)越遠(yuǎn))。為了評(píng)估這方面,重要的標(biāo)準(zhǔn)是減少漂移、有效的全局優(yōu)化(例如,關(guān)鍵幀的選擇和關(guān)鍵幀圖的類型)以及有效的位置識(shí)別和閉環(huán)框架;

(iii) 低紋理環(huán)境對(duì)應(yīng)于紋理很少的表面,例如可能成為問(wèn)題的大墻,特別是對(duì)于特征提取。面向低紋理空間的最佳性能方法可能會(huì)使用邊緣和附加硬件等特殊功能進(jìn)行定位(IMU),甚至更好地用于建圖(RGB-D 方法的深度傳感器);

(iv) 室外環(huán)境:這類環(huán)境增加了光線變化等困難。使用深度傳感器、良好的特征描述符或簡(jiǎn)單的強(qiáng)大位置識(shí)別方法(通過(guò)閉合循環(huán)來(lái)糾正錯(cuò)誤)與室外空間相關(guān)。該分析還基于每種算法的戶外測(cè)試結(jié)果;

(v) 運(yùn)動(dòng):在處理相機(jī)時(shí)對(duì)高速運(yùn)動(dòng)引起的運(yùn)動(dòng)模糊的魯棒性對(duì)于為正確的應(yīng)用選擇正確的方法很重要。使用稠密地圖或邊緣特征的方法通常更穩(wěn)健。然而,如前文第 4 節(jié)所述,我們發(fā)現(xiàn)視覺(jué)慣性系統(tǒng)更健壯。

8.png9.png

添加其他方法來(lái)完成之前執(zhí)行的 v/viSLAM 分類。兩個(gè)有趣的 PTAM 派生算法是 PTAM [78] 的雙目版本和雙窗口優(yōu)化 (DWO) [79] 框架。CD-SLAM [80] 是首次嘗試以更穩(wěn)健的方法將 PTAM 的原理擴(kuò)展到大規(guī)模間接 vSLAM。CD-SLAM 的一些特性啟發(fā)了流行的 ORB-SLAM。后者結(jié)合了最高效的 vSLAM 功能(雙模型初始化、高效的關(guān)鍵幀和地圖點(diǎn)剔除、ORB 功能和詞袋回環(huán)閉合)以及關(guān)鍵幀的“基本圖”。ORB-SLAM2 [76] 使 ORB-SLAM 適應(yīng)雙目和 RGB-D 相機(jī)。Edge-SLAM [81] 是最近嘗試以邊緣為特征構(gòu)建強(qiáng)大的 vSLAM。還包括直接方法“半稠密視覺(jué)里程計(jì)”[5] 和 Kintinuous [82]。第一個(gè)側(cè)重于使用智能手機(jī)將半稠密 vSLAM 應(yīng)用于增強(qiáng)現(xiàn)實(shí)。最后一個(gè)是 KinectFusion 算法針對(duì)更大規(guī)模環(huán)境的擴(kuò)展。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

LCD顯示屏相關(guān)文章:lcd顯示屏原理


lcd相關(guān)文章:lcd原理


關(guān)鍵詞: 計(jì)算機(jī)視覺(jué)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉