視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（3）

發(fā)布人：計(jì)算機(jī)視覺(jué)工坊時(shí)間：2021-07-26 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

7. 實(shí)驗(yàn)基準(zhǔn)

使用第 6 節(jié)中的分類，為實(shí)驗(yàn)基準(zhǔn)選擇了五種主要算法：DSO [33]、LSD-SLAM [35]、ORB-SLAM2 [76]，以及兩種 viSLAM 方法：ROVIO [26] 和 Vins-Mono [ 74]。它們都可以被視為其類別中的參考方法。它們體現(xiàn)了現(xiàn)有設(shè)計(jì)的多樣性，理論上適合我們的用例。它們?cè)诒?2 中以粗體顯示。根據(jù)我們的分類，我們?yōu)閜edestrian context選擇 viSLAM 算法 ROVIO 和 Vins-Mono。它們也被 [3] 認(rèn)為是所有平臺(tái)和數(shù)據(jù)集上最準(zhǔn)確和最健壯的算法，而 ROVIO 被認(rèn)為是一個(gè)很好的折衷方案。Chen 等人 [15] 也認(rèn)為 Vins-Mono 作為被測(cè) viSLAM 算法中精度最好的算法。

這些算法的選擇不僅基于其在該領(lǐng)域的重要性，而且還基于感興趣的用例的要求：在城市環(huán)境中使用手持設(shè)備進(jìn)行行人位姿估計(jì)。選定的方法應(yīng)針對(duì)具有挑戰(zhàn)性的環(huán)境中的準(zhǔn)確位姿估計(jì)，并在開(kāi)源中可用。該基準(zhǔn)測(cè)試沒(méi)有應(yīng)用與計(jì)算困難相關(guān)的限制。當(dāng)我們?cè)谑殖衷O(shè)備（例如智能手機(jī)）上尋求實(shí)現(xiàn)時(shí)，預(yù)計(jì)對(duì)許多擾動(dòng)具有全局魯棒性。我們只為 viSLAM 部分選擇了適用于單目相機(jī)和 IMU 的方法。行人應(yīng)用意味著必須考慮用戶的行為。手持相機(jī)的運(yùn)動(dòng)可能會(huì)抖動(dòng)，并且會(huì)出現(xiàn)快速的不均勻運(yùn)動(dòng)。在用戶需求方面，我們更喜歡不需要非常具體的手動(dòng)初始化的方法。由于大多數(shù)行人應(yīng)用程序都在戶外（例如，在城市環(huán)境中），所選算法必須處理大規(guī)模場(chǎng)景、長(zhǎng)時(shí)間實(shí)驗(yàn)（幾分鐘到一個(gè)小時(shí)）和光線變化?？紤]到他們?cè)谏鲜龇诸愔械脑u(píng)估，Kimera [60] 和 VIORB [75] 可以被添加到這個(gè)基準(zhǔn)中。但即使 Kimera 的目標(biāo)是使用單目攝像頭運(yùn)行，目前代碼的一部分（閉環(huán)檢測(cè)）也需要雙目攝像頭。至于 VIORB，作者沒(méi)有公開(kāi)他們的代碼。

7.1. Experiments and Dataset Features

實(shí)驗(yàn)設(shè)置、數(shù)據(jù)采集和分析采用了以下功能。它們特定于我們的用例。

(i) 硬件（手持設(shè)備）：具有卷簾快門(mén)和 IMU 記錄的前向單目相機(jī)；

(ii) 位姿估計(jì)：我們主要關(guān)注當(dāng)前位姿的在線正確性，而不是重建路徑的整體精度；

(iii) 室外場(chǎng)景：光照變化、觀察場(chǎng)景尺度的可變性；

(iv) 行人：整體速度（和低平均速度）變化不大，但相機(jī)搖晃。由于步行速度，加速度在每個(gè)軸上遵循特定的前后運(yùn)動(dòng)；

(v) 大軌跡：它從幾個(gè)閉環(huán)擴(kuò)展到?jīng)]有閉環(huán)；

(vi) 城市環(huán)境：移動(dòng)物體、觀察到紋理不良的元素（天空、墻壁等）的潛在時(shí)刻；

(vii) 大眾：期望用戶友好（無(wú)需特定的手動(dòng)初始化，無(wú)需針對(duì)每個(gè)場(chǎng)景調(diào)整參數(shù)）。

選擇 EuRoC MAV 數(shù)據(jù)集 [6]，包括慣性數(shù)據(jù)，用于所有五種方法的整體比較。可以考慮使用其他 IMU+視覺(jué)數(shù)據(jù)集來(lái)擴(kuò)展我們的實(shí)驗(yàn)評(píng)估。在 [83] 中，描述了一個(gè)室內(nèi)/室外數(shù)據(jù)集，但與 EuRoc 數(shù)據(jù)集的 1 mm 相比，其真實(shí)準(zhǔn)確度僅為 15 cm。[84] 中提供的數(shù)據(jù)集是由蘇黎世城市空間中的 MAV 記錄的。MAV 位移的基本事實(shí)使用 Pix4D 攝影測(cè)量進(jìn)行后處理，而不是像在 EuRoc 數(shù)據(jù)集中那樣由外部定位系統(tǒng)（例如，運(yùn)動(dòng)捕捉系統(tǒng)）進(jìn)行測(cè)量。[85] 中提供的數(shù)據(jù)集，與 EuRoc 相比，它具有良好的準(zhǔn)確性和更高的測(cè)試序列可變性。我們選擇 EuRoc 是因?yàn)樗谄渌C述中的廣泛，采用簡(jiǎn)化了我們的結(jié)果與其他研究的比較。我們將在未來(lái)的工作中考慮其他數(shù)據(jù)集。有興趣的讀者可以找到 [15, 83–85] 中引用的其他數(shù)據(jù)集。

EURoc 包括無(wú)人機(jī)在相同環(huán)境和六個(gè)自由度地面實(shí)況下飛行的各種場(chǎng)景。我們選擇僅關(guān)注 11 個(gè)可用場(chǎng)景中的三個(gè)場(chǎng)景。它們對(duì)應(yīng)于表 4 中詳述的不同特征，這些特征對(duì)于評(píng)估所選算法的性能都很有趣。讓我們注意到無(wú)人機(jī)的飛行運(yùn)動(dòng)與手持相機(jī)的相似，這與 KITTI 數(shù)據(jù)集 [86] 的車(chē)載相機(jī)相反，其 10 Hz 的采樣頻率不足以跟蹤快速運(yùn)動(dòng)。手部運(yùn)動(dòng)的幅度經(jīng)常被低估。運(yùn)動(dòng)比與步行步態(tài)自然同步的手臂的運(yùn)動(dòng)更重要。將手持設(shè)備翻轉(zhuǎn)并抬起以探索環(huán)境。這就是我們可以將其與無(wú)人機(jī)動(dòng)力學(xué)進(jìn)行比較的原因。選定的方法還在一個(gè)名為“IRSTV”的新數(shù)據(jù)集上進(jìn)行了測(cè)試，該數(shù)據(jù)集由步行者使用手持設(shè)備沿城市路徑行走收集，以及硬件設(shè)置，如圖 6 所示。它對(duì)應(yīng)于室內(nèi)和明亮的室外空間中 466 m 的步行路徑。它包括具有不同尺度場(chǎng)景的圖像：街道、開(kāi)放空間和房間。它還包含對(duì)重建環(huán)境的玻璃覆蓋的建筑物的觀察，這在經(jīng)典的視覺(jué)里程計(jì)上是失敗的。在采集開(kāi)始時(shí)沒(méi)有強(qiáng)加用于動(dòng)態(tài)初始化的特定運(yùn)動(dòng)。

硬件設(shè)置包括一個(gè) Garmin 相機(jī)和一個(gè)名為 ULISS [87] 的專用平臺(tái)（圖 6）。攝像頭為“VIRB 30 Ultra”，焦距固定，幀率為60 Hz，1920*1080像素分辨率，對(duì)應(yīng)智能手機(jī)采集的標(biāo)準(zhǔn)分辨率。ULISS 包括一個(gè)三軸慣性測(cè)量單元和一個(gè)以 200 Hz 采樣的三軸磁力計(jì)、一個(gè)氣壓計(jì)、一個(gè)高靈敏度 GPS 接收機(jī)和一個(gè)天線。這些低成本傳感器通常嵌入在移動(dòng)設(shè)備中。這種硬件設(shè)置可以訪問(wèn)原始數(shù)據(jù)，而無(wú)需通常嵌入在移動(dòng)設(shè)備中的預(yù)過(guò)濾。ULISS 和相機(jī)數(shù)據(jù)使用來(lái)自嵌入在兩個(gè)設(shè)備中的 GPS 接收器的時(shí)間戳精確同步。用于室內(nèi)/室外行人導(dǎo)航的參考系統(tǒng) PERSY [88] 附在腳上。它以累積步行距離的 0.3% 的水平定位精度為行人的場(chǎng)景提供地面實(shí)況。它在圖 6 中以綠色顯示。

基準(zhǔn)測(cè)試是在 2.60 GHz Intel Core i7-6700HQ CPU 上進(jìn)行的。我們的 Linux 環(huán)境位于虛擬機(jī) (Oracle VirtualBox 5.2.12) 中。我們?cè)试S所有四個(gè)內(nèi)核都具有 100% 的分配資源和 5 GB 的 RAM 使用量。所有算法均在 Ubuntu 16.04 中測(cè)試。當(dāng)需要 ROS 時(shí)，我們將ROS kinetic和catkin workspace一起使用。下一節(jié)將詳細(xì)分析所選數(shù)據(jù)集上的所選算法，并評(píng)估最適合我們案例的算法。

7.2. Experimental Assessment Methodology

我們從 EuRoc 數(shù)據(jù)集開(kāi)始對(duì)之前提供的兩個(gè)數(shù)據(jù)集進(jìn)行了測(cè)試。所有結(jié)果都是五次運(yùn)行的平均值，以考慮隨機(jī)異常值緩解部分。在表 5 和表 6 中，我們提供了每個(gè)數(shù)據(jù)集上每種方法的相對(duì)定位誤差 (RPE) 和絕對(duì)定位誤差 (APE) 的平均值。APE 和 RPE 是用 evo 包 github.com/MichaelGrupp/evo 獲得的。APE 是估計(jì)位置（2D 或 3D）與真實(shí)位置之間的歐幾里德距離，而 RPE 是連續(xù)位置估計(jì)（2D 或 3D）之間的歐幾里德距離。我們計(jì)算了均方根誤差 (RMSE)、標(biāo)準(zhǔn)差 (σ) 和最大誤差 (max) 的平均值作為常量指標(biāo)。APE 是在所有方法的 Sim (3) Umeyama 對(duì)齊之后計(jì)算的 [89]。RPE 計(jì)算為漂移：每米的平移或旋轉(zhuǎn)誤差。這種局部精度與關(guān)鍵幀的數(shù)量無(wú)關(guān)，并允許比較 VO 和 vSLAM。

RPE 通過(guò)檢查位姿-位姿變換的正確性來(lái)評(píng)估漂移誤差部分。例如，好的 RPE 和壞的 APE 可能表示漂移校正不好。它可能來(lái)自低效的回環(huán)框架和/或錯(cuò)誤的初始化，因?yàn)橹莱跏蓟?SLAM [20] 的弱點(diǎn)之一。這也可能意味著主要的“單一”錯(cuò)誤很可能發(fā)生在本地并且沒(méi)有得到糾正。在這種情況下，最大 RPE 應(yīng)該比 RMSE RPE 大得多。

使用提供的時(shí)間戳，我們將實(shí)際位置與估計(jì)位置進(jìn)行比較以計(jì)算 APE。它們?cè)?EuRoc 數(shù)據(jù)集的 3D 中計(jì)算，但對(duì)于 IRSTV 數(shù)據(jù)集僅在 2D 中計(jì)算，因?yàn)?PERSY 僅提供水平平面中行人路徑的基本事實(shí)。繪制累積 APE 分布函數(shù) (CDF) 以用于測(cè)試算法的全局準(zhǔn)確性和穩(wěn)定性評(píng)估。誤差是在由形成局部水平面的和軸以及指向上方的軸定義的局部導(dǎo)航框架中計(jì)算的。為了模擬在不同環(huán)境中的各種任務(wù)之間不需要人工干預(yù)的實(shí)際應(yīng)用程序，運(yùn)行計(jì)算所需的參數(shù)對(duì)于所有運(yùn)行都是固定的。

我們還評(píng)估了與用例相關(guān)的五個(gè)功能的性能（第 7.1 節(jié)），以及穩(wěn)定性（對(duì)于給定場(chǎng)景從一次運(yùn)行到另一次運(yùn)行，結(jié)果是否可能會(huì)發(fā)生變化）、整體質(zhì)量姿態(tài)估計(jì)，以及無(wú)需后處理即可估計(jì)真實(shí)比例的能力。對(duì)于最后一點(diǎn)，我們簡(jiǎn)單地確定了結(jié)果和真值之間軌跡總長(zhǎng)度上的相對(duì)誤差。

7.3. Detailed Analysis

分析從單目 ORB-SLAM2、Vins-Mono 和 DSO 開(kāi)始，給出了三個(gè) EuRoc 上的最佳 RPE 和 APE。它繼續(xù)使用 LSD-SLAM 和 ROVIO，在 IRSTV 數(shù)據(jù)集上提供不太好的結(jié)果和失敗。

7.3.1. ORB-SLAM2 Result Analysis

總的來(lái)說(shuō)，ORB-SLAM2 提供了最佳的 RPE RMSE。在 APE 方面，它在 RMSE 和最大誤差方面都優(yōu)于 DSO 和 Vins-Mono。這突出了其糾正漂移效應(yīng)的效率。圖 7 顯示了 3 EuRoc 定位誤差的 CDF。我們觀察到一個(gè)非常好的穩(wěn)定性，最低的這個(gè)基準(zhǔn)和最好的可預(yù)測(cè)性在 ROVIO 之后具有最低的 RMSE 標(biāo)準(zhǔn)偏差。ORB-SLAM2 提供了顯著的穩(wěn)定性，最大 APE/RMSE 比率約為 2，這是該基準(zhǔn)測(cè)試的最低比率。除了 ROVIO 之外，它還提供了最佳的可預(yù)測(cè)性，并且 RMSE 的標(biāo)準(zhǔn)偏差最低。

MH01 和 MH03 結(jié)果相似，說(shuō)明對(duì)運(yùn)動(dòng)具有良好的魯棒性。與 MH01 和 MH03 相比，MH05 幾乎不受干擾的 RPE 和 APE 似乎表明對(duì)缺乏紋理的魯棒性。然而，這僅僅是因?yàn)?ORB-SLAM2 具有重新定位和閉合回路的能力，詳見(jiàn)第 7.4 節(jié)，其中 ORB-SLAM2 在沒(méi)有閉環(huán)的情況下進(jìn)行了測(cè)試。ORB-SLAM2 的 VO 基礎(chǔ)實(shí)際上對(duì)缺少紋理的 MH05 部分非常敏感。IRSTV 的結(jié)果表明 ORB-SLAM2 可以完美處理大型困難環(huán)境。盡管沒(méi)有閉環(huán)，但它輸出了相當(dāng)精確的結(jié)果，在行駛距離上有 1.1% 的 APE RMSE 誤差。沒(méi)有觀察到由于環(huán)境或初始化發(fā)出的失敗。

總而言之，發(fā)現(xiàn) ORB-SLAM2 在各種測(cè)試場(chǎng)景（包括非常大的規(guī)模）中具有一致性和魯棒性，并且具有非?？煽康膬?yōu)化和閉環(huán)框架。盡管僅使用高速視覺(jué)慣性數(shù)據(jù)集的視覺(jué)信息，但它的性能至少與包括 Vins-Mono 在內(nèi)的其他最先進(jìn)方法一樣好。它的視覺(jué)里程計(jì)基礎(chǔ)對(duì)缺乏紋理非常敏感，但閉環(huán)和重新定位允許糾正軌跡。然而，讓我們注意到 ORB-SLAM2 有一個(gè)非常嚴(yán)格的關(guān)鍵幀剔除策略，這意味著它也輸出更少的位姿。與真正估計(jì)的相比，這顯然提高了輸出。這也意味著結(jié)果有時(shí)會(huì)在幾秒鐘內(nèi)沒(méi)有任何姿勢(shì)輸出，因?yàn)樵诖似陂g沒(méi)有捕獲新的關(guān)鍵幀（或后來(lái)被剔除），如圖 8 所示。這可以通過(guò)降低關(guān)鍵幀管理的嚴(yán)重性來(lái)避免代碼中的參數(shù)。禁用閉環(huán)的結(jié)果顯示在第 7.4 節(jié)中。

7.3.2. Vins-Mono Result Analysis

Vins-Mono RPE RMSE 是我們最好的基準(zhǔn)測(cè)試之一。Vins-Mono APE 結(jié)果也是第二好（與 DSO 并列在 ORB-SLAM2 之后）。其 APE max/RMSE 比率為 2 比 3，其整體一致性 (, max) 可與 DSO 相媲美。然而，我們?cè)?MH01 中獲得了不太可預(yù)測(cè)的結(jié)果（11.5%），這表明高速實(shí)際上有利于 Vins-Mono 的穩(wěn)健性。CDF 誤差圖的形狀（圖 9）還表明仍有一些奇異誤差使整體結(jié)果惡化。

Vins-Mono 最顯著的結(jié)果是真實(shí)尺度估計(jì)的高精度。MH01 為 2.7%，MH03 為 2.8%，MH05 為 0.9%。在 MH03 中，RPE 和 APE 并未真正受到運(yùn)動(dòng)增加的影響。與 MH01 或 MH03 相比，MH05 的結(jié)果也很棒，這表明對(duì)缺乏紋理的魯棒性。

對(duì) IRSTV 數(shù)據(jù)集的測(cè)試輸出了行進(jìn)距離的 3.3% 的 APE RMSE，對(duì)于大多數(shù)行人定位應(yīng)用來(lái)說(shuō)，這是一個(gè)令人滿意的結(jié)果。然而，與 EuRoC 不同，Vins-Mono 在初始化方面遇到了很多困難，可能是因?yàn)樵跊](méi)有特定的初始化階段。當(dāng)檢測(cè)到具有足夠視差的運(yùn)動(dòng)時(shí)，它通?？梢猿跏蓟?。然而，此時(shí)估計(jì)的IMU加速度偏差的質(zhì)量是不確定的，這極大地影響了結(jié)果的準(zhǔn)確性和魯棒性。我們還發(fā)現(xiàn)玻璃門(mén)反射反復(fù)是導(dǎo)致故障的原因。此外，對(duì) IRSTV 數(shù)據(jù)集的實(shí)際規(guī)模估計(jì)遠(yuǎn)不如在 EuRoC 的近距離環(huán)境中精確（大約 43% 的誤差?。１M管如此，我們相信這些結(jié)果是可以改進(jìn)的。在數(shù)據(jù)集的開(kāi)頭為動(dòng)態(tài)初始化添加特定的運(yùn)動(dòng)可能會(huì)改善結(jié)果和魯棒性。

總的來(lái)說(shuō)，Vins-Mono 被發(fā)現(xiàn)對(duì)所呈現(xiàn)場(chǎng)景中的困難具有魯棒性，其出色的 RPE RMSE 有望用于長(zhǎng)期實(shí)驗(yàn)。雖然 ORB-SLAM2 的結(jié)果總體上還是比較好，但 Vins-Mono 的真正好處是它能夠準(zhǔn)確估計(jì)真實(shí)的尺度。因此，結(jié)果可以很容易地在線解釋為給定地圖上的真實(shí)世界位姿。然而，IRSTV 數(shù)據(jù)集的結(jié)果表明，很難滿足硬件方面的要求以充分利用 Vins-Mono，或者可能需要特定的用戶移動(dòng)來(lái)正確初始化 IMU 偏差。

7.3.3. DSO Result Analysis

與 Vins-Mono 和 ORB-SLAM2 一起，DSO 方法輸出所有測(cè)試方法的最佳 RPE RMSE 結(jié)果。作為一種純 VO 方法，其準(zhǔn)確性僅取決于里程計(jì)的質(zhì)量。DSO 的結(jié)果也很明顯，因?yàn)樗鼈兣c APE σ和max的規(guī)律性與 Vins-Mono 的誤差相當(dāng)。

由于 MH03 的結(jié)果與 MH01 的結(jié)果相當(dāng)，并且 MH05 的結(jié)果與 MH01 的結(jié)果相當(dāng)，因此發(fā)現(xiàn) DSO 對(duì)運(yùn)動(dòng)具有魯棒性。盡管 DSO 是純視覺(jué)里程計(jì)，但它的總體結(jié)果是我們基準(zhǔn)測(cè)試中的第二好，并且有希望用于大規(guī)模環(huán)境（低 RPE RMSE），盡管圖 10 顯示誤差與軌跡長(zhǎng)度有關(guān)，而不是其他任何東西（參見(jiàn)表 4）。與我們基準(zhǔn)測(cè)試的其他兩種最佳方法相比，DSO 還具有在實(shí)時(shí)位姿估計(jì)上獲得這種精度的優(yōu)勢(shì)，而不僅僅是在軌跡重建上。

DSO 正確估計(jì)路徑并重建 IRSTV 數(shù)據(jù)集的環(huán)境。當(dāng)相機(jī)從街道移動(dòng)到一個(gè)大的地方時(shí)，尺度估計(jì)會(huì)失敗，并且軌跡是用兩種不同的尺度估計(jì)的。我們只考慮了 APE 誤差估計(jì)軌跡的第二部分，因?yàn)樗俏ㄒ煌ㄟ^(guò)三種方法重建良好的部分（圖 11）。在行駛距離上的 APE RMSE 為 3.8%，結(jié)果不如 ORB-SLAM2 和 Vins-Mono 的結(jié)果精確。讓我們注意，與 Vins-Mono cf 不同，DSO 沒(méi)有遇到初始化困難。第 7.3.2 節(jié)。較低的精度以及尺度估計(jì)問(wèn)題可以通過(guò)使用滾動(dòng)快門(mén)相機(jī)來(lái)解釋，而直接方法在全局快門(mén)下表現(xiàn)更好。

總體而言，DSO 在各種環(huán)境中都是精確、一致且穩(wěn)健的。重建的半稠密地圖給出了觀察到的周?chē)h(huán)境的易讀性?？吹剿鼘?duì)各種場(chǎng)景的適應(yīng)能力有多強(qiáng)，就結(jié)果而言，DSO 唯一真正的弱點(diǎn)是它純粹的 VO 性質(zhì)。即使在非常大的規(guī)模和困難的環(huán)境下，它也表現(xiàn)出色，但我們遇到了一個(gè)糟糕的尺度估計(jì)問(wèn)題。將其與閉環(huán)框架結(jié)合以將其轉(zhuǎn)變?yōu)檎嬲?SLAM 方法可能會(huì)很有趣。還要注意的是，DSO 需要 GPU 加速，這意味著它不容易適應(yīng)廣泛的應(yīng)用程序。

7.3.4. LSD-SLAM Result Analysis

據(jù)我們所知，EuRoC 上沒(méi)有公開(kāi)的 LSD-SLAM 測(cè)試可用。它的包是這里測(cè)試的所有算法中最古老的，因此我們不否認(rèn)可能適應(yīng) EURoC 的可能性（例如 Stereo 版本 [90] 可能在這里表現(xiàn)更好。（開(kāi)源 github 項(xiàng)目似乎也不是不再維護(hù)，也不會(huì)升級(jí)到最新的 Ubuntu 和 ROS 版本。）然而，通過(guò)使用今天可訪問(wèn)的常規(guī)包、參數(shù)和建議，我們?cè)O(shè)法在 MH03 和 MH05 上運(yùn)行 LSD-SLAM。盡管在 MH01 上取得了令人鼓舞的結(jié)果（圖 12），它對(duì)運(yùn)動(dòng)的魯棒性和可能缺乏紋理不足以為 MH03 和 MH05 產(chǎn)生不錯(cuò)的結(jié)果。此外，在我們進(jìn)行的每次 MH03 運(yùn)行結(jié)束前以及 MH05 上五分之三的運(yùn)行中，跟蹤都失敗了。為了更好地支持 LSD-SLAM 的初始化，我們切斷了無(wú)人機(jī)不規(guī)則移動(dòng)的數(shù)據(jù)集的開(kāi)頭，以初始化其 IMU 參數(shù)。

觀察在多次運(yùn)行中獲得的非常隨機(jī)的行為，很明顯 LSD-SLAM 在這里的失敗是由于初始化不當(dāng)造成的。最有可能的是，LSD-SLAM 結(jié)果并沒(méi)有反映這種方法在理想條件下的真實(shí)能力。這個(gè)結(jié)果突出了一個(gè)事實(shí)，即在初始化期間需要特別注意的方法不太適合許多無(wú)法帶來(lái)這種注意的應(yīng)用程序。在選擇 SLAM 方法時(shí)，對(duì)特定用戶干預(yù)和控制的需求是需要考慮的關(guān)鍵因素。根據(jù)當(dāng)前的設(shè)置和初始化過(guò)程，發(fā)現(xiàn) LSD-SLAM 對(duì)于類似于 EUROC Machine Hall 中呈現(xiàn)的場(chǎng)景不夠健壯。

7.3.5. ROVIO Result Analysis

查看數(shù)據(jù)集 MH01 和 MH03，在所有方法中，ROVIO 輸出最差的 RPE RMSE。累積誤差分布圖（如圖 13）所示，顯示 MH01 和 MH03 80% 的定位誤差在沿軸 25 cm、沿軸 20 cm 和沿軸 15 cm 以下。總的來(lái)說(shuō)，該方法仍然準(zhǔn)確，例如，MH01 和 MH03 沿軸的最大誤差分別為 40 cm 和 80 cm?？偟膩?lái)說(shuō)，它給出了最糟糕的 APE 之一（除了 LSD-SLAM 故障），APE RMSE 比其他方法差 3 到 20 倍，APE 最大差 3 到 12 倍。所有 ROVIO 運(yùn)行在數(shù)據(jù)集上給出相同的結(jié)果；沒(méi)有隨機(jī)參數(shù)。

一般的尺度估計(jì)對(duì)于真實(shí)尺度的軌跡估計(jì)來(lái)說(shuō)已經(jīng)足夠好了。MH01 的值等于 4.9%、MH03 的 4.7% 和 MH05 的 12.8%。與 MH01 相比，MH03 的性能并沒(méi)有特別改變（參見(jiàn) APE 和 RPE），因此運(yùn)動(dòng)似乎很穩(wěn)健。然而，MH05 上非常糟糕的結(jié)果表明，它出人意料地（因?yàn)樗?VIO）受到無(wú)紋理環(huán)境中的通道的嚴(yán)重影響。對(duì)于大規(guī)模，精度的缺乏與純 VIO 性質(zhì)相結(jié)合可能會(huì)導(dǎo)致非常不精確的結(jié)果。然而，像 ROVIO 一樣，純 VO 在長(zhǎng)期實(shí)驗(yàn)的內(nèi)存管理方面顯示出優(yōu)勢(shì)，因?yàn)樗鼉H適用于關(guān)鍵幀窗口。

總結(jié)一下 ROVIO，發(fā)現(xiàn)它不如其他方法精確。它只是一個(gè)沒(méi)有閉環(huán)和全局優(yōu)化的純 VIO。例如，它仍然是一種有趣的 VIO 方法，用于在線控制無(wú)人機(jī)，或者任何更關(guān)注局部位姿估計(jì)而不是重建軌跡相對(duì)于參考真值的正確性的應(yīng)用程序。它的可預(yù)測(cè)性對(duì)于重復(fù)性任務(wù)和已知場(chǎng)景很有趣。然而，無(wú)紋理環(huán)境似乎會(huì)帶來(lái)嚴(yán)重的問(wèn)題，并且結(jié)果缺乏一致性對(duì)于需要持續(xù)評(píng)估精度的應(yīng)用程序來(lái)說(shuō)是個(gè)問(wèn)題。ROVIO 在 IRSTV 數(shù)據(jù)集上失敗。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（3）

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（3）

相關(guān)推薦

技術(shù)專區(qū)

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（3）