NeurIPS 2021 | 尋MixTraining: 一種全新的物體檢測訓練范式
來源:專知
MixTraining: 一種全新的物體檢測訓練范式
論文鏈接:
https://www.zhuanzhi.ai/paper/b52468c0ddce3d49f7740cfd1528a7a0
代碼鏈接(即將開源):
https://github.com/MendelXu/MixTraining
物體檢測是計算機視覺中的基礎課題。經典的物體檢測器通常采用單一的數據增強策略,并簡單地使用人工標注的物體包圍盒來進行訓練,這種訓練策略也被稱為 SiTraining 范式。在本篇論文中,微軟亞洲研究院的研究員們提出了一種全新的物體檢測訓練范式:MixTraining。該范式通過引入 Mixed Training Targets(混合訓練目標)與 Mixed Data Augmentation(混合數據增廣),可以有效提升現有物體檢測器性能,并且不會在測試階段增加任何額外的開銷。如表4所示,MixTraining 能夠將基于 ResNet-50 的 Faster R-CNN 的檢測精度從41.7mAP 提升至44.3 mAP,并將基于 Swin-S 的 Cascade R-CNN 的檢測精度從 50.9mAP 提升至 52.8mAP。
表4:MixTraining 可以有效提升多種現有檢測器的檢測性能
除了良好的系統(tǒng)級性能提升以外,研究員們還對該范式為何有效進行了深入詳盡的分析與研究。研究員們首先對 Mixed Training Targets (混合訓練目標)的工作機理進行了分析。Mixed Training Targets (混合訓練目標)采用了老師-學生 (Teacher-Student)架構來生成高質量的檢測結果,并將這些檢測結果作為偽標注(Pseudo ground-truth)再與真實的人類標注 (Human-annotated ground-truth)結合起來共同作為網絡的訓練標注。研究員們發(fā)現這種使用混合標注有兩種好處:1)可以避免漏標的物體(missing label) ;2)可以降低標注中的定位噪聲(box loc noise) 。分析結果如表5所示。
表5:對混合訓練目標的消融實驗
其次,研究員們還對 Mixed Data Augmentation(混合數據增廣)進行了進一步的研究。研究員們猜測不同的訓練實例可能需要不同強度的數據增廣,而不能一概而論地對所有訓練示例使用統(tǒng)一的簡單或者過強的數據增廣,否則反而有可能會損害訓練性能,結果如表6所示。
表6:對混合數據增廣的消融實驗
與此同時,研究員們還發(fā)現 MixTraining 可以在更長的訓練輪數中獲得更大的收益,結果如表7所示。
表7:MixTraining 可以在更長的訓練輪數中獲得更大的收益
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。