博客專欄

EEPW首頁 > 博客 > 同濟(jì)、阿里獲CVPR最佳學(xué)生論文,李飛飛獲黃煦濤獎(jiǎng),近6000人線下參會(huì)(1)

同濟(jì)、阿里獲CVPR最佳學(xué)生論文,李飛飛獲黃煦濤獎(jiǎng),近6000人線下參會(huì)(1)

發(fā)布人:機(jī)器之心 時(shí)間:2022-06-22 來源:工程師 發(fā)布文章

剛剛,CVPR 2022 正式公布了最佳論文、最佳學(xué)生論文等獎(jiǎng)項(xiàng)。來自 ETH Zurich、華盛頓大學(xué)、佐治亞理工學(xué)院、捷克理工大學(xué)多個(gè)機(jī)構(gòu)的研究者共同獲得了最佳論文獎(jiǎng),來自阿里巴巴和同濟(jì)大學(xué)的研究者獲得了最佳學(xué)生論文獎(jiǎng)。此外,斯坦福大學(xué)教授李飛飛獲得了本次大會(huì)的 Thomas S. Huang (黃煦濤)紀(jì)念獎(jiǎng)。


圖片

2022 年,CVPR 大會(huì)的投稿量達(dá)到 8161 份,相比 2021 年度的 7093 份提交增長(zhǎng)了 15%。其中 44.59% 的作者來自中國(guó),排在第二名的是美國(guó),占據(jù) 20.65%。

圖片圖源:推特用戶 @Jared Heinly。
經(jīng)過三個(gè)多月的評(píng)審工作,大會(huì)最終共有 2064 篇論文被接收,接收率為 25.28%,高于去年的 23.6%。其中有 342 份被選為 Oral 論文,1721 份被選為 Poster 論文。此外,今年的 review 數(shù)量為 25804,rebuttal 數(shù)量為 5884。
圖片圖源:推特用戶 @raven。
其中,國(guó)內(nèi)有大量論文被接收。如據(jù)機(jī)器之心了解,商湯科技及聯(lián)合實(shí)驗(yàn)室共有 71 篇論文被大會(huì)接收,其中近四分之一被錄用為 Oral。
自新冠疫情流行以來,今年 CVPR 還是首次線下舉辦。據(jù)主辦方統(tǒng)計(jì),截至大會(huì)開幕,共有 9981 人注冊(cè)參會(huì),其中 5641 人現(xiàn)場(chǎng)參會(huì),4340 人以線上方式參會(huì)。
今年的大會(huì)特別紀(jì)念了孫劍博士:
圖片
在主會(huì)議的最開始,CVPR 2022 即公布了本次大會(huì)的全部獎(jiǎng)項(xiàng)。來自 ETH Zurich、華盛頓大學(xué)、佐治亞理工學(xué)院、捷克理工大學(xué)多個(gè)機(jī)構(gòu)的研究者共同獲得了最佳論文獎(jiǎng),來自阿里巴巴和同濟(jì)大學(xué)的研究者獲得了最佳學(xué)生論文獎(jiǎng)。此外,最佳論文提名和最佳學(xué)生論文提名的獎(jiǎng)項(xiàng)分別由 CMU 以及哈佛大學(xué)、谷歌研究院獲得。
最佳論文
圖片

  • 機(jī)構(gòu):ETH Zurich、華盛頓大學(xué)、佐治亞理工學(xué)院、捷克理工大學(xué)
  • 論文地址:https://arxiv.org/abs/2112.03424


論文摘要:該研究提出了一種在 RANSAC 框架中解決困難的幾何優(yōu)化問題的方法。最小化問題源于將原始幾何優(yōu)化問題松弛化(relax)為具有許多虛假解決方案的最小問題。該研究提出的方法避免了計(jì)算大量虛假解決方案。研究者設(shè)計(jì)了一種學(xué)習(xí)策略,用于選擇初始問題 - 解決方案對(duì)以用數(shù)值方法繼續(xù)解決原問題。該研究通過創(chuàng)建一個(gè) RANSAC 求解器來演示所提方法,該求解器通過使用每個(gè)視圖中的 4 個(gè)點(diǎn)進(jìn)行最小松弛化來計(jì)算 3 個(gè)校準(zhǔn)相機(jī)的相對(duì)位姿。平均而言,該方法可以在 70 μs 內(nèi)解決一個(gè)原始問題。此外,該研究還針對(duì)校準(zhǔn)相機(jī)的相對(duì)位姿這一問題進(jìn)行了基準(zhǔn)測(cè)試和研究。
最佳論文提名
今年的最佳論文提名由 CMU 的研究《Dual-Shutter Optical Vibration Sensing》獲得。
圖片

  • 機(jī)構(gòu):CMU
  • 論文地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf


論文摘要:視覺振動(dòng)測(cè)量是一種非常有用的工具,可用于遠(yuǎn)程捕捉音頻、材料物理屬性、人體心率等。雖然視覺上可觀察的振動(dòng)可以通過高速相機(jī)直接捕捉,但通過將激光束照射振動(dòng)表面所產(chǎn)生的散斑圖案的位移成像,可以從光學(xué)上放大微小且不易察覺的物體振動(dòng)。
在本文中,研究者提出了一種在高速(高達(dá) 63kHz)下同時(shí)檢測(cè)多個(gè)場(chǎng)景源振動(dòng)的新方法,該方法使用了額定工作頻率僅為 130Hz 的傳感器。他們的方法使用兩個(gè)分別配備滾動(dòng)和全局快門傳感器的相機(jī)來同時(shí)捕捉場(chǎng)景,其中滾動(dòng)快門相機(jī)捕捉到對(duì)高速物體振動(dòng)進(jìn)行編碼的失真散斑圖像,全局快門相機(jī)捕捉散斑圖案的未失真參考圖像,從而有助于對(duì)源振動(dòng)進(jìn)行解碼。最后,研究者通過捕捉音頻源(如揚(yáng)聲器、人聲和樂器)引起的振動(dòng)并分析音叉的振動(dòng)模式,展示了他們的方法。

圖片

研究者用一種新穎的方法「看到」(seeing)聲音。
最佳學(xué)生論文
今年獲得最佳學(xué)生論文獎(jiǎng)項(xiàng)的是《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》,作者來自阿里巴巴、同濟(jì)大學(xué)。
圖片

  • 機(jī)構(gòu):阿里巴巴、同濟(jì)大學(xué)
  • 論文地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Chen_EPro-PnP_Generalized_End-to-End_Probabilistic_Perspective-N-Points_for_Monocular_Object_Pose_Estimation_CVPR_2022_paper.pdf


論文摘要:利用****點(diǎn)(PnP)基數(shù)從單個(gè) RGB 圖像中定位 3D 物體是計(jì)算機(jī)視覺領(lǐng)域一個(gè)長(zhǎng)期存在的問題。在端到端深度學(xué)習(xí)的驅(qū)動(dòng)下,近期的研究建議將 PnP 解釋為一個(gè)可微分層,如此 2D-3D 點(diǎn)對(duì)應(yīng)就可以部分地通過反向傳播梯度 w.r.t. 物體姿態(tài)來學(xué)習(xí)。然而,從零開始學(xué)習(xí)整套不受限的 2D-3D 點(diǎn)在現(xiàn)有的方法下很難收斂,因?yàn)榇_定性的姿態(tài)本質(zhì)上是不可微的。
這篇論文提出了一種用于普遍端到端姿態(tài)估計(jì)的概率 PnP 層——EPro-PnP(end-to-end probabilistic PnP),它在 SE 流形上輸出姿態(tài)的分布,實(shí)質(zhì)地將分類 Softmax 帶入連續(xù)域。2D-3D 坐標(biāo)和相應(yīng)的權(quán)值作為中間變量,通過最小化預(yù)測(cè)姿態(tài)與目標(biāo)姿態(tài)分布之間的 KL 散度來學(xué)習(xí)。其基本原理統(tǒng)一了現(xiàn)有的方法,類似于注意力機(jī)制。EPro-PnP 的性能明顯優(yōu)于其他基準(zhǔn),縮小了基于 PnP 的方法與基于 LineMOD 6DoF 的姿態(tài)估計(jì)以及 nuScenes 3D 目標(biāo)檢測(cè)基準(zhǔn)的特定任務(wù)方法之間的差距。
圖片EPro-PnP 方法概覽。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉