同濟(jì)、阿里獲CVPR最佳學(xué)生論文,李飛飛獲黃煦濤獎(jiǎng),近6000人線下參會(huì)(2)
今年的最佳學(xué)生論文提名由哈佛大學(xué)和谷歌研究院的論文《Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields》獲得。
- 機(jī)構(gòu):哈佛大學(xué)、谷歌研究院
- 論文地址:https://arxiv.org/pdf/2112.03907.pdf
論文摘要:神經(jīng)輻射場(chǎng)是一種流行的視圖合成技術(shù),它將場(chǎng)景表示為連續(xù)的體積函數(shù),由多層感知器參數(shù)化,多層感知器提供每個(gè)位置的體積密度和與視圖相關(guān)的散發(fā)輻射。雖然基于 NeRF 的方法擅長(zhǎng)表征平滑變化的外觀幾何結(jié)構(gòu),但它們通常無法準(zhǔn)確捕捉和再現(xiàn)光澤表面的外觀。該研究提出了 Ref-NeRF 來解決這個(gè)問題,它將 NeRF 與視圖相關(guān)的散發(fā)輻射的參數(shù)化替換為反射輻射的表征,并使用空間變化的場(chǎng)景屬性的集合來構(gòu)造該函數(shù)。該研究表明,使用法向量上的正則化器,新模型顯著提高了鏡面反射的真實(shí)性和準(zhǔn)確性。此外,該研究還表明該模型對(duì)散發(fā)輻射的內(nèi)部表征是可解釋的,這對(duì)于場(chǎng)景編輯非常有用。
與以往表現(xiàn)最好的神經(jīng)視圖合成模型 mip-NeRF 相比,Ref-NeRF 顯著提升了法向量(最上行)和視覺真實(shí)性(余下行)。
其他獎(jiǎng)項(xiàng)
Longuet-Higgins 獎(jiǎng)
Longuet-Higgins 獎(jiǎng)是 IEEE 計(jì)算機(jī)協(xié)會(huì)模式分析與機(jī)器智能(PAMI)技術(shù)委員會(huì)在每年的 CVPR 頒發(fā)的「計(jì)算機(jī)視覺基礎(chǔ)貢獻(xiàn)獎(jiǎng)」,表彰十年前對(duì)計(jì)算機(jī)視覺研究產(chǎn)生了重大影響的 CVPR 論文。該獎(jiǎng)項(xiàng)以理論化學(xué)家和認(rèn)知科學(xué)家 H. Christopher Longuet-Higgins 命名。
今年的獲獎(jiǎng)?wù)撐臑?2012 年發(fā)表的《Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite》,當(dāng)時(shí)三位作者中的 Andreas Geiger 和 Philip Lenz 來自卡爾斯魯厄理工學(xué)院, Raquel Urtasun 來自豐田工業(yè)大學(xué)芝加哥分校。
圖源:推特用戶 @Kosta Derpanis
論文地址:http://www.cvlibs.net/publications/Geiger2012CVPR.pdf
在本文中,研究者利用他們自己的自動(dòng)駕駛平臺(tái)為立體、光流、視覺測(cè)程 / SLAM 和 3D 目標(biāo)檢測(cè)等任務(wù)開發(fā)了一個(gè)新的具有挑戰(zhàn)性的基準(zhǔn)。他們的記錄平臺(tái)配備了 4 臺(tái)高分辨率攝像機(jī)、1 臺(tái) Velodyne 激光掃描儀和 1 個(gè) SOTA 定位系統(tǒng),基準(zhǔn)則包括 389 個(gè)立體和光流圖像對(duì)、39.2km 長(zhǎng)的立體視覺測(cè)程序列以及在雜亂場(chǎng)景中捕獲的超過 20 萬個(gè) 3D 目標(biāo)注釋(每張圖像最多可見 15 輛車和 30 名行人)。
左上為配備了傳感器的記錄平臺(tái),中上為來自研究者視覺測(cè)程基準(zhǔn)中的軌跡、右上為視差和光流圖、下方為 3D 目標(biāo)標(biāo)簽。
青年研究者獎(jiǎng)
青年研究者獎(jiǎng)(Young Researcher Awards)旨在表彰年輕的科學(xué)家,鼓勵(lì) ta 們繼續(xù)做出開創(chuàng)性的工作。評(píng)選標(biāo)準(zhǔn)是獲獎(jiǎng)?wù)攉@得博士學(xué)位的年限少于 7 年。
今年獲得該獎(jiǎng)項(xiàng)的研究者分別是 Bharath Hariharan 和 Olga Russakovsky。
圖源:推特用戶 @Kosta Derpanis
Bharath Hariharan 為康奈爾大學(xué)計(jì)算機(jī)科學(xué)系助理教授,從事計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)方面的工作,尤其是那些無視大數(shù)據(jù)標(biāo)簽的重要問題。Hariharan 主要研究方向?yàn)閷C(jī)器學(xué)習(xí)的進(jìn)步與計(jì)算機(jī)視覺、幾何和特定領(lǐng)域知識(shí)的見解結(jié)合起來。
目前,Hariharan 所在團(tuán)隊(duì)正在致力于構(gòu)建一個(gè)系統(tǒng),該系統(tǒng)可以在很少或沒有監(jiān)督的情況下了解數(shù)以萬計(jì)的視覺概念,產(chǎn)生豐富而詳細(xì)的輸出,比如精確的 3D 形狀,并對(duì)世界進(jìn)行推理,將這種推理傳遞給人類。
他在 Google Scholar 上的論文被引量達(dá)到 25242,h 指數(shù)為 38。
個(gè)人主頁:http://home.bharathh.info/
Olga Russakovsky 為普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系助理教授,致力于開發(fā)能夠?qū)σ曈X世界進(jìn)行推理的人工智能系統(tǒng)。Russakovsky 主要研究方向?yàn)橛?jì)算機(jī)視覺、人機(jī)交互等領(lǐng)域。她的多篇論文被 ECCV、CVPR 等接收。
她在 Google Scholar 上的論文被引量達(dá)到 34756,h 指數(shù)為 25。
個(gè)人主頁:https://www.cs.princeton.edu/~olgarus/
Thomas S. Huang 紀(jì)念獎(jiǎng)
為了紀(jì)念去世的 Thomas S. Huang(黃煦濤)教授,PAMITC 獎(jiǎng)勵(lì)委員會(huì)去年批準(zhǔn)設(shè)立 Thomas S. Huang 紀(jì)念獎(jiǎng),以表彰在 CV 研究、教育和服務(wù)方面被公認(rèn)為楷模的研究人員。該獎(jiǎng)項(xiàng)從 2021 年開始頒發(fā)。獲獎(jiǎng)?wù)咝枰玫讲┦繉W(xué)位至少 7 年,最好處于職業(yè)發(fā)展中期(不超過 25 年)。
本屆 Thomas S. Huang 紀(jì)念獎(jiǎng)的獲獎(jiǎng)?wù)呤撬固垢4髮W(xué)教授李飛飛。
圖源:推特用戶 @Kosta Derpanis
李飛飛為斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授,美國工程院院士,美國國家醫(yī)學(xué)院院士。她的專業(yè)領(lǐng)域是計(jì)算機(jī)視覺和認(rèn)知神經(jīng)科學(xué)。2016 年,李飛飛加入 Google 云端人工智能暨機(jī)器學(xué)習(xí)的中國中心團(tuán)隊(duì),以 Google Cloud 首席科學(xué)家身份任團(tuán)隊(duì)負(fù)責(zé)人之一。2018 年 9 月,她宣布返回斯坦福大學(xué)任教,并持續(xù)參與斯坦福大學(xué)的 AI 議題研究。
李飛飛的工作包括括受認(rèn)知啟發(fā)的 AI,機(jī)器學(xué)習(xí),深度學(xué)習(xí),計(jì)算機(jī)視覺和 AI + 醫(yī)療保健,尤其是用于醫(yī)療保健交付的環(huán)境智能系統(tǒng)。她還從事認(rèn)知和計(jì)算神經(jīng)科學(xué)方面的工作。她發(fā)明了 ImageNet 和 ImageNet Challenge,其中 ImageNet Challenge 是一項(xiàng)重要的大規(guī)模數(shù)據(jù)集和基準(zhǔn)測(cè)試工作。
她在 Google Scholar 上的論文被引量達(dá)到 167561,h 指數(shù)為 128。
個(gè)人主頁:https://profiles.stanford.edu/fei-fei-li
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。