博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 如何寫(xiě)/審AI領(lǐng)域的論文【VALSE Webinar】Panel實(shí)錄

如何寫(xiě)/審AI領(lǐng)域的論文【VALSE Webinar】Panel實(shí)錄

發(fā)布人:深度學(xué)習(xí)大講堂 時(shí)間:2020-09-26 來(lái)源:工程師 發(fā)布文章

編者按:隨著人工智能的飛速發(fā)展,相關(guān)領(lǐng)域?qū)W術(shù)會(huì)議和期刊的投稿量劇增。面對(duì)大量良莠不齊的學(xué)術(shù)論文,研究人員又該秉承什么理念來(lái)撰寫(xiě)、評(píng)審相關(guān)領(lǐng)域的學(xué)術(shù)論文?以及在“破四唯”、工業(yè)界研究異軍突起等新形勢(shì)下如何調(diào)整自己的科研工作呢?為此,VALSE Webinar 2020-18期邀請(qǐng)了李宏?yáng)| (澳大利亞國(guó)立大學(xué))、梅濤 (京東)、山世光 (中科院計(jì)算所)、楊明玄Ming-Hsuan Yang (美國(guó)加州大學(xué)Merced分校)、張磊 (微軟公司美國(guó))等五位領(lǐng)域?qū)<?,?strong>歐陽(yáng)萬(wàn)里 (悉尼大學(xué))的主持下,圍繞6個(gè)議題開(kāi)展了深入探討。本文是該次Panel討論的文字實(shí)錄。

01 一萬(wàn)個(gè)人心里有一萬(wàn)個(gè)哈姆雷特,對(duì)于寫(xiě)論文每個(gè)老師都會(huì)有一些自己的觀點(diǎn),各位嘉賓是否有要補(bǔ)充的內(nèi)容?

梅濤:第一個(gè)觀點(diǎn)是養(yǎng)成一個(gè)良好的論文寫(xiě)作習(xí)慣是非常重要的。很多時(shí)候論文不是“寫(xiě)”出來(lái)的,論文的寫(xiě)作應(yīng)該貫穿于日常的生活和工作當(dāng)中,要養(yǎng)成一個(gè)有深度、有系統(tǒng)性思考的習(xí)慣,并且可以隨時(shí)把論文的想法和試驗(yàn)結(jié)果記錄下來(lái),同時(shí)這些也是證明原創(chuàng)的證據(jù),所以對(duì)一個(gè)問(wèn)題的思考的深度決定了論文接收的概率。有些同學(xué)養(yǎng)成一個(gè)不太好的習(xí)慣,臨到deadline之前最后幾個(gè)禮拜才開(kāi)始寫(xiě)作,從實(shí)驗(yàn)結(jié)果來(lái)倒推思考工作的起因和定位,來(lái)思考工作的意義和價(jià)值,這種工作方式我是不太認(rèn)可的,我覺(jué)得某種程度上這是一種“機(jī)會(huì)主義者”,這樣的研究態(tài)度也是不容易走遠(yuǎn)的。所以每個(gè)人都要有自己的research agenda,養(yǎng)成良好的工作和論文習(xí)慣,不要因?yàn)橐粌纱握撐谋痪芫透淖兡愕拈L(zhǎng)期計(jì)劃。

第二個(gè)觀點(diǎn)是寫(xiě)論文是很重要的一件事情,我是把自己的論文當(dāng)做一個(gè)藝術(shù)品精益求精、追求卓越。論文是每一個(gè)作者的門(mén)面,是每個(gè)人的藝術(shù)品,需要你精心打磨;寧愿少發(fā)一篇影響力一般的論文,也要追求有影響力、有洞見(jiàn)的論文。分享給大家一個(gè)經(jīng)驗(yàn),我寫(xiě)論文之前通常要閉門(mén),拋開(kāi)雜念,把自己的工作意義無(wú)窮放大、想到極致,然后再慢慢回收,這樣一旦故事線索出來(lái)了,通常論文就可以一氣呵成。寫(xiě)作要寫(xiě)到一個(gè)什么地步呢?就是在論文的任何地方增加一個(gè)word就覺(jué)得多余,減少一個(gè)word就覺(jué)得語(yǔ)句不通、邏輯有問(wèn)題的這種地步,讓自己嘔心瀝血,把自己逼到一個(gè)絕境,寫(xiě)出來(lái)的作品才是滿意的作品。

最后一個(gè)觀點(diǎn)是論文要極致精煉,要有準(zhǔn)確的定位,闡述要盡量簡(jiǎn)潔,要有一個(gè)比較深度的洞見(jiàn)。寫(xiě)論文的話,一篇論文只要有一個(gè)中心就可以了,超過(guò)一個(gè)中心的話就要寫(xiě)成兩篇論文。如果一句話不能夠總結(jié)出自己的工作,那就回去再好好想想,包括我自己的很多學(xué)生也存在這個(gè)問(wèn)題:老師問(wèn)這個(gè)工作到底是什么,他描述了十幾分鐘都不能夠表達(dá)的很清晰。所以如果不能夠用簡(jiǎn)單的一句話來(lái)表達(dá)你的中心思想,不能夠非常精煉地去講述你的內(nèi)容,那只能說(shuō)明你的思考深度還不夠,凝練的精度還不夠。

李宏?yáng)|:我很少總結(jié)過(guò)寫(xiě)作心得,但我感受最深的一點(diǎn)是:作為作者,同時(shí)也是審稿人,同時(shí)也是community的成員,我們有多重身份,當(dāng)然更多的是讀者,因?yàn)橐x其他人的文章。寫(xiě)一篇文章不包括research的時(shí)間可能只花兩三個(gè)月、三四個(gè)月,但是你要意識(shí)到這篇文章在雜志、會(huì)議要存在10年、20年,很多人都要去讀,從這個(gè)意義上來(lái)說(shuō),寫(xiě)的時(shí)候要非常用心。怎樣讓文章變得更容易被理解,能夠讓讀者受益,在寫(xiě)的時(shí)候應(yīng)該時(shí)刻站在讀者的角度。當(dāng)然,首先可能考慮的是審稿人會(huì)不會(huì)喜歡,會(huì)不會(huì)挑缺點(diǎn),但是長(zhǎng)遠(yuǎn)來(lái)看,更應(yīng)該為這個(gè)論文著想,想一想這個(gè)文章是否真的有啟發(fā)性,是否有影響力。只有每個(gè)人都這樣去想,整個(gè)學(xué)科才會(huì)比較健康地發(fā)展。這算不上什么心得,也許這就是一種秘訣,一種如何把文章寫(xiě)的更有意義的秘訣。

張磊:寫(xiě)論文是科研工作里很重要的一部分,不要把它完全割裂開(kāi),但是也不要把它本末倒置,研究工作還是更重要的。我認(rèn)為每個(gè)人心里應(yīng)該有一個(gè)長(zhǎng)時(shí)間、持續(xù)最想解決的問(wèn)題,所有的工作應(yīng)該是由這個(gè)信念去驅(qū)動(dòng)的,只是在做的過(guò)程中需要把你的工作做一個(gè)完結(jié),做到一定程度把它打一個(gè)包呈現(xiàn)給大家,這實(shí)際上是反映研究工作進(jìn)展的一個(gè)非常好的方式,我認(rèn)為大家寫(xiě)論文的目的應(yīng)該從這種角度出發(fā)。

02 中國(guó)學(xué)生寫(xiě)論文最容易犯的毛病有哪些?

楊明玄:有些學(xué)生對(duì)單詞的真正意思不是很清楚,還有比如說(shuō) culture也不是很清楚,所以有些人認(rèn)為一定要講excellent的詞才會(huì)讓別人印象深刻,其實(shí)不見(jiàn)得需要這樣,用很多不需要的形容詞反而會(huì)讓大家覺(jué)得很反感。只要你研究的結(jié)果、數(shù)字?jǐn)[在那邊,大家就會(huì)去看了。寫(xiě)的時(shí)候要小心,不要講別人不好,哪個(gè)方法fail或doesn’t work都是很刺耳的,可以用不同的表達(dá)方式比較圓滑一些,不要講outperform別人的方法a large margin之類(lèi),不要講很夸張,只要很樸實(shí)地去寫(xiě)論文就可以了。有些字的真正意思要了解,用詞要小心一點(diǎn),不要用錯(cuò)字,基本上那些equation沒(méi)什么問(wèn)題了。另外有些人不注重論文中圖的美感,他覺(jué)得functional夠就可以,但其實(shí)不見(jiàn)得,跟寫(xiě)文字一樣,每件事情都要很小心,甚至文章中的圖,旁邊的邊white space不要太大,這都是一些問(wèn)題。只要你能把它做得更好就做得更好,不要著急,那種很死板的寫(xiě)出來(lái)的文章是很失敗的,我覺(jué)得這個(gè)很重要。

如果講常見(jiàn)錯(cuò)誤的話,我覺(jué)得還是有好些常見(jiàn)的錯(cuò)誤的,在slides的FAQ中,因?yàn)槲颐看胃耐暌院缶桶l(fā)現(xiàn)怎么大家都一樣,怎么出類(lèi)似的錯(cuò)誤呢?還是說(shuō)大家的想法都是很類(lèi)似的?所以后來(lái)我覺(jué)得要整理一下,每個(gè)學(xué)生我要改同樣的錯(cuò)誤我受不了。不過(guò)我基本上覺(jué)得學(xué)生寫(xiě)的還好,只是說(shuō)常見(jiàn)的問(wèn)題就是比較冗長(zhǎng),不是很簡(jiǎn)潔,讀起來(lái)就很無(wú)聊,還有用錯(cuò)字,基本就是這樣的。

李宏?yáng)|:這個(gè)問(wèn)題是中國(guó)學(xué)生寫(xiě)論文最容易犯的毛病,我手下的博士生有中國(guó)學(xué)生也有本地學(xué)生,可能大家都有一個(gè)誤區(qū)覺(jué)得中國(guó)學(xué)生由于語(yǔ)言習(xí)慣的問(wèn)題,英語(yǔ)不是母語(yǔ),在寫(xiě)作上會(huì)吃一些虧。憑我自己的觀察,這個(gè)斷言在十幾年前、二十幾年前剛剛來(lái)的那些中國(guó)學(xué)生是有這樣的特點(diǎn),但是我相信大家也都觀察到最近CVPR的中國(guó)第一作者的比例應(yīng)該已經(jīng)超過(guò)了50%,這是一個(gè)大致的估計(jì)。從錄取的文章上看,已經(jīng)不太容易區(qū)分是中國(guó)作者還是國(guó)外作者寫(xiě)的。而真正是非英語(yǔ)為母語(yǔ)的國(guó)家比如說(shuō)西班牙、意大利的作者,并不見(jiàn)得有英語(yǔ)的優(yōu)勢(shì),這可能是我們以前的一個(gè)誤解。我想表達(dá)的是現(xiàn)在大家的英語(yǔ)寫(xiě)作水平都提高了,反而要真正關(guān)心的是在文章內(nèi)容的邏輯連續(xù)性上。有的時(shí)候尤其是一年級(jí)的中國(guó)的PHD學(xué)生剛剛開(kāi)始,我發(fā)現(xiàn)要花比較大的精力手把手地教學(xué)生,當(dāng)你前面確認(rèn)你要做這個(gè),后面要有驗(yàn)證,要做一個(gè)總結(jié)。這種邏輯思維的習(xí)慣、邏輯推理的習(xí)慣是要重點(diǎn)訓(xùn)練的。當(dāng)然同樣的情況,通過(guò)半年、一年的訓(xùn)練,第二年基本是要學(xué)生放手去寫(xiě)的,因?yàn)樗羞@樣一個(gè)長(zhǎng)進(jìn)。也許國(guó)內(nèi)的培養(yǎng)訓(xùn)練的過(guò)程,尤其在碩士或者高年級(jí)的本科生的階段,這些嚴(yán)謹(jǐn)性、邏輯性要加強(qiáng)一些。當(dāng)然,一般來(lái)說(shuō)我不認(rèn)為中國(guó)學(xué)生有什么要特殊注意的地方,人人都有這個(gè)缺點(diǎn)。

03 做科研和寫(xiě)論文的關(guān)系是什么?為什么要寫(xiě)論文?

張磊:我認(rèn)為寫(xiě)論文是科研工作的一個(gè)組成部分,需要通過(guò)寫(xiě)論文的過(guò)程對(duì)自己的工作有一個(gè)提煉和總結(jié),沒(méi)有論文的話,科研工作很難是非常完整的。我不知道大家有沒(méi)有意識(shí)到很多教科書(shū)里面大家看到的非常簡(jiǎn)單的定理和證明,背后都是由論文一個(gè)一個(gè)串起來(lái)的。在人類(lèi)歷史中,尤其是近二三百年的歷史中,整個(gè)科研的過(guò)程是靠論文的發(fā)表和促進(jìn)交流,一點(diǎn)點(diǎn)把研究結(jié)果累積起來(lái)的,所以論文是非常重要的一個(gè)過(guò)程。

另外我想強(qiáng)調(diào)的一點(diǎn)是寫(xiě)作實(shí)際上是在輸出知識(shí),做實(shí)驗(yàn)也是一種知識(shí)往外的輸出,你只是在腦子里面想有時(shí)候不見(jiàn)得能想清楚。如果說(shuō)我們理解一個(gè)方法或者一個(gè)問(wèn)題,最好的方式就是給別人講一遍,這是能檢驗(yàn)?zāi)闶遣皇菍?duì)這個(gè)問(wèn)題真正理解的方法。論文寫(xiě)出來(lái)也是對(duì)研究工作的一個(gè)考驗(yàn),你認(rèn)為的這個(gè)創(chuàng)新點(diǎn)能不能把它寫(xiě)下來(lái),然后有足夠強(qiáng)的證據(jù)來(lái)支撐它,包括實(shí)驗(yàn),包括邏輯上是不是有足夠強(qiáng)的能夠讓人比較信服的點(diǎn),我覺(jué)得這是非常重要的訓(xùn)練過(guò)程。

梅濤:我非常同意張磊老師的觀點(diǎn),寫(xiě)論文只是科研中的一個(gè)環(huán)節(jié),但是是很重要的一個(gè)環(huán)節(jié)。通常我們講到科研是一個(gè)很長(zhǎng)的鏈條,就像在我們做供應(yīng)鏈一樣,包括你的idea是怎么產(chǎn)生的;idea產(chǎn)生之后要做一系列的調(diào)研,要清楚的知道自己的位置,同時(shí)要做很多的實(shí)驗(yàn)去驗(yàn)證你的想法;然后實(shí)驗(yàn)如果好的話,你要把它完整的、有邏輯的寫(xiě)出來(lái);寫(xiě)完論文之后,如果論文得到發(fā)表,你要去會(huì)議上跟同行交流,吸收更多的觀點(diǎn),認(rèn)識(shí)朋友形成自己的朋友圈,回來(lái)之后再去形成一個(gè)新的idea。這就是一個(gè)閉環(huán),這是一個(gè)很長(zhǎng)的訓(xùn)練過(guò)程,而論文的寫(xiě)作作為其中的一個(gè)環(huán)節(jié)是不可或缺的。論文是我們學(xué)者的一個(gè)產(chǎn)品,當(dāng)然現(xiàn)在我們還有很多其他的產(chǎn)品,比如可以寫(xiě)成technique report,可以arXiv,也可以把自己的code在github上面去publish讓別人在community里面去使用。但不管怎樣,論文是一個(gè)非常好的能夠證明你自己的領(lǐng)域、能夠有自己的identity和標(biāo)簽的作品,通過(guò)論文還可以跟世界上很多頂尖的學(xué)者進(jìn)行交流,也能夠促進(jìn)自己有一個(gè)比較好的影響力,所以寫(xiě)論文是科研非常重要的一個(gè)環(huán)節(jié)。

另外,論文的寫(xiě)作是思想高度凝練的過(guò)程,是培養(yǎng)我們自己系統(tǒng)性思維的過(guò)程,也是深度思考的過(guò)程,所以我認(rèn)為寫(xiě)論文是一個(gè)非常重要的訓(xùn)練過(guò)程。而且,我覺(jué)得很少有人,特別是年輕的學(xué)者和在讀的學(xué)生們,心理上能夠承受一年、兩年甚至好幾年都沒(méi)有成果、都沒(méi)有論文發(fā)表的過(guò)程,所以論文的寫(xiě)作和發(fā)表也是逐漸積累信心的很有必要的東西。

04 在論文日益泛濫、企業(yè)算力和數(shù)據(jù)碾壓高校/科研機(jī)構(gòu)的情況下,高校/科研機(jī)構(gòu)該做出怎樣的調(diào)整?

李宏?yáng)|:的確,工業(yè)界越來(lái)越成為人工智能和計(jì)算機(jī)視覺(jué)研究的主力,并且憑借計(jì)算資源,數(shù)據(jù)和人力的優(yōu)勢(shì),“碾壓”大學(xué)等學(xué)術(shù)機(jī)構(gòu)。對(duì)于這種現(xiàn)象,從學(xué)校方面來(lái)說(shuō),首先應(yīng)該是要承認(rèn)、接受并且擁抱這種變化,實(shí)際上是好事,如果有谷歌和微軟加入,對(duì)整個(gè)學(xué)科的發(fā)展絕對(duì)是一件非常正面健康的事情,事實(shí)也的確這樣,谷歌有更多的TPU、GPU,有更多的數(shù)據(jù),F(xiàn)aceBook有數(shù)據(jù)。學(xué)校一方面要跟企業(yè)合作,一方面要意識(shí)到直接的競(jìng)爭(zhēng)是不可能的,就像打仗一樣,你不可能拿你的弱點(diǎn)跟對(duì)方的長(zhǎng)處去比。但是學(xué)校有學(xué)校的長(zhǎng)處,學(xué)校有更多選擇課題的自由,更多的靈活性。我知道現(xiàn)在大家尤其是學(xué)生發(fā)論文有壓力,但是至少在學(xué)校里如果你兩年不發(fā)文章,你的老板不會(huì)把你怎樣,畢竟博士要讀四五年,通常也沒(méi)有具體明確的文章的數(shù)目,所以在這個(gè)意義上可以充分利用這個(gè)優(yōu)勢(shì)做一些更加長(zhǎng)遠(yuǎn)的計(jì)劃,做一個(gè)2年、3年才能完成的研究。按照我的理解,雖然我沒(méi)有工業(yè)界的經(jīng)歷,但是在工業(yè)界總會(huì)有一個(gè)KPI的壓力,6個(gè)月發(fā)文章,我的學(xué)生在騰訊都有這樣一個(gè)KPI,那有可能是個(gè)缺點(diǎn)。

另外,對(duì)于工業(yè)界來(lái)說(shuō),學(xué)術(shù)界的期望是工業(yè)界要意識(shí)到你們之所以有地方用,是因?yàn)閷W(xué)術(shù)界有一批人能夠坐住冷板凳繼續(xù)做一些長(zhǎng)遠(yuǎn)的研究,給你們指明未來(lái)的方向,要合作又要競(jìng)爭(zhēng),個(gè)人發(fā)揮自己的長(zhǎng)處。

楊明玄:在工業(yè)界里面除了一些小團(tuán)隊(duì)以外,基本上不是以publication為主的,因?yàn)榫退阍诠雀琛aceBook和貝爾實(shí)驗(yàn)室里面,大家都知道只有一小部分focus在publication上面。谷歌里基本上不會(huì)說(shuō)以publication為主,它還是以product為主。當(dāng)然,你做research它不會(huì)反對(duì)你,因?yàn)槟愕膔esource相對(duì)來(lái)講不會(huì)那么多,它們還是希望做product比較多,當(dāng)然谷歌有很多部門(mén),而且研究人員很多,所以整體來(lái)看論文很多。但以個(gè)人角度來(lái)看,不是那么多,所以不同的人做不同的事情。在工業(yè)界很少會(huì)同一個(gè)問(wèn)題做很久,所以沒(méi)有連續(xù)性,這是很直接的東西,大家應(yīng)該都蠻清楚這一點(diǎn)的。當(dāng)然,在學(xué)校里面可以一直做一些問(wèn)題,只要你老板同意的話基本就沒(méi)什么問(wèn)題,但是在工業(yè)界就不太一樣,他們會(huì)集中精力在一些problem上面,不是說(shuō)你要做什么就可以做什么。當(dāng)然,有些題目最好在工業(yè)界做,因?yàn)樾枰罅康腡PU和GPU,所以那些問(wèn)題你在學(xué)校就很難做,比如NAS,不過(guò)在學(xué)校還是有人做,如果你想做的話還是可以想出一些方法來(lái)解決,只是說(shuō)會(huì)比較辛苦一點(diǎn)。我只能看的出來(lái)連續(xù)性,工業(yè)界基本上會(huì)把一個(gè)東西做的很精,它要做到product,所以它有很多detail focus在那邊,publication的話只要有idea,之后很多人會(huì)覺(jué)得說(shuō)engineering work,然后就可以去做,然后就可以move on to next paper,在工業(yè)界的話就很難了。每個(gè)人喜歡做的事情不一樣,所以各有好處。

梅濤:不管我們?cè)谀睦镒鲅芯?,追求的都是同一個(gè)東西,就是impact,這個(gè)impact有很多維度來(lái)衡量。以前在微軟,或是在京東,我們衡量impact同時(shí)有很多角度,通常主要會(huì)看兩個(gè)角度:一個(gè)角度就是你的技術(shù)的長(zhǎng)期領(lǐng)先性,就是說(shuō)如果你claim做基礎(chǔ)研究的話,那么你的研究是不是領(lǐng)先的,是不是在探索一個(gè)非常新的方向,給學(xué)術(shù)界很多的insight,有很多人follow你的工作(也就是pioneering或seminar的工作);第二個(gè)角度是你的研究是否可以在某個(gè)階段能夠成為一個(gè)產(chǎn)品,這個(gè)產(chǎn)品被很多客戶或消費(fèi)者來(lái)使用,進(jìn)而產(chǎn)生了巨大的商業(yè)價(jià)值。我覺(jué)得這兩個(gè)維度是今天特別是在工業(yè)界的一個(gè)研究員是不是做的很好的重要標(biāo)志。當(dāng)然,很多時(shí)候我們也看到一些人可能在兩個(gè)維度上都做的很好,可能走的是中間45度的一個(gè)夾角,這些人是非常幸運(yùn)的。

在工業(yè)界,我們做的研究通常是場(chǎng)景驅(qū)動(dòng)或產(chǎn)品牽引,所以在工業(yè)界我們更關(guān)注的是12個(gè)月、18個(gè)月以后的產(chǎn)出,特別是我們現(xiàn)在做computer vision實(shí)際上是比較偏應(yīng)用的一個(gè)領(lǐng)域。在高校和科研院所,我建議可以更多關(guān)注一些非?;A(chǔ)的、本質(zhì)的研究,在高校通常有很多不同的學(xué)科,因此如果可以做一些跨學(xué)科的、交叉學(xué)科的研究,往往是可以帶來(lái)很大的技術(shù)突破的;而這種研究在公司里是很難去完成的。如果高校里面過(guò)多地去關(guān)注一些應(yīng)用型的研究,就是用自己的短板去跟別人的長(zhǎng)處來(lái)競(jìng)爭(zhēng)了。

另外,通常很多人認(rèn)為在工業(yè)界里面有很多的大型的GPU集群或者計(jì)算資源,其實(shí)我看到的情況反倒不是這樣的,因?yàn)樵诠纠锩嬗玫拿恳慌_(tái)機(jī)器都是有成本核算的。我反而看到很多學(xué)校在做一些超級(jí)計(jì)算中心,這些中心里面有很多非常powerful的機(jī)器和海量存儲(chǔ),這個(gè)反而是在工業(yè)界也非常稀缺的資源。所以我建議研究機(jī)構(gòu)可以多建一些這樣的super computing的中心,并且請(qǐng)專(zhuān)業(yè)的人來(lái)管理運(yùn)營(yíng),這樣老師和學(xué)生們都有很多資源,也是可以在某種程度上“碾壓”工業(yè)界的。

山世光:我認(rèn)為現(xiàn)在學(xué)術(shù)界確實(shí)到了一個(gè)需要反思自己該如何去和工業(yè)界進(jìn)行區(qū)分性研究的時(shí)候了,因?yàn)樵诂F(xiàn)在這樣一個(gè)階段,工業(yè)界也做了非常多的應(yīng)用性甚至是基礎(chǔ)性的研究,但是我認(rèn)為工業(yè)界和學(xué)術(shù)界的導(dǎo)向還是有差異的,工業(yè)界更多的應(yīng)該是應(yīng)用和產(chǎn)品導(dǎo)向的,而學(xué)術(shù)界更多的應(yīng)該是產(chǎn)生新知識(shí)為目標(biāo)的一些工作。所以,對(duì)學(xué)術(shù)界來(lái)說(shuō),不應(yīng)該再去做那種已經(jīng)被證明了的工作,比如堆大數(shù)據(jù)、用大的算力等等,這些可能直覺(jué)去想就會(huì)work,就能夠帶來(lái)效果,這樣一些工作也許就不太適合學(xué)術(shù)界去做,學(xué)術(shù)界應(yīng)該更多地去考慮比如是不是所有的training,包括NAS,都必須要有大規(guī)模的集群才能夠去做?有沒(méi)有更elegant、更加高效的做法?包括我們需要去反思數(shù)據(jù)驅(qū)動(dòng)的方法,這類(lèi)靠錢(qián)、靠資源、靠算力來(lái)解決的問(wèn)題,也許比較適合在工業(yè)界,而對(duì)學(xué)術(shù)界可能需要更多地去類(lèi)比人、去借鑒人腦的一些特征,去尋求能夠媲美大數(shù)據(jù)、大算力的新方法。簡(jiǎn)單總結(jié)一下,我認(rèn)為學(xué)術(shù)界更多的要去做探索新可能、產(chǎn)生新知識(shí)的工作,一方面是利用已有人類(lèi)知識(shí),另一方面是要產(chǎn)生新的insight、新的知識(shí),這樣的一些工作才是學(xué)術(shù)界應(yīng)該更多關(guān)注的。

05 期刊的分區(qū)、影響因子、行業(yè)內(nèi)的口碑認(rèn)可度這三者該如何權(quán)衡利弊呢?比如IJCV今年分區(qū)降到了二區(qū),影響因子也降到了6以內(nèi),但盡管如此,它仍然是CV領(lǐng)域公認(rèn)的期刊,投稿錄用難度也大于其他一些一區(qū)期刊。再比如CVIU,業(yè)界認(rèn)可度也比較高,但是三區(qū)影響因子較低,錄用難度也高于其他三區(qū)期刊甚至一些二區(qū)期刊。像這樣的期刊,和其他的一些期刊相比,是不是投稿的性價(jià)比較低呢?

張磊:這些會(huì)議或者期刊來(lái)說(shuō)影響力因子在做計(jì)算機(jī)視覺(jué)的同行里面基本上都是頂級(jí)的會(huì)議或者期刊,但是這幾年大家傾向于往會(huì)議上發(fā)表,因?yàn)樗械墓ぷ?,希望快速得到反饋,甚至于大家還沒(méi)有發(fā)表,就先把它放到arXiv上,這個(gè)都已經(jīng)成為一個(gè)趨勢(shì)了,大家都在追求快速的迭代。某種情況下來(lái)說(shuō)對(duì)整個(gè)領(lǐng)域的進(jìn)展速度有促進(jìn)作用,應(yīng)該是一個(gè)好的趨勢(shì)。期刊的好處是可以把你的工作更好地去總結(jié),能夠擴(kuò)展,做得更完善。因?yàn)樵谡撐脑u(píng)審中有評(píng)審的限制,沒(méi)有辦法要求你做major revision,在期刊的過(guò)程中實(shí)際上有這樣一個(gè)機(jī)會(huì),可以有一個(gè)完善的過(guò)程,這兩個(gè)有互相補(bǔ)充的作用。但是我認(rèn)為總體能看到這個(gè)趨勢(shì),會(huì)議在超過(guò)期刊的影響力的,尤其是在計(jì)算機(jī)視覺(jué)這個(gè)領(lǐng)域,或者AI有關(guān)的會(huì)議領(lǐng)域,其他領(lǐng)域期刊還是起了很重要的作用。

另一方面這個(gè)會(huì)議之所以變得影響力越來(lái)越大,也是一種研究模式的轉(zhuǎn)變,大家在往deadline driven的這種研究模式發(fā)展的一個(gè)過(guò)程,因?yàn)闀?huì)議總是有一個(gè)確定的截止日期。很多同學(xué)或者一些實(shí)驗(yàn)室,基本上被一個(gè)會(huì)議周期一個(gè)會(huì)議周期去驅(qū)動(dòng)著做,其實(shí)不需要你的導(dǎo)師或者其他的人來(lái)強(qiáng)迫你一定要完成,因?yàn)樗凶约鹤銐虼蟮膭?dòng)力要把這些工作完成的,所以希望第一時(shí)間發(fā)在大家最關(guān)注的會(huì)議上面。

山世光:首先我的感覺(jué)還挺奇怪的,為什么IJCV的影響因子和PAMI的影響因子之間差距會(huì)變得這么大,PAMI的影響因子好像變成了17,IJCV不升反而降到了7以下,我非常懷疑是不是影響因子的計(jì)算方法本身有問(wèn)題,也就是評(píng)價(jià)本身出了問(wèn)題。當(dāng)然,我不完全了解這個(gè)影響因子的計(jì)算方式是什么,好像與期刊過(guò)去一年文章的被引用數(shù)和文章數(shù)等等相關(guān)。如果我沒(méi)記錯(cuò)的話IJCV應(yīng)該是雙月刊,它的文章數(shù)相比PAMI是要少很多的,不知道影響因子是否與這個(gè)有某種隱秘的關(guān)系。從我個(gè)人的感覺(jué)來(lái)說(shuō),IJCV和PAMI沒(méi)有那么大的差距,絕對(duì)不是說(shuō)幾倍的影響力的差距,而應(yīng)該是差不多平起平坐的?,F(xiàn)在出現(xiàn)了這樣的問(wèn)題,我們作為業(yè)內(nèi)人士,應(yīng)該去懷疑或者去質(zhì)疑這個(gè)影響因子的計(jì)算方法本身是不是有問(wèn)題,而不應(yīng)該讓我們的同學(xué)、老師覺(jué)得好像IJCV不行了,我不這么認(rèn)為。

06 在當(dāng)前倡導(dǎo)破四唯的導(dǎo)向下,寫(xiě)論文不重要了嗎?清理“唯論文、唯職稱、唯學(xué)歷、唯獎(jiǎng)項(xiàng)”俗稱“破四唯”。

張磊:寫(xiě)論文本身還是非常重要的一個(gè)過(guò)程,是研究的一個(gè)重要組成部分。破四唯的問(wèn)題比較復(fù)雜,這是一個(gè)評(píng)價(jià)體系的問(wèn)題,怎么去衡量一個(gè)評(píng)價(jià)體系的智慧,這是能不能對(duì)研究人員提供足夠大的空間、提供足夠大的信任情況下,允許大家比較自由地做研究。如果這個(gè)評(píng)價(jià)體系不能改變的話,大家還是要被驅(qū)動(dòng)著發(fā)更多的論文,因?yàn)檎撐氖亲钊菀妆粩?shù)出來(lái)的,而論文的質(zhì)量是在同行每年的peer review,即使是評(píng)oral或poster,你也很難在當(dāng)時(shí)評(píng)價(jià)出來(lái),這更需要同行的智慧去集體的評(píng)價(jià)標(biāo)準(zhǔn),這個(gè)更重要。不是論文不重要,而是這個(gè)評(píng)價(jià)體系,因?yàn)榇蠹叶际窃谝粋€(gè)學(xué)術(shù)團(tuán)體里面,需要一起來(lái)努力做一些改變。

山世光:這確實(shí)是一個(gè)比較復(fù)雜也比較敏感的話題,但是我的基本觀點(diǎn)是論文還是非常重要的。從評(píng)價(jià)體系的角度來(lái)講,關(guān)鍵在于我們不能拿同一套標(biāo)準(zhǔn)去評(píng)價(jià)所有類(lèi)型的科研人員,因?yàn)榇_實(shí)科研人員是有不同屬性的,有些屬性的科研人員可能更多的會(huì)去解決工程技術(shù)問(wèn)題,有些則是從事非常非常偏基礎(chǔ)的研究。不同屬性的科研人員的評(píng)價(jià)標(biāo)準(zhǔn)應(yīng)該是不一樣的,我們應(yīng)該鼓勵(lì)多元化的評(píng)價(jià)方法。有些科研人員能把一個(gè)新的系統(tǒng)創(chuàng)造出來(lái),新的設(shè)備做出來(lái),這對(duì)科學(xué)社區(qū)來(lái)說(shuō)同樣非常重要,也許他的評(píng)價(jià)體系就不應(yīng)該是論文。但是如果是偏基礎(chǔ)研究的話,論文的重要性是顯而易見(jiàn)的。例如,如果沒(méi)有Yann LeCun在80年代末期發(fā)表的convolutional network的工作,沒(méi)有在這之前Fukushima在1980年發(fā)表的Neocognitron,沒(méi)有他們這樣的一些論文的發(fā)表的話,包括沒(méi)有AlexNet在2012年非常清晰的發(fā)表的話,我想我們也不會(huì)有今天這么火熱的AI的第三次熱潮,所以論文肯定是非常非常重要的一個(gè)角度,重要的是我們?cè)趺慈ビ盟鼇?lái)作為一個(gè)評(píng)價(jià)的標(biāo)準(zhǔn)。

當(dāng)然,破四唯對(duì)大家的一個(gè)警示我認(rèn)為是確實(shí)不能簡(jiǎn)單地拿數(shù)量來(lái)作為一個(gè)評(píng)價(jià)的方法,而更多的要去考慮這個(gè)論文的實(shí)質(zhì)影響力。這種影響力可能體現(xiàn)在它被同行關(guān)注的程度,比如被引用的情況;也包括它對(duì)于學(xué)科的完備性所做的貢獻(xiàn),比如它是不是被寫(xiě)到了教科書(shū)里作為一個(gè)基礎(chǔ)的知識(shí)來(lái)被廣泛地采納了;以及它是不是能夠給別的研究者帶來(lái)一些啟示,有更深刻的insight,啟迪了更多的工作,比如說(shuō)Fukushima的Neocognitron和Yann LeCun的convolutional neural network,可能關(guān)注Fukushima的人沒(méi)有那么多,但是他的論文確實(shí)啟發(fā)了Yann LeCun的CNN的提出,本身價(jià)值也是不可估量的。

所以,特別是對(duì)青年學(xué)者和研究生來(lái)說(shuō),可能需要逐漸地去過(guò)渡到一個(gè)代表作文化,從過(guò)去數(shù)多少篇文章到大家去看業(yè)內(nèi)的同行提起來(lái)你會(huì)想起你的什么工作,就像一桿旗一樣插在你的后背上,看你的旗子上寫(xiě)了什么工作,看到你就能想起來(lái)你的這個(gè)工作。我認(rèn)為這樣一個(gè)代表作文化會(huì)越來(lái)越重要。包括像計(jì)算機(jī)視覺(jué)專(zhuān)委會(huì)現(xiàn)在評(píng)新銳獎(jiǎng),評(píng)獎(jiǎng)委員會(huì)也已經(jīng)在貫徹這種文化和評(píng)價(jià)理念,我們希望申請(qǐng)人就講一個(gè)自己的代表作是什么,這個(gè)代表作怎么影響了相應(yīng)的community,如何對(duì)這個(gè)學(xué)科的發(fā)展做出了貢獻(xiàn)等等,從這些維度來(lái)看可能會(huì)變得越來(lái)越重要。

簡(jiǎn)單總結(jié)就是“破四唯”有對(duì)的地方,但是我們要去看它在現(xiàn)實(shí)的評(píng)價(jià)體系里面如何應(yīng)用,包括如何體現(xiàn)多元化,包括我們希望說(shuō)不是唯論文,但是唯優(yōu)秀論文恐怕沒(méi)有錯(cuò)。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞:

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉