博客專欄

EEPW首頁 > 博客 > 朱晨光:一個從不通宵的AI研究員(1)

朱晨光:一個從不通宵的AI研究員(1)

發(fā)布人:數據派THU 時間:2021-05-16 來源:工程師 發(fā)布文章

[ 導語 ]從斯坦福計算機系博士畢業(yè)后第4年,朱晨光便已升為微軟的首席研究經理,管理認知服務研究部門下的知識與語言研究組。而在讀博期間,他的研究方向并不是自然語言處理。

學習、競賽、打乒乓、搞科研、寫書、工作……朱晨光的生活總是同時被其中至少3件事情占據,給人一種很活躍的印象,所以,在聽到他曾與趙薇同臺參加1994年安徽省蕪湖市的春節(jié)聯歡晚會時,筆者也沒有太吃驚:

“那一年是狗年,我演狗,是我們幼兒園的領舞,而她是她們學校(蕪湖師范學校)的領舞?!闭勂鸺亦l(xiāng)蕪湖,朱晨光首先想到的不是三只松鼠,而是蕪湖老鄉(xiāng)、《還珠格格》里的小燕子。

緊接著是出于興趣,他從8歲就開始學習LOGO語言。這是一門面向兒童的編程語言,由3位知名計算機科學家(Wally Feurzeig、Seymour Papert與Cynthia Solomon)在1967年設計而成。

最開始他是用LOGO在電腦上畫圖,敲鍵盤就能畫出一個正方形或圓形,讓他覺得很有趣,于是小學就參加競賽,拿了市區(qū)第一名。自然而然地,小升初進入蕪湖一中時,他被選入學校的信息學競賽隊伍,一路打到市賽、省賽、全國賽,初三就進入NOI國家集訓隊,獲得清華大學預錄取的資格。

朱晨光是一名80后。在他8歲那年(1996年),許多人的家里都還沒有安裝電腦,而他的父親就已堅定地認為計算機在未來一定會有非常大的發(fā)展。果不其然,隨著互聯網浪潮的興起,計算機成為信息時代的技術奠基,“碼農”成為21世紀收入最高的行業(yè)之一。

但朱晨光沒有成為一名“碼農”,而是成了一名“NLPer”,進入了人工智能領域,在Windows的老東家微軟研究自然語言處理(NLP)。但實際上,他在斯坦福大學讀博期間的研究方向并不是NLP,而是交通優(yōu)化。

2016年博士畢業(yè)后,朱晨光入職微軟,先是做自然語言理解(NLU),出了一本NLU相關的入門書籍,叫《機器閱讀理解:算法與實踐》。2019年,他又從NLU轉向研究文本總結與知識圖譜。

“如果你問我未來5年的研究方向是否還會轉變,我的答案是肯定的?!敝斐抗獯鸬?。在他看來,在企業(yè)做研究與在高校做研究的一個區(qū)別就在于:你需要根據公司的業(yè)務來調整自己的研究方向,而市場是瞬息萬變的。

1 源于競賽的自學能力

從交通優(yōu)化到自然語言處理,再到知識圖譜與文本總結,朱晨光認為,自己能夠快速上手新的研究內容,主要歸功于他從小參加信息學競賽所鍛煉出來的自學能力。

“當時上競賽訓練課時,我們并不是老老實實地坐在底下聽老師講課,而是需要自己找學習資料,發(fā)現問題,主動與老師、學生討論?!彼劶?,在這個過程中,競賽選手往往很早就鍛煉了自己主動學習的能力。

比如,進入微軟后,面對人工智能領域的迅速發(fā)展,他很自覺就養(yǎng)成了一個習慣:每天至少閱讀一篇論文,以此來掌握NLP領域的最新知識與研究動態(tài)。既是為了能夠及時調整自己的研究內容、以適應產品的需求,也是為了緊跟潮流、不被時代淘汰。

朱晨光從初一開始就參加信息學競賽。競賽是他在中學時代的主旋律:初中那會是一邊學習一邊搞競賽;到了高中,他直接脫產搞競賽,“我一共就在班里待了半年,上完高一上學期的課我就把所有時間放在競賽上了。但其實我文化課的成績也不錯,在班上待的那半年也拿了一個全班第一名?!?/p>

初三那年(2003年),他第一次參加NOI就獲得銀牌,進入前20名選手組成的國家集訓隊。之后,他又連續(xù)兩年參賽,分別獲得一枚金牌與一枚銀牌。然而,盡管朱晨光連續(xù)3年進入國家集訓隊,卻沒有一次進入IOI國家隊4人名單:2004年NOI,他考了477分,拿了全國第8名;2005年NOI,“前期成績是第一名,但最后一次大考沒有發(fā)揮好,非常遺憾與國家隊擦肩而過?!被貞洰斈?,朱晨光感慨道。

盡管如此,朱晨光也覺得自己非常幸運有機會參加3次集訓,得以認識3批優(yōu)秀的競賽選手。他們中的許多人都被引以為NOI競賽的榜樣,比如樓天城、胡偉棟、鬲融、朱澤園、唐文斌等人。他們至今仍保持緊密聯系,而其中與他關系最好的,要數同屆的朱澤園與唐文斌。

朱澤園來自南京外國語學校,與朱晨光的參賽節(jié)奏完全一致,都是2003年至2005年的信息學國家集訓隊成員。他們同時去了清華,本科時一起組隊參加過ACM/ICPC;大三那會,兩個人都去了微軟亞洲研究院實習,一起發(fā)表了5篇頂會論文;大四申請學校時,兩個人都拿到了去斯坦福讀博的offer,但朱澤園最終選擇了MIT。如今,他們兩個又都在位于美國西雅圖的微軟總部工作。

唐文斌來自紹興市第一中學,高中畢業(yè)那年,朱晨光與他曾一起給NOI出題;上了清華后,他們一起組隊參加了兩岸清華程序設計競賽,代表北京與來自臺灣、香港的隊伍一起比賽,并獲得了第一名。如今,唐文斌在曠視科技擔任聯合創(chuàng)始人與CTO。

1.jpg

圖注:2007年,朱晨光(最左)與唐文斌(中間)、劉賀組隊參加兩岸清華編程競賽

除了自學能力的鍛煉,朱晨光認為,NOI競賽對歷屆選手的影響還體現在計算機基礎與英語學習上。就他個人的經歷來說,NOI競賽內容涉及到數據結構、算法等大學階段才有的計算機課程,所以后來他在清華讀計算機專業(yè)時,覺得學習很輕松,因為“有些課程在高中時已經學過了”。

此外,當時他們備考NOI時,90%以上的題目都是英文的,這對他的英語閱讀與理解能力有很大提升。剛上大一時,他參加GRE考試,滿分1600,他考了1520分;托福滿分120,他考了115。朱晨光因此談道:“我們搞競賽的,英語都不差?!?/p>

但在參加競賽的過程中,對朱晨光產生最大影響的,并不是知識的增長,而是他的競賽教練江濤老師,以及行萬里路所形成的開闊眼界。

朱晨光從初一開始就跟著江濤學習,一直到高三畢業(yè)。“他教了我很多,不僅僅是信息競賽方面的知識,在意志品質、為人處世方面,我也從江濤老師那受益彌久?!彪m然遠在西雅圖,但朱晨光仍與老師保持聯系,逢年過節(jié)都會送上祝福與問候。

江濤是信息學競賽界一號響當當的人物。15歲那年,他在一次造火箭的實驗事故中失去了雙手,但是他非常堅毅,靠自己的努力上了大學、學了計算機,畢業(yè)后分配到蕪湖一中任教。

在他的組織下,蕪湖一中成為歷年IOI國家隊最能打的中學之一。他的學生一共進入國家集訓隊29次,7人代表中國參加IOI比賽、獲得7枚國際獎牌。

江濤老師對科學的熱愛,對自我的要求,以及堅毅的精神,一直影響著朱晨光在知識的道路上不斷求索。從江老師的身上,他認識到,人生路上所遇到的小磨小難,似乎是不值一提的。

而行萬里路,則是競賽地點散布在全國不同城市,因為參賽,他不僅結識了來自五湖四海的朋友,還去了省內省外的許多地方,甚至因為一次偶然的機會,遠赴美國科羅拉多州參加信息學奧林匹克競賽的集訓。

2005年,17歲的朱晨光在網上報名參加了美國信息學奧林匹克競賽,名列前茅,作為國際學生,被主辦方邀請去科羅拉多州的一所大學里與美國的學生一起參加集訓。在這次集訓中,他最終獲得了第二名,達到了進入美國國家隊的水平,但由于他是中國人,所以并未入隊。

“與國內相比,我覺得美國的選拔比較科學,考6次,算綜合成績,萬一哪次發(fā)揮不好,后面還可以再趕上來。國內是一錘定音,有很多偶然性。而且美國的題目比較有趣,可能比國內的要容易些?!?/p>

這次集訓經歷對朱晨光的影響很大。在之前,他對美國沒有感性的認識,以為發(fā)達的美國到處都是高樓大廈、鱗次櫛比;去了美國科羅拉多州之后,他發(fā)現,到處都很干凈,建筑都不高,很開闊,與國內的氛圍很不一樣,這激發(fā)了他以后想到美國學習的念頭。

2 發(fā)表8篇論文的姚班學生

2006年,朱晨光從安徽蕪湖來到首都北京上學,成為清華大學計算機系的一名新生。那一年,與朱晨光一同來到清華園的NOI選手,還有朱澤園、唐文斌、龍凡等10人。

大二那年,久仰于圖靈獎得主姚期智的風采,朱晨光又通過考試選拔,考入了當時由姚期智發(fā)起、成立還不到三年的軟件科學實驗班,也就是傳說中的“姚班”。那一屆,姚班一共有27名同學,除了朱晨光,還有包括唐文斌在內的4名NOI集訓隊成員。

當時,交叉信息研究院還未成立,姚班仍屬于計算機系,朱晨光等人的上課內容一半由姚班老師授予,一半是計算機系的其他課程。在姚班的10門核心課程中,姚期智教授其中的2門,其余課程則由來自微軟亞洲研究院的高級研究人員負責。這對朱晨光起到了很大的影響。

“姚先生在我心中就是大神,成就高山仰止,我非常榮幸能夠做他的學生。”朱晨光感慨。直到現在,他仍然每年都會與姚先生聯系,每當取得好成績時都會與恩師匯報。

朱晨光談到,姚先生非常重視對姚班學生的培養(yǎng),雖然他有很多繁雜事務,但還是堅持每周都親自給姚班的學生上課。在姚先生教授的兩門課(《理論計算機》上下)中,朱晨光考得特別好,第一門滿分100,第二門99分,兩門課都是全班第一。

此外,姚先生一直鼓勵姚班學生盡早接觸科研,與領域里的大師多交流。姚先生每年都會舉辦幾次高級別的計算機會議,邀請國內外知名的學者來交流,并讓姚班的本科生也參加。在“中國計算機科學2020”的論壇現場,朱晨光便有幸與1985年圖靈獎得主、UC Berkeley的教授Richard Karp進行了交流。

2.jpg

圖注:2010年臨近畢業(yè)之際,朱晨光與姚期智合影

除了北京的學術交流活動,姚班還會組織與港澳大學進行交流的冬令營活動。大三那年寒假,朱晨光便與姚班的同學一起去了香港科技大學,待了一個星期,與港科大的學生一起上課、交流,開闊眼界。

姚班的授課教材幾乎是全英文,課程內容前沿,難度也比較高。因為很早就萌發(fā)出國讀書的念頭,出國申請要求高績點,所以朱晨光從大一開始就很用功,在專業(yè)課與英語學習上投入了大量的時間與精力,希望每門課都能拿高分。

最后,功夫不負有心人,他的平均分達到92.2/100,排名全班第2、全級第4,榮獲清華大學優(yōu)秀學術獎學金(授予排名前2%的學生),成為當年清華計算機系唯一拿到斯坦福博士offer的學生。

*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區(qū)

關閉