AI學(xué)術(shù)浪潮已來(lái),解讀頂尖AI學(xué)術(shù)會(huì)議上中國(guó)科技企業(yè)的角色
同時(shí),KDD在近幾年和中國(guó)的合作也非常密切,除了楊強(qiáng)教授領(lǐng)銜的SIGKDD China,在7月21日,由京東金融承辦的2018 KDD Summer School暨KDD18 Pre-Conference在四川召開(kāi),而在今年3月,京東金融就已經(jīng)參與承辦了國(guó)際數(shù)據(jù)挖掘領(lǐng)域頂級(jí)賽事KDD Cup 2018。
本文引用地址:http://2s4d.com/article/201807/389724.htm圖 | 2018 KDD Summer School活動(dòng)現(xiàn)場(chǎng)的Poster交流環(huán)節(jié)
值得注意的是,今年京東金融也有四篇論文被KDD大會(huì)收錄,作者均來(lái)自京東金融城市計(jì)算事業(yè)部(京東金融于2018年成立的全新一級(jí)事業(yè)部),占京東集團(tuán)論文收錄總數(shù)量的接近一半。
其四篇論文主題分別為《共享單車(chē)動(dòng)態(tài)調(diào)度:時(shí)空數(shù)據(jù)上的強(qiáng)化學(xué)習(xí)模型》、《基于深度分布式融合網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測(cè)》、《利用共享單車(chē)軌跡數(shù)據(jù)的違章停車(chē)檢測(cè)》、《基于對(duì)等和時(shí)間感知的表示學(xué)習(xí)的駕駛行為分析》,都是依托城市計(jì)算這一多學(xué)科融合的新興領(lǐng)域,通過(guò)不斷獲取、整合和分析城市中多種大數(shù)據(jù)來(lái)解決城市所面臨的交通、環(huán)境等挑戰(zhàn)。
頂級(jí)學(xué)術(shù)會(huì)議上的中國(guó)企業(yè)之光
· 做學(xué)術(shù)也要“接地氣”
如前文所述,KDD作為數(shù)據(jù)挖掘和數(shù)據(jù)科學(xué)領(lǐng)域最頂級(jí)的學(xué)術(shù)年會(huì),來(lái)自學(xué)術(shù)界,工業(yè)界和政府部門(mén)的研究人員都希望在KDD上發(fā)表和展示自己的有影響力的工作,因而每年的投稿量都特別大,所以KDD的接收率一直非常低。
據(jù)了解,以KDD的應(yīng)用數(shù)據(jù)科學(xué)論文為例,每篇投稿文章由至少3到4名審稿人評(píng)審及1名相應(yīng)領(lǐng)域的高級(jí)程序委員協(xié)調(diào)討論并推薦,最終由程序委員會(huì)主席決定是否錄取。
所以國(guó)內(nèi)企業(yè)能夠從其中脫穎而出,更是實(shí)屬不易,這背后反映的不僅僅是科研能力的提升,也是企業(yè)解決實(shí)際問(wèn)題的能力。
以每一年KDD的重要競(jìng)賽環(huán)節(jié)KDD CUP為例,其題目范圍基本上圍繞與數(shù)據(jù)科學(xué)相關(guān)的現(xiàn)實(shí)問(wèn)題,許多試題都有很強(qiáng)的應(yīng)用背景。
比如簡(jiǎn)單統(tǒng)計(jì)了歷年了KDD CUP的賽題:
學(xué)術(shù)研究最終還是要落地到解決實(shí)際問(wèn)題,像KDD這樣的頂級(jí)學(xué)術(shù)會(huì)議,也非常注重企業(yè)用數(shù)據(jù)去解決現(xiàn)實(shí)問(wèn)題的能力,這也凸顯了學(xué)術(shù)在“束之高閣”的同時(shí),也不斷地向產(chǎn)業(yè)落地延伸。
從京東金融被收錄的四篇論文也能明顯看出這個(gè)趨勢(shì)。
· 企業(yè)科研的強(qiáng)落地能力
仔細(xì)研讀今年京東金融被收錄的四篇論文,就很好體現(xiàn)了學(xué)術(shù)研究和產(chǎn)業(yè)落地的緊密融合。比如《利用共享單車(chē)軌跡數(shù)據(jù)的違章停車(chē)檢測(cè)》這篇論文,研究背景就是國(guó)內(nèi)共享單車(chē)爆發(fā)所產(chǎn)生的騎行軌跡數(shù)據(jù),給檢測(cè)違章停車(chē)帶來(lái)新機(jī)遇。
論文中提到的基于共享單車(chē)軌跡數(shù)據(jù)的違章停車(chē)檢測(cè)技術(shù)通過(guò)預(yù)處理和檢測(cè)模塊,綜合軌跡清洗、路網(wǎng)匹配、軌跡索引方案等技術(shù),已經(jīng)成功應(yīng)用在部分地區(qū)的違停檢測(cè)上。據(jù)悉,京東金融也已經(jīng)和北京摩拜科技公司完成內(nèi)部部署,并展示給交管部門(mén),為交警進(jìn)行違停管理提供幫助,并為停車(chē)場(chǎng)的增建提供建議。
而在21日舉辦的2018 KDD Summer School上,京東金融副總裁、首席數(shù)據(jù)科學(xué)家、城市計(jì)算事業(yè)部總經(jīng)理鄭宇提到“城市計(jì)算是用大數(shù)據(jù)和人工智能打造未來(lái)城市,具體也就是對(duì)數(shù)據(jù)不斷的采集、管理、分析、挖掘,來(lái)解決城市的痛點(diǎn),比如交通擁堵和環(huán)境污染。從城市的規(guī)劃、運(yùn)維到預(yù)測(cè),形成一個(gè)閉環(huán),推動(dòng)城市可持續(xù)發(fā)展。”
圖 | 京東金融副總裁、首席數(shù)據(jù)科學(xué)家、城市計(jì)算事業(yè)部總經(jīng)理鄭宇
這也是學(xué)術(shù)研究到產(chǎn)業(yè)落地的完美閉環(huán)。
從企業(yè)的角度來(lái)看,在推動(dòng)城市可持續(xù)發(fā)展中,一方面是企業(yè)對(duì)經(jīng)濟(jì)利益的追求,更重要的也是對(duì)社會(huì)利益的重視。
以當(dāng)前嚴(yán)重的空氣污染問(wèn)題為例,預(yù)測(cè)未來(lái)空氣質(zhì)量不僅可以幫政府更好地做出決策,也可以幫助人們規(guī)劃未來(lái)出行計(jì)劃。
在KDD收錄的四篇論文中,京東金融就提出了一種基于深度學(xué)習(xí)的預(yù)測(cè)方法DeepAir來(lái)預(yù)測(cè)未來(lái)48小時(shí)細(xì)粒度空氣質(zhì)量。其采用深度分布式架構(gòu)來(lái)融合異構(gòu)數(shù)據(jù),對(duì)所有影響空氣質(zhì)量的直接和間接因素進(jìn)行建模。對(duì)比于傳統(tǒng)預(yù)測(cè)模型的結(jié)果(2014.10.1-2016.12.30),DeepAir的模型準(zhǔn)確率比它們高22%。
當(dāng)然,這也是現(xiàn)在科技企業(yè)做學(xué)術(shù)研究的一大趨勢(shì)——體現(xiàn)他們的強(qiáng)科研落地能力。比如今年騰訊旗下醫(yī)療AI實(shí)驗(yàn)室共有3篇論文分別被KDD 2018、SIGIR 2018、COLING 2018三個(gè)國(guó)際頂尖學(xué)術(shù)會(huì)議收錄,其論文的主要研究方向?yàn)獒t(yī)療知識(shí)圖譜中實(shí)體關(guān)系的發(fā)現(xiàn)和應(yīng)用,就是通過(guò)大數(shù)據(jù)以及知識(shí)圖譜,輔助臨床決策,賦能基于AI的醫(yī)療產(chǎn)品。
· 學(xué)術(shù)研究,決定了企業(yè)的另一面
越來(lái)越多的企業(yè)注重技術(shù)研發(fā)以及學(xué)術(shù)研究,也表現(xiàn)了大公司在擴(kuò)大商業(yè)版圖的同時(shí),非常注重技術(shù)的深耕和持續(xù)研究等等,這是一個(gè)雙向互利的過(guò)程。
此前馬斯克曾發(fā)表過(guò)90%的學(xué)術(shù)論文無(wú)用的言論,一石激起千層浪。誠(chéng)然,在一些商人眼里,寫(xiě)論文是燒錢(qián)的事情,沒(méi)有什么價(jià)值。但是如業(yè)內(nèi)專(zhuān)家所說(shuō),一篇論文,經(jīng)過(guò)同行評(píng)議、修改、發(fā)表出來(lái)。這個(gè)過(guò)程本身就是一種價(jià)值,光看最后的論文,當(dāng)然90%賺不到錢(qián)。但也是為研究從量變到質(zhì)變添了一塊磚。
同樣,就像浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長(zhǎng)王萬(wàn)良所說(shuō),要明確認(rèn)識(shí)企業(yè)做論文的正確作用,“論文不是設(shè)計(jì)圖紙,許多只是實(shí)用技術(shù)的前期研究中間結(jié)果,企業(yè)的研發(fā)和高校科研院所的研發(fā)是不同的研發(fā)階段,難以互相取代。許多事情關(guān)鍵是正確認(rèn)識(shí)。”
而企業(yè)在頂級(jí)學(xué)術(shù)會(huì)議中扮演著越來(lái)越關(guān)鍵的角色,同樣以京東金融為例,其城市計(jì)算事業(yè)部的一篇論文此前也被人工智能領(lǐng)域國(guó)際頂級(jí)學(xué)術(shù)會(huì)議IJCAI2018錄用。
頂級(jí)的學(xué)術(shù)會(huì)議不僅僅是學(xué)術(shù)界展示自身學(xué)術(shù)實(shí)力的機(jī)會(huì),也正在成為大公司展現(xiàn)科研實(shí)力的重要舞臺(tái)。
以深度學(xué)習(xí)為例,在平臺(tái)、算力和數(shù)據(jù)系統(tǒng)的基礎(chǔ)之上,無(wú)論高校還是企業(yè)的實(shí)驗(yàn)室,做出來(lái)的研發(fā)成果近乎可以在產(chǎn)業(yè)端即插即用,這也是為什么大公司需要在AI時(shí)代參加這些學(xué)術(shù)會(huì)議發(fā)表論文、以及技術(shù)比賽。
據(jù)了解,在科研成果的應(yīng)用轉(zhuǎn)化方面,京東金融城市計(jì)算事業(yè)部就已經(jīng)為國(guó)家發(fā)改委城市和小城鎮(zhèn)改革發(fā)展中心、環(huán)保部、水利部、交通部等多個(gè)中央部委提供科技服務(wù),并與國(guó)家能源集團(tuán)、中國(guó)聯(lián)通、北控集團(tuán)、摩拜、鏈家等企業(yè)開(kāi)展深度合作。
最后
在英國(guó)政府與圖靈研究院發(fā)布的《2017AI產(chǎn)業(yè)報(bào)告》中,就指出過(guò)這樣一個(gè)問(wèn)題:今天整個(gè)AI產(chǎn)業(yè)中,最急切需要的,是學(xué)術(shù)與產(chǎn)業(yè)多個(gè)端口之間的流通與聚合能力。
無(wú)論是KDD,還是IJCAI,亦或是其他AI頂級(jí)學(xué)術(shù)會(huì)議上,國(guó)內(nèi)高校和企業(yè)的身影越來(lái)越多,一方面這是中國(guó)AI學(xué)術(shù)能力的體現(xiàn),另一方面也凸顯了在學(xué)術(shù)和科研上,大家都在一步步穩(wěn)扎穩(wěn)打,共同助推產(chǎn)學(xué)研一體化,用AI解放生產(chǎn)力、創(chuàng)造更多的社會(huì)價(jià)值。
評(píng)論