WAIC剪影:AI的未來,關乎星辰大海
“天文學,是像數學一樣的基礎學科,而越是基礎學科,就越難直接應用?!?/p>
“我們沒有想過盈利,這些技術目前來看也不太可能直接應用到其他領域?!?/p>
“不管是優(yōu)圖還是騰訊公司層面,不是做的每件事情都要考慮它的經濟價值或者收入,它代表了一個社會向善的進展或者路徑?!?/p>
如果說人工智能的發(fā)展是人類對于未來的一次探索,那么這場探索之中必然會出現大量的分歧。比如說,人工智能對于人類就業(yè)而言是利是弊?人工智能究竟是先抓產業(yè)還是先抓科研?從實驗室走出來的技術究竟如何落地?應用科學與基礎科學哪一邊才是AI真正的樂園?當這些問題逐一呈現在我們面前時,人工智能的樣貌就會變得更加清晰,可全貌卻會因此而與人漸行漸遠。
不同的路徑會得到不同的答案,我們無法去評價究竟怎樣的路才是未來最合適的路,可我們卻可以回頭看一下起點。AI的初心是否改變過?關于科技向善的目的,我們是否動搖過?關于未來的道路,我們是否斷舍離過?在《蜘蛛俠》里有一句話,叫做“能力越大,責任越大”。這句話與如今AI發(fā)展的格局不謀而合,當一家AI企業(yè)取得的成就越是明朗時,他們對于未來的向往就越是清晰。也正是因為這一原因,我們才在2021世界人工智能大會上分別聽到了來自國家天文臺、騰訊優(yōu)圖的技術專家們,講出來開頭的幾句評語。
7月9日,2021世界人工智能大會“騰訊論壇”在上海世博中心舉辦,聚焦“人工智能與可持續(xù)發(fā)展”主題,騰訊云在人工智能領域的“三大底層AI平臺”正式發(fā)布,成為本屆世界人工智能大會的關注焦點。同時,騰訊與國家天文臺合作的“探星計劃”宣布正式啟動—— 基于優(yōu)圖實驗室計算機視覺技術、騰訊云的計算及存儲能力,幫助中國天眼FAST提升脈沖星搜索效率,并輔助快速射電暴和近密雙星系統中脈沖星搜索,助力天文探索。未來,雙方還將聯合AI+天文成果進展,開展天文科普、科學成果發(fā)布、聯合IP打造等系列活動。
01 九天摘星夢,摘得脈沖星
“天文學,是像數學一樣的基礎學科,而越是基礎學科,就越難直接應用。”中國科學院國家天文臺研究員、FAST首席科學家李菂在接受采訪時發(fā)出了這樣的感慨,盡管他已經在天文學領域深耕多年,但他依然認為這一學科沒有任何實用性,其無法脫離基礎研究的性質,尤其是在同騰訊的合作中,大量的天文學研究對騰訊優(yōu)圖的研發(fā)人員而言,就像是在提一些不太合理的要求。
那么脈沖星究竟是怎樣的存在,為什么我們一定要去做這樣的天文研究呢?李菂表示,中國一直有著世界一流的脈沖星研究團隊,早在宋代中國就有關于超新星爆炸的脈沖星研究記錄。但是中國的優(yōu)勢一直在于脈沖星的理論研究和模型研究,但是在觀測方面始終缺乏設備。脈沖星是高能天體,其有高磁場、高密度、快速旋轉的特征,有包括光學、高能的各種信號。
而這一情況在過去十年來有了根本性變化,我們第一次有了自己的天文衛(wèi)星,有了地面大型的觀測站,有了手機藍牙射頻通訊波段和世界上最大的天線……這與中國過去的基建投入、科學投入和GDP的增長是完全一致的。也因此,國內天文學發(fā)展開始從理論研究的社團發(fā)生轉變,脈沖星的研究甚至完全轉向了觀測研究,并且取得了獨特的領先性,這也可以作為一個天文學的指標。
在2016年建成以前,全球發(fā)現的脈沖星已經接近3000顆,這一領域還誕生了兩位諾貝爾物理學獎,可是中國卻限于觀測設備從未發(fā)現過任何一顆脈沖星??墒窃?016年中國天眼FAST投入應用后,中國僅通過FAST就發(fā)現了超350顆脈沖星,占全球10%。不過,脈沖星的發(fā)現也并非易事,盡管我們有了觀測設備,但甄別脈沖星的輻射信號和物理現象工作依然復雜,而當信號穿過宇宙空間時會有大量的色散現象,最終出現變頻,而通過處理得到特征后繼續(xù)反推星際空間中存在的物質,才可以幫助限定距離并進一步分析相關信息。這其中尤其是信號處理和頻譜分析,工作量大且繁瑣,而在接入了FAST之后數據量更是驚人,再加上天文團隊在計算、編程方面能力的限制,這些點就成為限制天文研究的核心問題。
好在,人工智能的發(fā)展具有很強的普惠性,其不僅僅會對于產業(yè)和生活提供良好的幫助,對于天文學這類的基礎學科一樣可以有立竿見影的效果。“借助AI技術能力,3天就可以處理完原來人工需要1年才能完成的數據工作量?!彬v訊云副總裁、騰訊優(yōu)圖實驗室總經理吳運聲表示,通過騰訊云+AI的輔助,FAST脈沖星搜索效率將得到顯著提升,數據處理效率提升120倍。
02 與數據賽跑,與AI共贏
“我們沒有想過盈利,這些技術目前來看也不太可能直接應用到其他領域?!痹诒粏柤斑@場合作是否對于其他領域應用有所幫助時,騰訊優(yōu)圖實驗室副總經理黃飛躍的答案顯得比較出人意料。我們都知道,實驗室里的技術一旦被拿出來是必然要應用的,但是騰訊優(yōu)圖卻有一點反其道而行之,他們將已經應用十分成熟的技術重新拿回了實驗室,用來幫助天文學的探索,而且目前看也不太可能創(chuàng)造任何的利潤。
在解釋這場看似“荒唐”的合作時,黃飛躍表示,騰訊優(yōu)圖的定位,一方面會做很多的原生自發(fā)的科技探索,尤其是在計算機視覺領域;而另一方面則是很多科技向善的活動,也就是偏科研性的探索。而AI和CV在天文學領域的應用雖然無法直接創(chuàng)造利潤,但技術在其中確實產生了很大的價值,同時對于整個社會而言,進行科技的前沿探索是有著重要意義的。
在騰訊優(yōu)圖接觸到天文臺團隊時發(fā)現,這里絕非是AI的荒漠。李菂的團隊在場景、數據、業(yè)務等多個方面都打造了成熟的機器學習的算法模型。而優(yōu)圖則在此基礎上與天文臺展開合作,首先進行的是數據的預處理。因為天文臺一天采集到的原始數據大約有500T,每周有3000萬張的信號圖片,數據量巨大,這500T數據的轉換及數據提取難度非常高。同時,在做一系列的原始信號處理時,其需要進一步的加速,而在合作之后到現在,其處理加速性能提升了一倍以上,預處理更快。
在信號處理的過程中,優(yōu)圖會用機器學習的方式來尋找疑似樣本,再交給專業(yè)的人員看確認信號來提升召回率和準確率。在合作之后,雙方還然后通過新的算法實現提升,如今其準確率提升也達到了1倍以上,并降低了后期專業(yè)人士的人為篩選的工作量。
AI探星的過程并非不簡單,首先深度學習最核心的是要有海量的已標注數據作為訓練數據,再利用訓練數據來調和整優(yōu)化模型。可是天文領域標注的訓練數據相對偏少,訓練面臨很多困難;其次,同樣的天體信號用不同的望遠鏡和設備觀測,得到的數據和展現形式并不完全一樣。
這兩個難點的突破主要是基于原有的技術積累,比如之前的人臉、人體檢測、工業(yè)檢測等,這使得其優(yōu)圖的模型能夠針對海量缺少標注的數據實現自監(jiān)督的學習,最終形成無標注自監(jiān)督的解決方案,從而減少有標簽數據的依賴性;另外對不同場景,不同的設備拍出來的數據也可以跨域學習的概念,從而將不同的設備數據整合起來統一來幫助訓練。此外,海量的數據帶來的問題不僅僅是訓練的問題,還有存儲和計算。此次合作中,雙方將海量的數據存儲到了騰訊云上,并借用騰訊云的計算資源和優(yōu)圖的技術人員共同完成技術升級。
03 星辰大海,尋找未來
“不管是優(yōu)圖還是騰訊公司層面,不是做的每件事情都要考慮它的經濟價值或者收入,它代表了一個社會向善的進展或者路徑?!眳沁\聲在談及未來時表示,探星計劃在推出時確實有一個難題要解決,而解決難題需要提出新的思路和新的想法,而這種全新領域的探索對于AI技術的發(fā)展確實有一定的幫助,一旦突破了這些問題,就會實現該領域的技術提升。
在探星計劃開展的幾個月里,雙方已經取得了一定的成果,并發(fā)現了一些脈沖星。而且,國內發(fā)現脈沖星的效率要遠高于其他的機構。
當然,對于騰訊優(yōu)圖而言,除了在各個產業(yè)領域沉淀價值,星辰大海也是未來發(fā)展的重要方向。FAST是中國獨有的萬人計劃,在中國已有的基礎設施和大數據規(guī)模之下,FAST每天有大量的數據和宇宙信號待處理,結合騰訊云已有的大數據計算能力能夠得到很好的解決。此外,傳統的搜星算法有很多新的理念和概念,在人工智能里面用到的多模態(tài)技術遷移到探星領域會是非常好的思路。這種交叉學科能夠同時發(fā)揮基礎設施的優(yōu)勢,又有計算資源和算法的優(yōu)勢發(fā)揮,其結合后會得到非常好的成果。
吳運聲表示,AI+云會有兩個方向,一個是助力產業(yè)升級,另一個是助力信息數字化建設。因此,騰訊在過去的幾年中發(fā)布了大量的單點解決方案,并投入了海量的精力幫助客戶構建AI解決方案,實現產業(yè)升級。但這種做法有很多限制,不僅僅是自身資源的問題,還有整體AI能力的規(guī)?;陀绊懥Φ臄U大。因此,在WAIC之上,騰訊打造了自己的基礎設施,開放了三大AI底層平臺-TI ONE、TI Matrix和TI DataTruth,提供包括算法開發(fā)、模型訓練、數據標注和數據處理等一站式開放能力,為企業(yè)或個人開發(fā)者提供一站式的智能化、數據化和移動化服務,滿足客戶降本增效、靈活可用的訴求。
在數字化建設方面,騰訊云對外開放了超過300項的AI原子能力,外部用戶可以直接來訪問,并根據過去的積累,推出了超過50個相對來講比較成熟的解決方案,也是一樣可以直接拿來使用的產品。而這些方式都是騰訊通過過去幾年的發(fā)展,得到的一些沉淀和思考。而這些在整體的思路上,也便如筆者在開頭所提到的,通往AI和未來的路各不相同,但大家終將殊途同歸。
在此次大會上,騰訊公司高級執(zhí)行副總裁、騰訊云與智慧產業(yè)CEO湯道生在開場致辭中表示,人工智能的最大價值是“服務于人”,要讓更多的跨界人才,把AI帶到更多的行業(yè),產生更大的社會價值。筆者也一樣認可這一觀點,AI的發(fā)展無論是產業(yè)支持、生態(tài)支持亦或是走向科研或者天文領域,其最終的結果必然是“服務于人”,可能是當下人的生活,亦可能是未來人的詩與遠方,大海星辰。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
DIY機械鍵盤相關社區(qū):機械鍵盤DIY