【導(dǎo)讀】近期,面壁智能聯(lián)合來自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個基于交互式網(wǎng)頁搜索的問答開源模型WebCPM,這一創(chuàng)舉填補(bǔ)了國產(chǎn)大模型該領(lǐng)域的空白。面壁智能自研工具學(xué)習(xí)引擎BMTools也因此被成功實踐。
最近,一個被稱為「ChatGPT Plugins國產(chǎn)替代系統(tǒng)」的開源項目在GitHub上星標(biāo)猛增。
這個項目就是BMTools,面壁智能自研的大模型工具學(xué)習(xí)引擎。
項目地址:https://github.com/OpenBMB/BMTools
深耕前沿,快速嵌入大模型工具學(xué)習(xí)
首先,是最重要的問題,BMTools到底厲害在哪里?作為基于語言模型的開源可擴(kuò)展工具學(xué)習(xí)平臺,面壁研發(fā)團(tuán)隊將各種各樣的工具調(diào)用流程都統(tǒng)一到了BMTools框架上,使整個工具調(diào)用流程標(biāo)準(zhǔn)化、自動化。目前,BMTools支持的插件,涵蓋娛樂,學(xué)術(shù),生活等多方面,包括douban-film(豆瓣電影)、search(必應(yīng)搜索)、Klarna(購物)等。開發(fā)者可以通過BMTools,使用給定的模型(比如ChatGPT、GPT-4)調(diào)用多種多樣的工具接口,以實現(xiàn)特定功能。此外,BMTools工具包也已集成最近爆火的Auto-GPT與BabyAGI。那么,這種工具學(xué)習(xí)對大模型又有何作用?
盡管大模型在很多方面取得了顯著的成果,但在特定領(lǐng)域的任務(wù)上,仍然存在一定的局限性。這些任務(wù)往往需要專業(yè)化的工具或領(lǐng)域知識才能有效解決。因此,就像智能手機(jī)需要下載App才有更好的使用體驗,大模型需要具備調(diào)用各種專業(yè)化工具的能力,這樣才能為現(xiàn)實世界任務(wù)提供更為全面的支持。大模型新范式工具學(xué)習(xí)(Tool Learning)應(yīng)運(yùn)而生。這一范式的核心在于將專業(yè)工具與基礎(chǔ)模型的優(yōu)勢相融合,以在問題解決方面達(dá)到更高的準(zhǔn)確性、效率和自主性。大模型與外部工具的有機(jī)結(jié)合成功彌補(bǔ)了此前能力的諸多短板,工具學(xué)習(xí)極大地釋放了大模型的潛力。
論文地址:https://arxiv.org/abs/2304.083542023年3月23日,OpenAI宣布推出插件系統(tǒng)(Plugins),這個插件的能力就是我們所說的工具學(xué)習(xí)。在工具學(xué)習(xí)的加持下,Plugins能夠支持ChatGPT連接瀏覽器、數(shù)學(xué)計算等外部工具,能力大幅增強(qiáng)。ChatGPT Plugins的出現(xiàn)補(bǔ)充了ChatGPT最后的短板,使其可以支持連網(wǎng)、解決數(shù)學(xué)計算,被稱為OpenAI的「App Store」時刻。然而直到現(xiàn)在,它僅支持OpenAI Plus用戶,大多數(shù)開發(fā)者仍然無法使用。面壁為什么能在ChatGPT Plugins發(fā)布后僅十天就推出BMTools?面壁智能一直潛心研發(fā)大模型全流程高效計算工具,研發(fā)團(tuán)隊從2022年就開始持續(xù)開展工具學(xué)習(xí)新范式的研究,嘗試將現(xiàn)有語言模型與搜索引擎、知識庫等工具結(jié)合,取得了較好的實驗效果。團(tuán)隊還在工具學(xué)習(xí)前沿研究領(lǐng)域進(jìn)行了卓有成效的探索。為滿足眾多開發(fā)者對OpenAI Plugins能力的熱切期盼,在前期積累的基礎(chǔ)上,團(tuán)隊快速將相關(guān)研究成果工具化,積累整理成工具包BMTools,將工具學(xué)習(xí)嵌入面壁智能大模型能力體系,正式加入OpenBMB大模型工具體系「全家桶」。工具學(xué)習(xí)也是面壁智能繼高效訓(xùn)練、微調(diào)、推理、壓縮套件后推出的又一大力作。BMTools工具包 :https://github.com/OpenBMB/BMTools引領(lǐng)破壁,首發(fā)聯(lián)網(wǎng)支持中文問答模型
近期,面壁智能聯(lián)合來自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個基于交互式網(wǎng)頁搜索的問答開源模型框架WebCPM,這一創(chuàng)舉填補(bǔ)了國產(chǎn)大模型該領(lǐng)域的空白。而WebCPM正是BMTools的成功實踐。目前,WebCPM相關(guān)工作已錄用于自然語言處理頂級會議ACL 2023。WebCPM論文鏈接:https://arxiv.org/abs/2305.06849WebCPM數(shù)據(jù)與代碼鏈接:https://github.com/thunlp/WebCPM可以說,自從ChatGPT爆火之后,國內(nèi)各家各派的大模型雨后春筍般涌現(xiàn),但大部分模型都沒有聯(lián)網(wǎng)。而沒有聯(lián)網(wǎng)的大模型無法獲取最新的信息,生成的內(nèi)容基于陳舊的數(shù)據(jù)集,存在一定的局限性。WebCPM的特點(diǎn)在于其信息檢索基于交互式網(wǎng)頁搜索,能夠像人類一樣與搜索引擎交互從而收集回答問題所需要的事實性知識并生成答案。換言之,大模型在聯(lián)網(wǎng)功能的加持下,回答問題的實時性和準(zhǔn)確性都得到了飛躍式增強(qiáng)。WebCPM模型框架WebCPM對標(biāo)的是WebGPT , WebGPT也正是微軟近期推出的New Bing背后的新一代搜索技術(shù)。同WebGPT一樣,WebCPM克服了傳統(tǒng)的LFQA( Long-form Question Answering)長文本開放問答范式的缺陷:依賴于非交互式的檢索方法,即僅使用原始問題作為查詢語句來檢索信息。在WebCPM框架下,模型能夠像人類一樣通過與搜索引擎實時交互來進(jìn)行網(wǎng)頁搜索而篩選高質(zhì)量信息。不僅如此,遇到復(fù)雜問題,模型也像人類一般將其分解成多個子問題并依次提問。而且,通過識別和瀏覽相關(guān)信息,模型還會逐漸完善對原問題的理解,并不斷查詢新問題來搜索更多樣的信息。
WebCPM搜索交互界面未來,面壁智能也將進(jìn)一步促進(jìn)該科研成果的應(yīng)用轉(zhuǎn)化,努力推進(jìn)WebCPM大模型在相應(yīng)領(lǐng)域落地生根。高屋建瓴,致力打造國產(chǎn)大模型系統(tǒng)
面壁智能始終努力引領(lǐng)大模型原始創(chuàng)新,致力于構(gòu)建智能時代大模型基礎(chǔ)設(shè)施和打造國產(chǎn)大模型系統(tǒng),以期最終實現(xiàn)「讓大模型飛入千家萬戶」。面壁智能的成果有目共睹,且獲得了業(yè)界肯定。知乎首席技術(shù)官李大海曾評價面壁智能:「面壁智能團(tuán)隊是國內(nèi)最早開展大規(guī)模語言模型研究的團(tuán)隊。公司儲備大模型研究和應(yīng)用的全棧技術(shù)能力,包括微調(diào)技術(shù)和加速技術(shù)等,研發(fā)能力處于行業(yè)領(lǐng)先地位。」知乎表示,相信面壁智能能成長為中國大模型領(lǐng)域基礎(chǔ)設(shè)施核心廠商,為中國大模型事業(yè)貢獻(xiàn)力量。
面壁智能全景圖依托工具平臺和大模型庫,公司推出ModelForce模力大模型系統(tǒng)和CPM企業(yè)級大模型。基于大模型的AI生產(chǎn)力平臺ModelForce內(nèi)置大模型訓(xùn)練、微調(diào)、壓縮、推理全流程高效計算工具體系。平臺基于大模型少樣本、零樣本通用能力,使用大模型標(biāo)準(zhǔn)化微調(diào)方式、打造零代碼微調(diào)客戶端,能夠大幅降低AI研發(fā)過程中的數(shù)據(jù)標(biāo)注成本、算力成本、人力成本。CPM大模型企業(yè)版針對開源版模型進(jìn)行了能力升級,具有多能力融合、增量微調(diào)靈活適配、多場景應(yīng)用等特點(diǎn)。基于CPM企業(yè)級大模型與ModelForce大模型系統(tǒng),面壁智能與知乎的合作訓(xùn)練了「知海圖AI」大模型。「知海圖AI」大模型應(yīng)用到了知乎熱榜,能夠快速進(jìn)行要素抽取、觀點(diǎn)梳理和內(nèi)容聚合,于4月23日在知乎發(fā)現(xiàn)大會上發(fā)布。不止于此。事實上,面壁智能站位高遠(yuǎn),成功打造了一個「三位一體」的大模型產(chǎn)學(xué)研生態(tài)格局,通過整合頂尖高校學(xué)術(shù)研究力量并持續(xù)打造運(yùn)營大模型開源社區(qū)OpenBMB,面壁智能搭建起業(yè)界需求、算法開源和產(chǎn)業(yè)落地三者的閉環(huán)通道,竭力促進(jìn)國產(chǎn)大模型領(lǐng)域的前沿研究、應(yīng)用研發(fā)和產(chǎn)業(yè)發(fā)展。為建設(shè)國內(nèi)大模型開源生態(tài)貢獻(xiàn)力量,發(fā)布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程開源工具包,并且在知乎、B站等平臺推出了大模型全民公開課。
作為在高校中一騎絕塵的研究力量,成立于上世紀(jì)70年代,是國內(nèi)開展NLP研究最早、深具影響力的科研單位,多名知名學(xué)者和科學(xué)家坐鎮(zhèn),在語言大模型領(lǐng)域的研究工作十分突出。
致力于大模型在人工智能典型場景與領(lǐng)域的應(yīng)用與落地,CPM大模型是面壁團(tuán)隊根據(jù)多年的大模型訓(xùn)練經(jīng)驗自研的預(yù)訓(xùn)練語言大模型。公司目前已完成數(shù)千萬元天使輪融資,并多家知名機(jī)構(gòu)與公司達(dá)成戰(zhàn)略合作。
在努力打造國產(chǎn)大模型系統(tǒng)的征程中,面壁智能的愿景始終是讓大模型落地賦能更多產(chǎn)業(yè)、惠及更多的企業(yè)和個人。星火已燎原,我們期待大模型在更多領(lǐng)域釋放潛能,展現(xiàn)令人驚喜的應(yīng)用價值。
來源:新智元