國(guó)產(chǎn)開(kāi)源版「ChatGPT插件系統(tǒng)」來(lái)了！豆瓣、搜索一應(yīng)俱全，清華、面壁智能等聯(lián)合發(fā)布

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-05-16 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

【導(dǎo)讀】近期，面壁智能聯(lián)合來(lái)自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個(gè)基于交互式網(wǎng)頁(yè)搜索的問(wèn)答開(kāi)源模型WebCPM，這一創(chuàng)舉填補(bǔ)了國(guó)產(chǎn)大模型該領(lǐng)域的空白。面壁智能自研工具學(xué)習(xí)引擎BMTools也因此被成功實(shí)踐。

最近，一個(gè)被稱(chēng)為「ChatGPT Plugins國(guó)產(chǎn)替代系統(tǒng)」的開(kāi)源項(xiàng)目在GitHub上星標(biāo)猛增。

這個(gè)項(xiàng)目就是BMTools，面壁智能自研的大模型工具學(xué)習(xí)引擎。

項(xiàng)目地址：https://github.com/OpenBMB/BMTools

深耕前沿，快速嵌入大模型工具學(xué)習(xí)

首先，是最重要的問(wèn)題，BMTools到底厲害在哪里？作為基于語(yǔ)言模型的開(kāi)源可擴(kuò)展工具學(xué)習(xí)平臺(tái)，面壁研發(fā)團(tuán)隊(duì)將各種各樣的工具調(diào)用流程都統(tǒng)一到了BMTools框架上，使整個(gè)工具調(diào)用流程標(biāo)準(zhǔn)化、自動(dòng)化。目前，BMTools支持的插件，涵蓋娛樂(lè)，學(xué)術(shù)，生活等多方面，包括douban-film（豆瓣電影）、search（必應(yīng)搜索）、Klarna（購(gòu)物）等。開(kāi)發(fā)者可以通過(guò)BMTools，使用給定的模型（比如ChatGPT、GPT-4）調(diào)用多種多樣的工具接口，以實(shí)現(xiàn)特定功能。此外，BMTools工具包也已集成最近爆火的Auto-GPT與BabyAGI。

那么，這種工具學(xué)習(xí)對(duì)大模型又有何作用？
盡管大模型在很多方面取得了顯著的成果，但在特定領(lǐng)域的任務(wù)上，仍然存在一定的局限性。這些任務(wù)往往需要專(zhuān)業(yè)化的工具或領(lǐng)域知識(shí)才能有效解決。因此，就像智能手機(jī)需要下載App才有更好的使用體驗(yàn)，大模型需要具備調(diào)用各種專(zhuān)業(yè)化工具的能力，這樣才能為現(xiàn)實(shí)世界任務(wù)提供更為全面的支持。大模型新范式工具學(xué)習(xí)（Tool Learning）應(yīng)運(yùn)而生。這一范式的核心在于將專(zhuān)業(yè)工具與基礎(chǔ)模型的優(yōu)勢(shì)相融合，以在問(wèn)題解決方面達(dá)到更高的準(zhǔn)確性、效率和自主性。大模型與外部工具的有機(jī)結(jié)合成功彌補(bǔ)了此前能力的諸多短板，工具學(xué)習(xí)極大地釋放了大模型的潛力。

論文地址：https://arxiv.org/abs/2304.083542023年3月23日，OpenAI宣布推出插件系統(tǒng)（Plugins)，這個(gè)插件的能力就是我們所說(shuō)的工具學(xué)習(xí)。在工具學(xué)習(xí)的加持下，Plugins能夠支持ChatGPT連接瀏覽器、數(shù)學(xué)計(jì)算等外部工具，能力大幅增強(qiáng)。ChatGPT Plugins的出現(xiàn)補(bǔ)充了ChatGPT最后的短板，使其可以支持連網(wǎng)、解決數(shù)學(xué)計(jì)算，被稱(chēng)為OpenAI的「App Store」時(shí)刻。然而直到現(xiàn)在，它僅支持OpenAI Plus用戶(hù)，大多數(shù)開(kāi)發(fā)者仍然無(wú)法使用。

面壁為什么能在ChatGPT Plugins發(fā)布后僅十天就推出BMTools？面壁智能一直潛心研發(fā)大模型全流程高效計(jì)算工具，研發(fā)團(tuán)隊(duì)從2022年就開(kāi)始持續(xù)開(kāi)展工具學(xué)習(xí)新范式的研究，嘗試將現(xiàn)有語(yǔ)言模型與搜索引擎、知識(shí)庫(kù)等工具結(jié)合，取得了較好的實(shí)驗(yàn)效果。團(tuán)隊(duì)還在工具學(xué)習(xí)前沿研究領(lǐng)域進(jìn)行了卓有成效的探索。為滿(mǎn)足眾多開(kāi)發(fā)者對(duì)OpenAI Plugins能力的熱切期盼，在前期積累的基礎(chǔ)上，團(tuán)隊(duì)快速將相關(guān)研究成果工具化，積累整理成工具包BMTools，將工具學(xué)習(xí)嵌入面壁智能大模型能力體系，正式加入OpenBMB大模型工具體系「全家桶」。工具學(xué)習(xí)也是面壁智能繼高效訓(xùn)練、微調(diào)、推理、壓縮套件后推出的又一大力作。

BMTools工具包：https://github.com/OpenBMB/BMTools

引領(lǐng)破壁，首發(fā)聯(lián)網(wǎng)支持中文問(wèn)答模型

近期，面壁智能聯(lián)合來(lái)自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個(gè)基于交互式網(wǎng)頁(yè)搜索的問(wèn)答開(kāi)源模型框架WebCPM，這一創(chuàng)舉填補(bǔ)了國(guó)產(chǎn)大模型該領(lǐng)域的空白。而WebCPM正是BMTools的成功實(shí)踐。目前，WebCPM相關(guān)工作已錄用于自然語(yǔ)言處理頂級(jí)會(huì)議ACL 2023。

WebCPM論文鏈接：https://arxiv.org/abs/2305.06849WebCPM數(shù)據(jù)與代碼鏈接：https://github.com/thunlp/WebCPM可以說(shuō)，自從ChatGPT爆火之后，國(guó)內(nèi)各家各派的大模型雨后春筍般涌現(xiàn)，但大部分模型都沒(méi)有聯(lián)網(wǎng)。而沒(méi)有聯(lián)網(wǎng)的大模型無(wú)法獲取最新的信息，生成的內(nèi)容基于陳舊的數(shù)據(jù)集，存在一定的局限性。WebCPM的特點(diǎn)在于其信息檢索基于交互式網(wǎng)頁(yè)搜索，能夠像人類(lèi)一樣與搜索引擎交互從而收集回答問(wèn)題所需要的事實(shí)性知識(shí)并生成答案。換言之，大模型在聯(lián)網(wǎng)功能的加持下，回答問(wèn)題的實(shí)時(shí)性和準(zhǔn)確性都得到了飛躍式增強(qiáng)。

WebCPM模型框架WebCPM對(duì)標(biāo)的是WebGPT ， WebGPT也正是微軟近期推出的New Bing背后的新一代搜索技術(shù)。同WebGPT一樣，WebCPM克服了傳統(tǒng)的LFQA（ Long-form Question Answering）長(zhǎng)文本開(kāi)放問(wèn)答范式的缺陷：依賴(lài)于非交互式的檢索方法，即僅使用原始問(wèn)題作為查詢(xún)語(yǔ)句來(lái)檢索信息。在WebCPM框架下，模型能夠像人類(lèi)一樣通過(guò)與搜索引擎實(shí)時(shí)交互來(lái)進(jìn)行網(wǎng)頁(yè)搜索而篩選高質(zhì)量信息。不僅如此，遇到復(fù)雜問(wèn)題，模型也像人類(lèi)一般將其分解成多個(gè)子問(wèn)題并依次提問(wèn)。而且，通過(guò)識(shí)別和瀏覽相關(guān)信息，模型還會(huì)逐漸完善對(duì)原問(wèn)題的理解，并不斷查詢(xún)新問(wèn)題來(lái)搜索更多樣的信息。

WebCPM搜索交互界面未來(lái)，面壁智能也將進(jìn)一步促進(jìn)該科研成果的應(yīng)用轉(zhuǎn)化，努力推進(jìn)WebCPM大模型在相應(yīng)領(lǐng)域落地生根。

高屋建瓴，致力打造國(guó)產(chǎn)大模型系統(tǒng)

面壁智能始終努力引領(lǐng)大模型原始創(chuàng)新，致力于構(gòu)建智能時(shí)代大模型基礎(chǔ)設(shè)施和打造國(guó)產(chǎn)大模型系統(tǒng)，以期最終實(shí)現(xiàn)「讓大模型飛入千家萬(wàn)戶(hù)」。面壁智能的成果有目共睹，且獲得了業(yè)界肯定。知乎首席技術(shù)官李大海曾評(píng)價(jià)面壁智能：「面壁智能團(tuán)隊(duì)是國(guó)內(nèi)最早開(kāi)展大規(guī)模語(yǔ)言模型研究的團(tuán)隊(duì)。公司儲(chǔ)備大模型研究和應(yīng)用的全棧技術(shù)能力，包括微調(diào)技術(shù)和加速技術(shù)等，研發(fā)能力處于行業(yè)領(lǐng)先地位?！怪醣硎?，相信面壁智能能成長(zhǎng)為中國(guó)大模型領(lǐng)域基礎(chǔ)設(shè)施核心廠(chǎng)商，為中國(guó)大模型事業(yè)貢獻(xiàn)力量。

面壁智能全景圖依托工具平臺(tái)和大模型庫(kù)，公司推出ModelForce模力大模型系統(tǒng)和CPM企業(yè)級(jí)大模型。基于大模型的AI生產(chǎn)力平臺(tái)ModelForce內(nèi)置大模型訓(xùn)練、微調(diào)、壓縮、推理全流程高效計(jì)算工具體系。平臺(tái)基于大模型少樣本、零樣本通用能力，使用大模型標(biāo)準(zhǔn)化微調(diào)方式、打造零代碼微調(diào)客戶(hù)端，能夠大幅降低AI研發(fā)過(guò)程中的數(shù)據(jù)標(biāo)注成本、算力成本、人力成本。CPM大模型企業(yè)版針對(duì)開(kāi)源版模型進(jìn)行了能力升級(jí)，具有多能力融合、增量微調(diào)靈活適配、多場(chǎng)景應(yīng)用等特點(diǎn)。基于CPM企業(yè)級(jí)大模型與ModelForce大模型系統(tǒng)，面壁智能與知乎的合作訓(xùn)練了「知海圖AI」大模型。「知海圖AI」大模型應(yīng)用到了知乎熱榜，能夠快速進(jìn)行要素抽取、觀(guān)點(diǎn)梳理和內(nèi)容聚合，于4月23日在知乎發(fā)現(xiàn)大會(huì)上發(fā)布。不止于此。事實(shí)上，面壁智能站位高遠(yuǎn)，成功打造了一個(gè)「三位一體」的大模型產(chǎn)學(xué)研生態(tài)格局，通過(guò)整合頂尖高校學(xué)術(shù)研究力量并持續(xù)打造運(yùn)營(yíng)大模型開(kāi)源社區(qū)OpenBMB，面壁智能搭建起業(yè)界需求、算法開(kāi)源和產(chǎn)業(yè)落地三者的閉環(huán)通道，竭力促進(jìn)國(guó)產(chǎn)大模型領(lǐng)域的前沿研究、應(yīng)用研發(fā)和產(chǎn)業(yè)發(fā)展。

OpenBMB開(kāi)源社區(qū)

為建設(shè)國(guó)內(nèi)大模型開(kāi)源生態(tài)貢獻(xiàn)力量，發(fā)布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程開(kāi)源工具包，并且在知乎、B站等平臺(tái)推出了大模型全民公開(kāi)課。

清華大學(xué)計(jì)算機(jī)系自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室（THUNLP）

作為在高校中一騎絕塵的研究力量，成立于上世紀(jì)70年代，是國(guó)內(nèi)開(kāi)展NLP研究最早、深具影響力的科研單位，多名知名學(xué)者和科學(xué)家坐鎮(zhèn)，在語(yǔ)言大模型領(lǐng)域的研究工作十分突出。

面壁智能

致力于大模型在人工智能典型場(chǎng)景與領(lǐng)域的應(yīng)用與落地，CPM大模型是面壁團(tuán)隊(duì)根據(jù)多年的大模型訓(xùn)練經(jīng)驗(yàn)自研的預(yù)訓(xùn)練語(yǔ)言大模型。公司目前已完成數(shù)千萬(wàn)元天使輪融資，并多家知名機(jī)構(gòu)與公司達(dá)成戰(zhàn)略合作。

在努力打造國(guó)產(chǎn)大模型系統(tǒng)的征程中，面壁智能的愿景始終是讓大模型落地賦能更多產(chǎn)業(yè)、惠及更多的企業(yè)和個(gè)人。星火已燎原，我們期待大模型在更多領(lǐng)域釋放潛能，展現(xiàn)令人驚喜的應(yīng)用價(jià)值。

來(lái)源：新智元

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專(zhuān)欄

國(guó)產(chǎn)開(kāi)源版「ChatGPT插件系統(tǒng)」來(lái)了！豆瓣、搜索一應(yīng)俱全，清華、面壁智能等聯(lián)合發(fā)布

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

博客專(zhuān)欄

國(guó)產(chǎn)開(kāi)源版「ChatGPT插件系統(tǒng)」來(lái)了！豆瓣、搜索一應(yīng)俱全，清華、面壁智能等聯(lián)合發(fā)布

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

國(guó)產(chǎn)開(kāi)源版「ChatGPT插件系統(tǒng)」來(lái)了！豆瓣、搜索一應(yīng)俱全，清華、面壁智能等聯(lián)合發(fā)布