超越GPT-4，OpenAI前高管發(fā)布"最強(qiáng)"大模型

作者：時(shí)間：2024-03-05 來(lái)源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

3月5日消息，美國(guó)時(shí)間周一，人工智能初創(chuàng)公司Anthropic發(fā)布了其最新的人工智能模型Claude 3。該公司聲稱，Claude 3是迄今為止他們推出的速度最快、性能最強(qiáng)的模型。Claude 3分為三個(gè)不同的版本：Opus、Sonnet和Haiku。

本文引用地址：http://2s4d.com/article/202403/456016.htm

據(jù)Anthropic介紹，三個(gè)版本中，Opus的能力最為出色，它在多項(xiàng)行業(yè)基準(zhǔn)測(cè)試中的表現(xiàn)超越了OpenAI的GPT-4和谷歌的Gemini Ultra。這些測(cè)試覆蓋了從本科生知識(shí)水平到研究生推理能力和基礎(chǔ)數(shù)學(xué)等領(lǐng)域。

Claude 3首次引入了多模態(tài)支持功能，用戶現(xiàn)在能夠直接上傳照片、圖表、文檔等各種非結(jié)構(gòu)化數(shù)據(jù)，由Claude 3進(jìn)行分析并給出相應(yīng)的答案。

此外，與Opus相比，Sonnet和Haiku兩個(gè)版本雖然參數(shù)規(guī)模更小，但相應(yīng)的使用成本也更低。從本周一起，Opus和Sonnet兩個(gè)版本將在159個(gè)國(guó)家上線，而Haiku版本也將很快推出。盡管Anthropic沒(méi)有公開(kāi)Claude 3的具體訓(xùn)練時(shí)間和成本，但已經(jīng)有包括Airtable和Asana在內(nèi)的多家企業(yè)參與了對(duì)這些模型的A/B測(cè)試。

僅一年前，Anthropic還是一家由前OpenAI研究高管創(chuàng)立的新興人工智能初創(chuàng)企業(yè)，盡管完成了A輪和B輪融資，但其產(chǎn)品尚未引起市場(chǎng)廣泛關(guān)注。然而，短短一年內(nèi)，Anthropic已經(jīng)成為業(yè)界最受矚目的人工智能初創(chuàng)企業(yè)之一，得到了包括谷歌、Salesforce和亞馬遜等科技巨頭的支持。

該公司的產(chǎn)品不僅在企業(yè)領(lǐng)域與ChatGPT等生成式人工智能模型展開(kāi)了激烈競(jìng)爭(zhēng)，而且也逐漸滲透到消費(fèi)者市場(chǎng)。在過(guò)去一年里，這家初創(chuàng)企業(yè)完成了五筆不同的融資，總額約為73億美元。

根據(jù)PitchBook的數(shù)據(jù)，生成式人工智能領(lǐng)域在過(guò)去一年中實(shí)現(xiàn)了爆炸式增長(zhǎng)，2023年的投資額達(dá)到了創(chuàng)紀(jì)錄的291億美元，涉及近700筆交易，同比增長(zhǎng)超過(guò)260%。同時(shí)，生成式人工智能已成為各大公司財(cái)報(bào)電話會(huì)議中的熱門話題。盡管學(xué)者和倫理學(xué)家對(duì)這項(xiàng)技術(shù)可能帶來(lái)的偏見(jiàn)傳播趨勢(shì)表示擔(dān)憂，但生成式人工智能仍然迅速滲透到學(xué)校、在線旅游、醫(yī)療行業(yè)、在線廣告等各個(gè)領(lǐng)域。

在一次采訪中，Anthropic的聯(lián)合創(chuàng)始人丹妮拉·阿莫代伊（Daniela Amodei）透露了公司內(nèi)部的團(tuán)隊(duì)規(guī)模和工作分配情況。她表示，大約60至80人致力于核心人工智能模型的研發(fā)工作，而120至150人從事相關(guān)的技術(shù)工作。在今年7月的一份聲明中，阿莫代伊還提到，在Claude 3模型的最后一輪迭代中，由30至35人組成的團(tuán)隊(duì)直接參與了研發(fā)，而總共約150人提供了支持。

Anthropic表示，Claude 3模型具有強(qiáng)大的處理能力，每次可處理多達(dá)約15萬(wàn)個(gè)單詞，相當(dāng)于一本長(zhǎng)篇小說(shuō)的長(zhǎng)度，例如《白鯨記》（Moby Dick）或《哈利·波特與死亡圣器》（Harry Potter and the Deathly Hallows）。與此相比，先前版本的模型僅能處理7.5萬(wàn)個(gè)單詞。用戶可以將大型數(shù)據(jù)集輸入模型，并請(qǐng)求以備忘錄、信件或故事的形式提供摘要。而與之相比，ChatGPT模型的單次處理能力大約為3000個(gè)單詞。

在風(fēng)險(xiǎn)應(yīng)對(duì)方面，阿莫代伊表示，Claude 3相較于先前版本有了顯著進(jìn)步。她解釋說(shuō)：“在努力打造一種高度無(wú)害的模型時(shí)，Claude 2在某些情況下會(huì)避免給出回答，尤其是當(dāng)有人提起敏感或具有爭(zhēng)議性的話題時(shí)，Claude 2的回答可能會(huì)更為保守?！?/p>

Anthropic還指出，Claude 3對(duì)用戶的提示有著更深入的理解。多模態(tài)功能——即為生成式人工智能添加照片、視頻等輸入選項(xiàng)——無(wú)論是用戶自行上傳還是通過(guò)人工智能模型創(chuàng)建，都迅速成為行業(yè)內(nèi)的一大熱點(diǎn)。

OpenAI首席運(yùn)營(yíng)官布拉德·萊特卡普（Brad Lightcap）在去年的一次采訪中表示：“現(xiàn)實(shí)世界是多模態(tài)的?？紤]到我們?nèi)祟惾绾翁幚硇畔?、與世界互動(dòng)，比如我們所看到、聽(tīng)到以及談?wù)摰膬?nèi)容，可以發(fā)現(xiàn)，這個(gè)世界遠(yuǎn)比單純的文字要豐富得多。因此，僅僅依靠文本和代碼作為單一界面展示模型的功能和作用是遠(yuǎn)遠(yuǎn)不夠的?！?/p>

然而，隨著多模態(tài)技術(shù)和人工智能模型的復(fù)雜性不斷增加，潛在的風(fēng)險(xiǎn)也在逐漸增加。谷歌最近不得不暫停其Gemini聊天機(jī)器人的圖像生成功能，原因是用戶發(fā)現(xiàn)了歷史錯(cuò)誤和令人不安的回答，這些問(wèn)題在社交媒體上迅速傳播開(kāi)來(lái)。

不同于此，Anthropic的Claude 3模型并不生成圖像，而是允許用戶上傳圖像和其他文件進(jìn)行分析。阿莫代伊表示：“沒(méi)有任何模型是完美的。我們始終在努力確保模型在功能和安全性方面達(dá)到最佳平衡。盡管如此，模型在某些情況下仍可能產(chǎn)生不準(zhǔn)確的輸出?！?/p>