谷歌發(fā)布多模態(tài)大模型Gemini,性能超GPT-4!
12月7日凌晨,谷歌CEO桑達(dá)爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網(wǎng)聯(lián)名發(fā)文,宣布最新多模態(tài)大模型Gemini 1.0(雙子星)版本正式上線,其性能有望超過OpenAI GPT-4 模型。
Gemini號稱是目前最強(qiáng)大、最通用的模型,第一版Gemini 1.0能夠理解和操作包括文字、圖象、音頻、視頻、代碼在內(nèi)不同類型信息。
Gemini原生設(shè)計(jì)成多模態(tài)模型,一開始就在不同模態(tài)上預(yù)訓(xùn)練,接著通過額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào)、提升性能。目前,Gemini 1.0所受的訓(xùn)練是同時(shí)識別和理解文字、圖象、音頻、視頻、代碼等不同類型信息,并可回答涉及復(fù)雜主題的問題,這也讓Gemini在解釋、推理如數(shù)學(xué)和物理這樣復(fù)雜的問題時(shí)表現(xiàn)出色。
不只如此,Gemini 1.0能夠理解和解釋世界上常用的程序語言如Python、Java、C++和Go,并且產(chǎn)生高品質(zhì)的代碼。值得一提的是,Google DeepMind 2年前推出AI代碼生成系統(tǒng)AlphaCode,現(xiàn)在通過一個(gè)專門版本的Gemini,建立更進(jìn)階的AlphaCode 2,不僅擅長程序設(shè)計(jì),還能處理與數(shù)學(xué)、理論計(jì)算機(jī)科學(xué)相關(guān)的競技程序設(shè)計(jì)問題。
Google DeepMind團(tuán)隊(duì)使用Google自行研發(fā)、用于加速機(jī)器學(xué)習(xí)的TPU v4和v5e(Tensor Processing Unit),有規(guī)模地訓(xùn)練Gemini 1.0。依照模型大小有Ultra、Pro、Nano三種。
其中中端型號的Gemini Pro能夠擊敗GPT-3.5,可擴(kuò)展多種任務(wù);Gemini Nano用于特定任務(wù)和移動(dòng)設(shè)備。
而Gemini Ultra則是規(guī)模最大、功能最強(qiáng)大的模型,專為高度復(fù)雜任務(wù)所設(shè)計(jì),Gemini Nano則是處理裝置上任務(wù)最有效率的模型。
Google DeepMind團(tuán)隊(duì)不斷對Gemini模型進(jìn)行嚴(yán)格測試,從理解自然圖象、音頻、視頻,再到數(shù)學(xué)推理,其中發(fā)現(xiàn)Gemini Ultra在大型語言模型研究和開發(fā)廣泛采用的32項(xiàng)學(xué)術(shù)基準(zhǔn)測試中,有30個(gè)取得領(lǐng)先成績。
其中Gemini Ultra以90%的高得分成為第一個(gè)在MMLU(massive multitask language understanding,大規(guī)模多任務(wù)語言理解)測試?yán)锍饺祟悓<业哪P停?/span>而在新的MMMU基準(zhǔn)測試?yán)镆驳玫?9.4%領(lǐng)先分?jǐn)?shù),兩項(xiàng)測試皆超越OpenAI所開發(fā)的GPT-4模型。
截至目前Google所有AI模型中,Gemini在偏誤、數(shù)據(jù)毒性(toxicity)等方面都接受最全面的安全性評價(jià)。在網(wǎng)絡(luò)攻擊、說服能力、自主性等可能存在風(fēng)險(xiǎn)的領(lǐng)域,Google DeepMind團(tuán)隊(duì)都進(jìn)行最新研究,也運(yùn)用Google Research的對抗測試技巧,在部署Gemini前率先找出關(guān)鍵的安全問題。
Google將在多項(xiàng)產(chǎn)品中導(dǎo)入Gemini,包括軟件方面的Bard、以及有關(guān)硬件Pixel 8 Pro。從12月13日起,開發(fā)者和企業(yè)客戶可以透過Google AI Studio或Google Cloud Vertex AI的Gemini API使用Gemini Pro。Android開發(fā)者也能透過AICore,在開發(fā)作業(yè)中運(yùn)用Gemini Nano。
在ChatGPT推出后Google內(nèi)部宣布「紅色警戒」,從那時(shí)起被認(rèn)為在AI競賽急起直追。Gemini可說是Google多年來一直苦心建立的模型,也被外界視為能一舉挑戰(zhàn)OpenAI的關(guān)鍵利器。接下來我們將在越來越多Google產(chǎn)品看見Gemini身影,及其驅(qū)動(dòng)的強(qiáng)大功能。
編輯:芯智訊-林子
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。