谷歌發(fā)布多模態(tài)大模型Gemini，性能超GPT-4！

發(fā)布人：芯智訊時(shí)間：2023-12-16 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

12月7日凌晨，谷歌CEO桑達(dá)爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網(wǎng)聯(lián)名發(fā)文，宣布最新多模態(tài)大模型Gemini 1.0（雙子星）版本正式上線，其性能有望超過(guò)OpenAI GPT-4 模型。

Gemini號(hào)稱是目前最強(qiáng)大、最通用的模型，第一版Gemini 1.0能夠理解和操作包括文字、圖象、音頻、視頻、代碼在內(nèi)不同類型信息。

Gemini原生設(shè)計(jì)成多模態(tài)模型，一開始就在不同模態(tài)上預(yù)訓(xùn)練，接著通過(guò)額外的多模態(tài)數(shù)據(jù)進(jìn)行微調(diào)、提升性能。目前，Gemini 1.0所受的訓(xùn)練是同時(shí)識(shí)別和理解文字、圖象、音頻、視頻、代碼等不同類型信息，并可回答涉及復(fù)雜主題的問(wèn)題，這也讓Gemini在解釋、推理如數(shù)學(xué)和物理這樣復(fù)雜的問(wèn)題時(shí)表現(xiàn)出色。

不只如此，Gemini 1.0能夠理解和解釋世界上常用的程序語(yǔ)言如Python、Java、C++和Go，并且產(chǎn)生高品質(zhì)的代碼。值得一提的是，Google DeepMind 2年前推出AI代碼生成系統(tǒng)AlphaCode，現(xiàn)在通過(guò)一個(gè)專門版本的Gemini，建立更進(jìn)階的AlphaCode 2，不僅擅長(zhǎng)程序設(shè)計(jì)，還能處理與數(shù)學(xué)、理論計(jì)算機(jī)科學(xué)相關(guān)的競(jìng)技程序設(shè)計(jì)問(wèn)題。

Google DeepMind團(tuán)隊(duì)使用Google自行研發(fā)、用于加速機(jī)器學(xué)習(xí)的TPU v4和v5e（Tensor Processing Unit），有規(guī)模地訓(xùn)練Gemini 1.0。依照模型大小有Ultra、Pro、Nano三種。

其中中端型號(hào)的Gemini Pro能夠擊敗GPT-3.5，可擴(kuò)展多種任務(wù)；Gemini Nano用于特定任務(wù)和移動(dòng)設(shè)備。

而Gemini Ultra則是規(guī)模最大、功能最強(qiáng)大的模型，專為高度復(fù)雜任務(wù)所設(shè)計(jì)，Gemini Nano則是處理裝置上任務(wù)最有效率的模型。

Google DeepMind團(tuán)隊(duì)不斷對(duì)Gemini模型進(jìn)行嚴(yán)格測(cè)試，從理解自然圖象、音頻、視頻，再到數(shù)學(xué)推理，其中發(fā)現(xiàn)Gemini Ultra在大型語(yǔ)言模型研究和開發(fā)廣泛采用的32項(xiàng)學(xué)術(shù)基準(zhǔn)測(cè)試中，有30個(gè)取得領(lǐng)先成績(jī)。

其中Gemini Ultra以90%的高得分成為第一個(gè)在MMLU（massive multitask language understanding，大規(guī)模多任務(wù)語(yǔ)言理解）測(cè)試?yán)锍饺祟悓＜业哪Ｐ停?/span>而在新的MMMU基準(zhǔn)測(cè)試?yán)镆驳玫?9.4%領(lǐng)先分?jǐn)?shù)，兩項(xiàng)測(cè)試皆超越OpenAI所開發(fā)的GPT-4模型。

截至目前Google所有AI模型中，Gemini在偏誤、數(shù)據(jù)毒性（toxicity）等方面都接受最全面的安全性評(píng)價(jià)。在網(wǎng)絡(luò)攻擊、說(shuō)服能力、自主性等可能存在風(fēng)險(xiǎn)的領(lǐng)域，Google DeepMind團(tuán)隊(duì)都進(jìn)行最新研究，也運(yùn)用Google Research的對(duì)抗測(cè)試技巧，在部署Gemini前率先找出關(guān)鍵的安全問(wèn)題。

Google將在多項(xiàng)產(chǎn)品中導(dǎo)入Gemini，包括軟件方面的Bard、以及有關(guān)硬件Pixel 8 Pro。從12月13日起，開發(fā)者和企業(yè)客戶可以透過(guò)Google AI Studio或Google Cloud Vertex AI的Gemini API使用Gemini Pro。Android開發(fā)者也能透過(guò)AICore，在開發(fā)作業(yè)中運(yùn)用Gemini Nano。

在ChatGPT推出后Google內(nèi)部宣布「紅色警戒」，從那時(shí)起被認(rèn)為在AI競(jìng)賽急起直追。Gemini可說(shuō)是Google多年來(lái)一直苦心建立的模型，也被外界視為能一舉挑戰(zhàn)OpenAI的關(guān)鍵利器。接下來(lái)我們將在越來(lái)越多Google產(chǎn)品看見Gemini身影，及其驅(qū)動(dòng)的強(qiáng)大功能。

編輯：芯智訊-林子

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

谷歌發(fā)布多模態(tài)大模型Gemini，性能超GPT-4！

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

谷歌發(fā)布多模態(tài)大模型Gemini，性能超GPT-4！

相關(guān)推薦

技術(shù)專區(qū)

谷歌發(fā)布多模態(tài)大模型Gemini，性能超GPT-4！