開(kāi)源之爭(zhēng):馬斯克起訴OpenAI后宣布開(kāi)源Grok
馬斯克宣布將在本周開(kāi)源xAI的聊天機(jī)器人Grok,并且再度炮轟OpenAI是個(gè)謊言(OpenAI is a lie)。他曾在去年吐槽稱(chēng),OpenAI中的“Open”本意是開(kāi)放源代碼,它是作為非營(yíng)利性開(kāi)放源代碼創(chuàng)建的,而現(xiàn)在它卻成了一個(gè)追求最大利潤(rùn)的封閉源代碼。
本文引用地址:http://2s4d.com/article/202403/456249.htm早在去年11月,馬斯克在參與一場(chǎng)播客時(shí)就公開(kāi)表示,OpenAI的“閉源”行為不可取,xAI的Grok將采取開(kāi)源路線(xiàn)。
馬斯克旗下的AI
2023年7月,馬斯克成立了人工智能公司xAI。同年11月,xAI團(tuán)隊(duì)正式發(fā)布其首個(gè)AI大模型產(chǎn)品Grok。目前的Grok跟此前OpenAI發(fā)布的GPT-3.5形式差不多,但是測(cè)試結(jié)果顯示,它在數(shù)學(xué)、代碼和多學(xué)科知識(shí)評(píng)測(cè)中比GPT-3.5表現(xiàn)得更好。
Grok背靠馬斯克旗下的老牌社交媒體平臺(tái)X(前身為T(mén)witter),使用了X上的大量數(shù)據(jù)進(jìn)行訓(xùn)練,且可以實(shí)時(shí)訪(fǎng)問(wèn)X平臺(tái)的所有信息。馬斯克曾表示這是收購(gòu)?fù)铺氐母郊痈@?,可以用?lái)“喂養(yǎng)”人工智能,接受現(xiàn)實(shí)中人類(lèi)發(fā)言和對(duì)話(huà)信息的訓(xùn)練。另外,他還有來(lái)自特斯拉的導(dǎo)航和視頻數(shù)據(jù),可能將使其團(tuán)隊(duì)開(kāi)發(fā)的聊天機(jī)器人不限于文本生成。
目前并不清楚Grok背后哪些模型會(huì)開(kāi)源,但通常來(lái)說(shuō),發(fā)布開(kāi)源模型有助于社區(qū)展開(kāi)大規(guī)模的測(cè)試和反饋,意味著模型本身的迭代速度也能加快。
當(dāng)然,馬斯克將xAI的大模型開(kāi)源,本身也有可能一種運(yùn)營(yíng)手段。假設(shè)馬斯克“說(shuō)到做到”,外界將得以見(jiàn)到Grok背后的代碼,同時(shí)將其與Meta的Llama 2、法國(guó)的Mistral等開(kāi)源賽道的主要玩家相互比較。
開(kāi)源之爭(zhēng)
今年2月29日,馬斯克在舊金山法院起訴了OpenAI及其首席執(zhí)行官山姆·奧特曼,提出了包括違反合同、違反信托義務(wù)和不公平商業(yè)行為在內(nèi)的索賠。馬斯克稱(chēng),OpenAI選擇了不公開(kāi)其研究和技術(shù),實(shí)際上已成為受微軟控制的閉源子公司,違背了其成立時(shí)的初衷,即為人類(lèi)福祉而非利益開(kāi)發(fā)人工智能。
除了一系列違約指控外,馬斯克還特意要求法院裁定OpenAI恢復(fù)開(kāi)源;OpenAI方面也拿出證據(jù)稱(chēng),馬斯克在郵件中曾認(rèn)可OpenAI的不開(kāi)源決定。
2023年3月,OpenAI發(fā)布了AI語(yǔ)言模型GPT-4,并分享了GPT-4的大量測(cè)試結(jié)果以及一些有趣的演示,但基本上沒(méi)有提供有關(guān)用于訓(xùn)練系統(tǒng)的數(shù)據(jù)、用于創(chuàng)建該系統(tǒng)的特定硬件或方法的信息。當(dāng)時(shí),馬斯克就開(kāi)源問(wèn)題稱(chēng)OpenAI是作為開(kāi)源的非營(yíng)利性公司創(chuàng)立,目的是與谷歌抗衡,而現(xiàn)在卻成為封閉源代碼的公司 —— “如今落入了無(wú)情的壟斷企業(yè)之手”。對(duì)此,奧特曼表示自己沒(méi)有從這家初創(chuàng)公司大舉獲利,他理解馬斯克的批評(píng)是真實(shí)的擔(dān)憂(yōu),但是認(rèn)為他還沒(méi)有完全認(rèn)識(shí)到人工智能安全問(wèn)題的復(fù)雜性。
全球科技巨頭在生成式人工智能的發(fā)展中已經(jīng)分化為開(kāi)源和閉源兩種。
· 開(kāi)源模型即開(kāi)放源代碼,將模型的源代碼和技術(shù)細(xì)節(jié)公開(kāi),允許用戶(hù)根據(jù)自身需要對(duì)模型進(jìn)行使用和修改,目前,Meta的LLaMA、StabilityAI的Stable Diffusion、國(guó)內(nèi)阿里的通義千問(wèn)都屬于開(kāi)源模型。
· 閉源模型則與之相反,不開(kāi)放源代碼和技術(shù)細(xì)節(jié),且不允許用戶(hù)對(duì)模型本身進(jìn)行更改。目前,OpenAI的ChatGPT、谷歌的Gemini、國(guó)內(nèi)的百度文心一言都屬于閉源模型。
總體而言,閉源模式更有利益保護(hù)知識(shí)產(chǎn)權(quán)和商業(yè)利益,讓模型提供方對(duì)模型的研發(fā)和優(yōu)化擁有更多的控制權(quán),確保模型的質(zhì)量和安全;而開(kāi)源模式則讓技術(shù)得以共享,繁榮了開(kāi)發(fā)者生態(tài),能夠吸引眾多人才加入,推動(dòng)大模型加速迭代和創(chuàng)新。
不過(guò)也有研究顯示,相較于開(kāi)源來(lái)說(shuō),閉源模型相對(duì)更成熟、數(shù)據(jù)質(zhì)量更有保障。業(yè)內(nèi)的一個(gè)普遍共識(shí)是,目前閉源大模型的能力和性能總體領(lǐng)先于開(kāi)源大模型。
評(píng)論