Stable Diffusion公司開源大語(yǔ)言模型StableLM,網(wǎng)友:不是我想要的!
眾所周知,去年初創(chuàng)公司 Stability AI 發(fā)布的 AI 圖像生成工具 Stable Diffusion,成為一種革命性的圖像模型,也使 AI“文生圖”實(shí)現(xiàn)了飛速的發(fā)展。
滿載著大家對(duì)其“不再局限于開發(fā)圖像生成”和“開源”的期待,在 4 月 20 日, Stability AI 宣布推出開源大型語(yǔ)言模型(LLM)—— StableLM。
(圖源:Stability AI 官方博客截圖)
小參數(shù)大訓(xùn)練,開源備受熱捧
據(jù) Stability AI 官方報(bào)道,StableLM 模型還處于 Alpha 階段,參數(shù)比較少,只有 30 億和 70 億個(gè)參數(shù),之后還會(huì)推出有 150 億到 650 億參數(shù)的模型。作為一個(gè)類 ChatGPT 模型,StableLM 模型可以生成文本和代碼,并為一系列下游應(yīng)用程序提供動(dòng)力,能為小而高效的模型通過(guò)適當(dāng)?shù)呐嘤?xùn)提供高性能。
然而,與 ChatGPT、Bard 等模型相比,StableLM 最大的“優(yōu)勢(shì)”莫過(guò)于可供每一個(gè)人下載并部署在本地,就連筆記本也可以跑起來(lái)。
正如 Stability AI 在報(bào)道中坦言的:“語(yǔ)言模型將成為我們數(shù)字經(jīng)濟(jì)的支柱,我們希望每個(gè)人都在他們的設(shè)計(jì)中擁有發(fā)言權(quán)。”
StableLM 目前已在 GitHub 開源,其高性能低消耗等特點(diǎn)快速吸引了一大波人的關(guān)注,不到一天時(shí)間,星標(biāo)已接近 6000 Stars。
寫文案、編代碼,還支持商業(yè)化
值得一提的是,StableLM 的發(fā)布主要得益于 Stability AI 在 EleutherAI (一個(gè)非營(yíng)利性研究中心)開源早期語(yǔ)言模型方面的經(jīng)驗(yàn),其語(yǔ)言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件,它們基于 The Pile 開源數(shù)據(jù)集訓(xùn)練。
StableLM 是基于一個(gè)新的實(shí)驗(yàn)數(shù)據(jù)集訓(xùn)練出來(lái)的,該數(shù)據(jù)集基于 The Pile 構(gòu)建,但數(shù)據(jù)集規(guī)模是原來(lái)的 3 倍,包含 1.5 萬(wàn)億個(gè)標(biāo)記內(nèi)容。盡管其參數(shù)只有 30 到 70 億(相比之下,GPT-3 有 1750 億個(gè)參數(shù)),但這個(gè)數(shù)據(jù)集的豐富性使得 StableLM 在對(duì)話和編碼任務(wù)中表現(xiàn)出驚人的高性能。
Stability AI 還表示,作為概念驗(yàn)證,他們還使用了斯坦福大學(xué) Alpaca程序?qū)δP瓦M(jìn)行了微調(diào),使用了五個(gè)最近的對(duì)話代理數(shù)據(jù)集的組合:斯坦福大學(xué)的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 數(shù)據(jù)集、Databricks 實(shí)驗(yàn)室的 Dolly 和 Anthropic 的 HH,并把這些模型發(fā)布為 StableLM-Tuned-Alpha。
目前,在官方博客中, Stability AI 也展示了 70 億參數(shù)微調(diào)模型在“文本對(duì)話、創(chuàng)作內(nèi)容、編寫代碼”幾個(gè)方面的示例:
在對(duì)話方面,當(dāng)提問(wèn)“你會(huì)對(duì)即將高中畢業(yè)的朋友說(shuō)些什么”,StableLM 回答說(shuō):“你們應(yīng)該為自己的成就、工作、交友等方面感到驕傲,并對(duì)自己的未來(lái)抱以期望?!?/span>
面對(duì)“寫一封郵件”的任務(wù),StableLM 也是可以依照信件的格式,清晰的羅列出相關(guān)內(nèi)容。
(圖源: Stability AI 官方博客截圖)
甚至,StableLM 還可以完成一首 rap 的歌詞:
(圖源: Stability AI 官方博客截圖)
在面對(duì)“用 C 語(yǔ)言編寫可以計(jì)算機(jī)生命意義”的問(wèn)題上,StableLM 在“解答未果”后,還用幽默的口吻調(diào)侃道:“生命的實(shí)際意義會(huì)有更復(fù)雜的成分,例如社會(huì)、哲學(xué)等。”
(圖源: Stability AI 官方博客截圖)
不僅如此,StableLM 模型還允許商業(yè)化,但開發(fā)人員需要遵守 CCBY-SA-4.0 許可條款,自由地檢查、使用和調(diào)整 StableLM 基礎(chǔ)模型。 “大方開源”遭來(lái)非議
伴隨著 StableLM 在 GitHub 上的開源,國(guó)內(nèi)外網(wǎng)友也展開了熱議,而萬(wàn)萬(wàn)沒(méi)想到的是,許多網(wǎng)友在試用后,竟開始瘋狂抨擊 StableLM 的效果:
“我試圖用它生成的所有東西,但最后我都沒(méi)有采納?!?;
“StableLM 的‘開源’是唯一的優(yōu)勢(shì)了吧”;
“它的回答結(jié)果真的平平無(wú)奇,不是我想要的”。
但是,也有網(wǎng)友幫忙解釋道:
“畢竟 Alpha 版本的參數(shù)量目前較小”;
“我還是相信在不久的將來(lái), StableLM 會(huì)進(jìn)步的”;
“能大方開源,已經(jīng)讓我欣慰了”。
此外, StableLM 模型“開源”的安全性等問(wèn)題也備受大家關(guān)注。
眾所周知,去年在 Stable Diffusion 發(fā)布后,Stability AI 遭到了很多藝術(shù)家的投訴和起訴。因此,很多人對(duì) StableLM 表示懷疑:“ 不知道是否還會(huì)引發(fā)訴訟”、“害怕又發(fā)生剽竊問(wèn)題”……
與此同時(shí),不少人擔(dān)心有人會(huì)利用開源來(lái)撰寫釣魚鏈接的文案和協(xié)同軟件攻擊等。
對(duì)此, Stability AI 官方表示:“我們開源我們的模型,以提高透明度并促進(jìn)信任。研究人員可以'深入了解'來(lái)驗(yàn)證性能,研究可解釋性技術(shù),識(shí)別潛在風(fēng)險(xiǎn)并幫助制定保障措施” 。
參考鏈接:
https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-modelshttps://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1https://news.ycombinator.com/item?id=35629127https://github.com/Stability-AI/StableLM
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。