Stable Diffusion公司開(kāi)源大語(yǔ)言模型StableLM，網(wǎng)友：不是我想要的！

發(fā)布人：AI科技大本營(yíng) 時(shí)間：2023-04-24 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

眾所周知，去年初創(chuàng)公司 Stability AI 發(fā)布的 AI 圖像生成工具 Stable Diffusion，成為一種革命性的圖像模型，也使 AI“文生圖”實(shí)現(xiàn)了飛速的發(fā)展。

滿(mǎn)載著大家對(duì)其“不再局限于開(kāi)發(fā)圖像生成”和“開(kāi)源”的期待，在 4 月 20 日， Stability AI 宣布推出開(kāi)源大型語(yǔ)言模型（LLM）—— StableLM。

（圖源：Stability AI 官方博客截圖）

小參數(shù)大訓(xùn)練，開(kāi)源備受熱捧

據(jù) Stability AI 官方報(bào)道，StableLM 模型還處于 Alpha 階段，參數(shù)比較少，只有 30 億和 70 億個(gè)參數(shù)，之后還會(huì)推出有 150 億到 650 億參數(shù)的模型。作為一個(gè)類(lèi) ChatGPT 模型，StableLM 模型可以生成文本和代碼，并為一系列下游應(yīng)用程序提供動(dòng)力，能為小而高效的模型通過(guò)適當(dāng)?shù)呐嘤?xùn)提供高性能。

然而，與 ChatGPT、Bard 等模型相比，StableLM 最大的“優(yōu)勢(shì)”莫過(guò)于可供每一個(gè)人下載并部署在本地，就連筆記本也可以跑起來(lái)。

正如 Stability AI 在報(bào)道中坦言的：“語(yǔ)言模型將成為我們數(shù)字經(jīng)濟(jì)的支柱，我們希望每個(gè)人都在他們的設(shè)計(jì)中擁有發(fā)言權(quán)。”

StableLM 目前已在 GitHub 開(kāi)源，其高性能低消耗等特點(diǎn)快速吸引了一大波人的關(guān)注，不到一天時(shí)間，星標(biāo)已接近 6000 Stars。

（圖源：GitHub 截圖）

寫(xiě)文案、編代碼，還支持商業(yè)化

值得一提的是，StableLM 的發(fā)布主要得益于 Stability AI 在 EleutherAI (一個(gè)非營(yíng)利性研究中心)開(kāi)源早期語(yǔ)言模型方面的經(jīng)驗(yàn)，其語(yǔ)言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件，它們基于 The Pile 開(kāi)源數(shù)據(jù)集訓(xùn)練。

StableLM 是基于一個(gè)新的實(shí)驗(yàn)數(shù)據(jù)集訓(xùn)練出來(lái)的，該數(shù)據(jù)集基于 The Pile 構(gòu)建，但數(shù)據(jù)集規(guī)模是原來(lái)的 3 倍，包含 1.5 萬(wàn)億個(gè)標(biāo)記內(nèi)容。盡管其參數(shù)只有 30 到 70 億（相比之下，GPT-3 有 1750 億個(gè)參數(shù)），但這個(gè)數(shù)據(jù)集的豐富性使得 StableLM 在對(duì)話(huà)和編碼任務(wù)中表現(xiàn)出驚人的高性能。

Stability AI 還表示，作為概念驗(yàn)證，他們還使用了斯坦福大學(xué) Alpaca程序?qū)δＰ瓦M(jìn)行了微調(diào)，使用了五個(gè)最近的對(duì)話(huà)代理數(shù)據(jù)集的組合：斯坦福大學(xué)的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 數(shù)據(jù)集、Databricks 實(shí)驗(yàn)室的 Dolly 和 Anthropic 的 HH，并把這些模型發(fā)布為 StableLM-Tuned-Alpha。

目前，在官方博客中， Stability AI 也展示了 70 億參數(shù)微調(diào)模型在“文本對(duì)話(huà)、創(chuàng)作內(nèi)容、編寫(xiě)代碼”幾個(gè)方面的示例：

在對(duì)話(huà)方面，當(dāng)提問(wèn)“你會(huì)對(duì)即將高中畢業(yè)的朋友說(shuō)些什么”，StableLM 回答說(shuō)：“你們應(yīng)該為自己的成就、工作、交友等方面感到驕傲，并對(duì)自己的未來(lái)抱以期望?！?/span>
面對(duì)“寫(xiě)一封郵件”的任務(wù)，StableLM 也是可以依照信件的格式，清晰的羅列出相關(guān)內(nèi)容。

（圖源： Stability AI 官方博客截圖）

甚至，StableLM 還可以完成一首 rap 的歌詞：

（圖源： Stability AI 官方博客截圖）

在面對(duì)“用 C 語(yǔ)言編寫(xiě)可以計(jì)算機(jī)生命意義”的問(wèn)題上，StableLM 在“解答未果”后，還用幽默的口吻調(diào)侃道：“生命的實(shí)際意義會(huì)有更復(fù)雜的成分，例如社會(huì)、哲學(xué)等。”

（圖源： Stability AI 官方博客截圖）

不僅如此，StableLM 模型還允許商業(yè)化，但開(kāi)發(fā)人員需要遵守 CCBY-SA-4.0 許可條款，自由地檢查、使用和調(diào)整 StableLM 基礎(chǔ)模型。

“大方開(kāi)源”遭來(lái)非議

伴隨著 StableLM 在 GitHub 上的開(kāi)源，國(guó)內(nèi)外網(wǎng)友也展開(kāi)了熱議，而萬(wàn)萬(wàn)沒(méi)想到的是，許多網(wǎng)友在試用后，竟開(kāi)始瘋狂抨擊 StableLM 的效果：

“我試圖用它生成的所有東西，但最后我都沒(méi)有采納?！保?/span>
“StableLM 的‘開(kāi)源’是唯一的優(yōu)勢(shì)了吧”；
“它的回答結(jié)果真的平平無(wú)奇，不是我想要的”。

但是，也有網(wǎng)友幫忙解釋道：

“畢竟 Alpha 版本的參數(shù)量目前較小”；
“我還是相信在不久的將來(lái)， StableLM 會(huì)進(jìn)步的”；
“能大方開(kāi)源，已經(jīng)讓我欣慰了”。

此外， StableLM 模型“開(kāi)源”的安全性等問(wèn)題也備受大家關(guān)注。

眾所周知，去年在 Stable Diffusion 發(fā)布后，Stability AI 遭到了很多藝術(shù)家的投訴和起訴。因此，很多人對(duì) StableLM 表示懷疑：“ 不知道是否還會(huì)引發(fā)訴訟”、“害怕又發(fā)生剽竊問(wèn)題”……

與此同時(shí)，不少人擔(dān)心有人會(huì)利用開(kāi)源來(lái)撰寫(xiě)釣魚(yú)鏈接的文案和協(xié)同軟件攻擊等。

對(duì)此， Stability AI 官方表示：“我們開(kāi)源我們的模型，以提高透明度并促進(jìn)信任。研究人員可以'深入了解'來(lái)驗(yàn)證性能，研究可解釋性技術(shù)，識(shí)別潛在風(fēng)險(xiǎn)并幫助制定保障措施” 。

參考鏈接：

https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-modelshttps://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1https://news.ycombinator.com/item?id=35629127

https://github.com/Stability-AI/StableLM

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專(zhuān)欄

Stable Diffusion公司開(kāi)源大語(yǔ)言模型StableLM，網(wǎng)友：不是我想要的！

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

博客專(zhuān)欄

Stable Diffusion公司開(kāi)源大語(yǔ)言模型StableLM，網(wǎng)友：不是我想要的！

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

Stable Diffusion公司開(kāi)源大語(yǔ)言模型StableLM，網(wǎng)友：不是我想要的！