OpenAI推出新版圖像生成器DALL-E 3，10月份開(kāi)發(fā)

作者：時(shí)間：2023-09-21 來(lái)源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

9月21日消息，周三， OpenAI發(fā)布了其新版圖像生成器DALL-E的預(yù)覽版本，該工具可以根據(jù)書(shū)面提示生成圖像。同時(shí)，OpenAI計(jì)劃將其整合到廣受歡迎的ChatGPT聊天機(jī)器人中。在立法者呼吁對(duì)生成式人工智能施加更多限制之際，OpenAI正在擴(kuò)展這項(xiàng)有爭(zhēng)議技術(shù)的應(yīng)用范圍。

本文引用地址：http://2s4d.com/article/202309/450799.htm

這款名為DALL-E 3的新工具在理解用戶(hù)命令和將文本轉(zhuǎn)化為圖像方面表現(xiàn)更出色，這是之前人工智能圖像生成器的短板。OpenAI的研究人員表示，語(yǔ)言的進(jìn)步使DALL-E 3能夠更好地解析復(fù)雜指令，避免混淆詳細(xì)請(qǐng)求中的元素。

DALL-E 3團(tuán)隊(duì)負(fù)責(zé)人阿迪提亞·拉梅什(Aditya Ramesh)表示：“普通用戶(hù)可以登錄ChatGPT聊天機(jī)器人，向它詢(xún)問(wèn)一些模糊的問(wèn)題。”在演示期間，拉梅什分享了一個(gè)企業(yè)主為名為Mountain Ramen的公司測(cè)試不同標(biāo)識(shí)場(chǎng)景的例子。

盡管這個(gè)新工具目前僅供少數(shù)用戶(hù)進(jìn)行早期測(cè)試，但OpenAI計(jì)劃在10月份向ChatGPT付費(fèi)訂戶(hù)開(kāi)放，從而大大增加與該技術(shù)互動(dòng)的人數(shù)。

OpenAI正面臨越來(lái)越大的競(jìng)爭(zhēng)壓力。谷歌推出了一系列人工智能驅(qū)動(dòng)的產(chǎn)品，導(dǎo)致DALL-E和OpenAI旗艦聊天機(jī)器人的流量和月度用戶(hù)增長(zhǎng)放緩。但通過(guò)將其新穎的圖像生成器整合到ChatGPT中，OpenAI正在擴(kuò)大市場(chǎng)，并將該技術(shù)作為聊天機(jī)器人的一個(gè)功能，而不是獨(dú)立產(chǎn)品。

OpenAI的公關(guān)主管林賽·海德·博爾頓(Lindsey head Bolton)表示，在新聞發(fā)布會(huì)上記者們無(wú)法測(cè)試該功能，因?yàn)镈ALL-E 3在發(fā)布時(shí)還存在一些小故障。不過(guò)，OpenAI后來(lái)表示，到周三發(fā)布時(shí)，DALL-E 3會(huì)穩(wěn)定下來(lái)。

之前推出的DALL-E 2、Midjourney和Stable Diffusion等文本轉(zhuǎn)圖像生成器在早期就吸引了用戶(hù)，為公眾提供了掌握高級(jí)軟件能力的機(jī)會(huì)，而無(wú)需技術(shù)技能。廣告商、營(yíng)銷(xiāo)人員、政界人士和視頻游戲開(kāi)發(fā)商都在利用這些工具進(jìn)行宣傳活動(dòng)。

然而，數(shù)據(jù)分析公司SimilarWeb的數(shù)據(jù)顯示，DALL-E工具的在線訪問(wèn)量已經(jīng)放緩，從2023年3月OpenAI升級(jí)ChatGPT底層技術(shù)時(shí)的3200萬(wàn)峰值降至8月份的約1300萬(wàn)。

盡管文本轉(zhuǎn)圖像人工智能技術(shù)的未來(lái)存在不確定性，但其發(fā)展幾乎沒(méi)有限制，引發(fā)了人們對(duì)其制作逼真圖像能力對(duì)社會(huì)和政治產(chǎn)生巨大影響的擔(dān)憂(yōu)。

舊版DALL-E生成的街道標(biāo)志和文本顯得十分混亂，因此很容易識(shí)別出人工智能生成的圖像。然而，DALL-E 3的改進(jìn)使外行人更難識(shí)別圖像的真?zhèn)?。加州大學(xué)伯克利分校教授哈尼·法里德(Hany Farid)表示：“你不再能相信自己的眼睛?！?法里德是數(shù)字取證研究專(zhuān)家，與Adobe合作支持內(nèi)容真實(shí)性倡議。

法里德強(qiáng)調(diào)，DALL-E 3的改進(jìn)并不足為奇，因?yàn)槿斯ぶ悄苊苛鶄€(gè)月左右就會(huì)在模仿現(xiàn)實(shí)世界方面取得更好的表現(xiàn)。他呼吁采用先進(jìn)技術(shù)，從人工智能中消除人類(lèi)創(chuàng)造的東西。

OpenAI的競(jìng)爭(zhēng)對(duì)手Stability AI和Midjourney面臨來(lái)自藝術(shù)家和Getty Images的訴訟，指控訓(xùn)練生成式人工智能模型所需的大量互聯(lián)網(wǎng)數(shù)據(jù)構(gòu)成版權(quán)侵權(quán)。

執(zhí)法部門(mén)、監(jiān)管機(jī)構(gòu)和倡導(dǎo)團(tuán)體最近開(kāi)始關(guān)注這些工具的用途，例如用于制作深度偽造的成人內(nèi)容以及為即將到來(lái)的總統(tǒng)選舉制作人工智能廣告等。

DALL-E 3團(tuán)隊(duì)表示，他們優(yōu)先考慮了這些風(fēng)險(xiǎn)，并邀請(qǐng)外部專(zhuān)家組成的“紅隊(duì)”測(cè)試最壞情況，將其經(jīng)驗(yàn)融入公司的應(yīng)對(duì)策略中。

對(duì)于DALL-E 2，OpenAI在一張系統(tǒng)卡片中發(fā)表了該過(guò)程的詳細(xì)簡(jiǎn)介，詳述了AI模型的開(kāi)發(fā)、微調(diào)和安全測(cè)試的公開(kāi)說(shuō)明。政策研究員桑德希尼·阿加瓦爾（Sandhini Agarwal）表示，OpenAI計(jì)劃在DALL-E 3向公眾開(kāi)放之前發(fā)布一張類(lèi)似的卡片。作為6月份在參加白宮峰會(huì)自愿承諾的一部分， OpenAI同意開(kāi)發(fā)和部署預(yù)防機(jī)制，用于識(shí)別由人工智能生成的視頻或音頻內(nèi)容，通過(guò)圖像水印或編碼來(lái)源數(shù)據(jù)等方法指示內(nèi)容創(chuàng)建的服務(wù)或模型。拉梅什說(shuō)，DALL-E 3正在試驗(yàn)一種分類(lèi)器，可以查看圖像的來(lái)源或內(nèi)容的“來(lái)源”，這是白宮承諾中提到的一種方法。

開(kāi)源模型庫(kù)公司Hugging Face的研究科學(xué)家、谷歌倫理人工智能前聯(lián)合負(fù)責(zé)人瑪格麗特·米切爾(Margaret Mitchell)表示，這些機(jī)制有助于識(shí)別深度偽造，同時(shí)也可以幫助藝術(shù)家追蹤他們的作品是否未經(jīng)同意或賠償?shù)赜糜谟?xùn)練模型。

米切爾補(bǔ)充說(shuō)：“這不一定符合公司的利益，但我認(rèn)為它符合更多人的利益?！?/p>

新聞中心

OpenAI推出新版圖像生成器DALL-E 3，10月份開(kāi)發(fā)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

新聞中心

OpenAI推出新版圖像生成器DALL-E 3，10月份開(kāi)發(fā)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

OpenAI推出新版圖像生成器DALL-E 3，10月份開(kāi)發(fā)