OpenAI推出新版圖像生成器DALL-E 3,10月份開發(fā)
9月21日消息,周三, OpenAI發(fā)布了其新版圖像生成器DALL-E的預(yù)覽版本,該工具可以根據(jù)書面提示生成圖像。同時,OpenAI計劃將其整合到廣受歡迎的ChatGPT聊天機(jī)器人中。在立法者呼吁對生成式人工智能施加更多限制之際,OpenAI正在擴(kuò)展這項有爭議技術(shù)的應(yīng)用范圍。
本文引用地址:http://2s4d.com/article/202309/450799.htm這款名為DALL-E 3的新工具在理解用戶命令和將文本轉(zhuǎn)化為圖像方面表現(xiàn)更出色,這是之前人工智能圖像生成器的短板。OpenAI的研究人員表示,語言的進(jìn)步使DALL-E 3能夠更好地解析復(fù)雜指令,避免混淆詳細(xì)請求中的元素。
DALL-E 3團(tuán)隊負(fù)責(zé)人阿迪提亞·拉梅什(Aditya Ramesh)表示:“普通用戶可以登錄ChatGPT聊天機(jī)器人,向它詢問一些模糊的問題?!痹谘菔酒陂g,拉梅什分享了一個企業(yè)主為名為Mountain Ramen的公司測試不同標(biāo)識場景的例子。
盡管這個新工具目前僅供少數(shù)用戶進(jìn)行早期測試,但OpenAI計劃在10月份向ChatGPT付費(fèi)訂戶開放,從而大大增加與該技術(shù)互動的人數(shù)。
OpenAI正面臨越來越大的競爭壓力。谷歌推出了一系列人工智能驅(qū)動的產(chǎn)品,導(dǎo)致DALL-E和OpenAI旗艦聊天機(jī)器人的流量和月度用戶增長放緩。但通過將其新穎的圖像生成器整合到ChatGPT中,OpenAI正在擴(kuò)大市場,并將該技術(shù)作為聊天機(jī)器人的一個功能,而不是獨(dú)立產(chǎn)品。
OpenAI的公關(guān)主管林賽·海德·博爾頓(Lindsey head Bolton)表示,在新聞發(fā)布會上記者們無法測試該功能,因?yàn)镈ALL-E 3在發(fā)布時還存在一些小故障。不過,OpenAI后來表示,到周三發(fā)布時,DALL-E 3會穩(wěn)定下來。
之前推出的DALL-E 2、Midjourney和Stable Diffusion等文本轉(zhuǎn)圖像生成器在早期就吸引了用戶,為公眾提供了掌握高級軟件能力的機(jī)會,而無需技術(shù)技能。廣告商、營銷人員、政界人士和視頻游戲開發(fā)商都在利用這些工具進(jìn)行宣傳活動。
然而,數(shù)據(jù)分析公司SimilarWeb的數(shù)據(jù)顯示,DALL-E工具的在線訪問量已經(jīng)放緩,從2023年3月OpenAI升級ChatGPT底層技術(shù)時的3200萬峰值降至8月份的約1300萬。
盡管文本轉(zhuǎn)圖像人工智能技術(shù)的未來存在不確定性,但其發(fā)展幾乎沒有限制,引發(fā)了人們對其制作逼真圖像能力對社會和政治產(chǎn)生巨大影響的擔(dān)憂。
舊版DALL-E生成的街道標(biāo)志和文本顯得十分混亂,因此很容易識別出人工智能生成的圖像。然而,DALL-E 3的改進(jìn)使外行人更難識別圖像的真?zhèn)巍<又荽髮W(xué)伯克利分校教授哈尼·法里德(Hany Farid)表示:“你不再能相信自己的眼睛。” 法里德是數(shù)字取證研究專家,與Adobe合作支持內(nèi)容真實(shí)性倡議。
法里德強(qiáng)調(diào),DALL-E 3的改進(jìn)并不足為奇,因?yàn)槿斯ぶ悄苊苛鶄€月左右就會在模仿現(xiàn)實(shí)世界方面取得更好的表現(xiàn)。他呼吁采用先進(jìn)技術(shù),從人工智能中消除人類創(chuàng)造的東西。
OpenAI的競爭對手Stability AI和Midjourney面臨來自藝術(shù)家和Getty Images的訴訟,指控訓(xùn)練生成式人工智能模型所需的大量互聯(lián)網(wǎng)數(shù)據(jù)構(gòu)成版權(quán)侵權(quán)。
執(zhí)法部門、監(jiān)管機(jī)構(gòu)和倡導(dǎo)團(tuán)體最近開始關(guān)注這些工具的用途,例如用于制作深度偽造的成人內(nèi)容以及為即將到來的總統(tǒng)選舉制作人工智能廣告等。
DALL-E 3團(tuán)隊表示,他們優(yōu)先考慮了這些風(fēng)險,并邀請外部專家組成的“紅隊”測試最壞情況,將其經(jīng)驗(yàn)融入公司的應(yīng)對策略中。
對于DALL-E 2,OpenAI在一張系統(tǒng)卡片中發(fā)表了該過程的詳細(xì)簡介,詳述了AI模型的開發(fā)、微調(diào)和安全測試的公開說明。政策研究員桑德希尼·阿加瓦爾(Sandhini Agarwal)表示,OpenAI計劃在DALL-E 3向公眾開放之前發(fā)布一張類似的卡片。作為6月份在參加白宮峰會自愿承諾的一部分, OpenAI同意開發(fā)和部署預(yù)防機(jī)制,用于識別由人工智能生成的視頻或音頻內(nèi)容,通過圖像水印或編碼來源數(shù)據(jù)等方法指示內(nèi)容創(chuàng)建的服務(wù)或模型。拉梅什說,DALL-E 3正在試驗(yàn)一種分類器,可以查看圖像的來源或內(nèi)容的“來源”,這是白宮承諾中提到的一種方法。
開源模型庫公司Hugging Face的研究科學(xué)家、谷歌倫理人工智能前聯(lián)合負(fù)責(zé)人瑪格麗特·米切爾(Margaret Mitchell)表示,這些機(jī)制有助于識別深度偽造,同時也可以幫助藝術(shù)家追蹤他們的作品是否未經(jīng)同意或賠償?shù)赜糜谟?xùn)練模型。
米切爾補(bǔ)充說:“這不一定符合公司的利益,但我認(rèn)為它符合更多人的利益。”
評論