OpenAI推出新版圖像生成器DALL-E 3,10月份開發(fā)
9月21日消息,周三, OpenAI發(fā)布了其新版圖像生成器DALL-E的預(yù)覽版本,該工具可以根據(jù)書面提示生成圖像。同時(shí),OpenAI計(jì)劃將其整合到廣受歡迎的ChatGPT聊天機(jī)器人中。在立法者呼吁對(duì)生成式人工智能施加更多限制之際,OpenAI正在擴(kuò)展這項(xiàng)有爭(zhēng)議技術(shù)的應(yīng)用范圍。
本文引用地址:http://m.butianyuan.cn/article/202309/450799.htm這款名為DALL-E 3的新工具在理解用戶命令和將文本轉(zhuǎn)化為圖像方面表現(xiàn)更出色,這是之前人工智能圖像生成器的短板。OpenAI的研究人員表示,語(yǔ)言的進(jìn)步使DALL-E 3能夠更好地解析復(fù)雜指令,避免混淆詳細(xì)請(qǐng)求中的元素。
DALL-E 3團(tuán)隊(duì)負(fù)責(zé)人阿迪提亞·拉梅什(Aditya Ramesh)表示:“普通用戶可以登錄ChatGPT聊天機(jī)器人,向它詢問(wèn)一些模糊的問(wèn)題。”在演示期間,拉梅什分享了一個(gè)企業(yè)主為名為Mountain Ramen的公司測(cè)試不同標(biāo)識(shí)場(chǎng)景的例子。
盡管這個(gè)新工具目前僅供少數(shù)用戶進(jìn)行早期測(cè)試,但OpenAI計(jì)劃在10月份向ChatGPT付費(fèi)訂戶開放,從而大大增加與該技術(shù)互動(dòng)的人數(shù)。
OpenAI正面臨越來(lái)越大的競(jìng)爭(zhēng)壓力。谷歌推出了一系列人工智能驅(qū)動(dòng)的產(chǎn)品,導(dǎo)致DALL-E和OpenAI旗艦聊天機(jī)器人的流量和月度用戶增長(zhǎng)放緩。但通過(guò)將其新穎的圖像生成器整合到ChatGPT中,OpenAI正在擴(kuò)大市場(chǎng),并將該技術(shù)作為聊天機(jī)器人的一個(gè)功能,而不是獨(dú)立產(chǎn)品。
OpenAI的公關(guān)主管林賽·海德·博爾頓(Lindsey head Bolton)表示,在新聞發(fā)布會(huì)上記者們無(wú)法測(cè)試該功能,因?yàn)镈ALL-E 3在發(fā)布時(shí)還存在一些小故障。不過(guò),OpenAI后來(lái)表示,到周三發(fā)布時(shí),DALL-E 3會(huì)穩(wěn)定下來(lái)。
之前推出的DALL-E 2、Midjourney和Stable Diffusion等文本轉(zhuǎn)圖像生成器在早期就吸引了用戶,為公眾提供了掌握高級(jí)軟件能力的機(jī)會(huì),而無(wú)需技術(shù)技能。廣告商、營(yíng)銷人員、政界人士和視頻游戲開發(fā)商都在利用這些工具進(jìn)行宣傳活動(dòng)。
然而,數(shù)據(jù)分析公司SimilarWeb的數(shù)據(jù)顯示,DALL-E工具的在線訪問(wèn)量已經(jīng)放緩,從2023年3月OpenAI升級(jí)ChatGPT底層技術(shù)時(shí)的3200萬(wàn)峰值降至8月份的約1300萬(wàn)。
盡管文本轉(zhuǎn)圖像人工智能技術(shù)的未來(lái)存在不確定性,但其發(fā)展幾乎沒(méi)有限制,引發(fā)了人們對(duì)其制作逼真圖像能力對(duì)社會(huì)和政治產(chǎn)生巨大影響的擔(dān)憂。
舊版DALL-E生成的街道標(biāo)志和文本顯得十分混亂,因此很容易識(shí)別出人工智能生成的圖像。然而,DALL-E 3的改進(jìn)使外行人更難識(shí)別圖像的真?zhèn)?。加州大學(xué)伯克利分校教授哈尼·法里德(Hany Farid)表示:“你不再能相信自己的眼睛?!?法里德是數(shù)字取證研究專家,與Adobe合作支持內(nèi)容真實(shí)性倡議。
法里德強(qiáng)調(diào),DALL-E 3的改進(jìn)并不足為奇,因?yàn)槿斯ぶ悄苊苛鶄€(gè)月左右就會(huì)在模仿現(xiàn)實(shí)世界方面取得更好的表現(xiàn)。他呼吁采用先進(jìn)技術(shù),從人工智能中消除人類創(chuàng)造的東西。
OpenAI的競(jìng)爭(zhēng)對(duì)手Stability AI和Midjourney面臨來(lái)自藝術(shù)家和Getty Images的訴訟,指控訓(xùn)練生成式人工智能模型所需的大量互聯(lián)網(wǎng)數(shù)據(jù)構(gòu)成版權(quán)侵權(quán)。
執(zhí)法部門、監(jiān)管機(jī)構(gòu)和倡導(dǎo)團(tuán)體最近開始關(guān)注這些工具的用途,例如用于制作深度偽造的成人內(nèi)容以及為即將到來(lái)的總統(tǒng)選舉制作人工智能廣告等。
DALL-E 3團(tuán)隊(duì)表示,他們優(yōu)先考慮了這些風(fēng)險(xiǎn),并邀請(qǐng)外部專家組成的“紅隊(duì)”測(cè)試最壞情況,將其經(jīng)驗(yàn)融入公司的應(yīng)對(duì)策略中。
對(duì)于DALL-E 2,OpenAI在一張系統(tǒng)卡片中發(fā)表了該過(guò)程的詳細(xì)簡(jiǎn)介,詳述了AI模型的開發(fā)、微調(diào)和安全測(cè)試的公開說(shuō)明。政策研究員桑德希尼·阿加瓦爾(Sandhini Agarwal)表示,OpenAI計(jì)劃在DALL-E 3向公眾開放之前發(fā)布一張類似的卡片。作為6月份在參加白宮峰會(huì)自愿承諾的一部分, OpenAI同意開發(fā)和部署預(yù)防機(jī)制,用于識(shí)別由人工智能生成的視頻或音頻內(nèi)容,通過(guò)圖像水印或編碼來(lái)源數(shù)據(jù)等方法指示內(nèi)容創(chuàng)建的服務(wù)或模型。拉梅什說(shuō),DALL-E 3正在試驗(yàn)一種分類器,可以查看圖像的來(lái)源或內(nèi)容的“來(lái)源”,這是白宮承諾中提到的一種方法。
開源模型庫(kù)公司Hugging Face的研究科學(xué)家、谷歌倫理人工智能前聯(lián)合負(fù)責(zé)人瑪格麗特·米切爾(Margaret Mitchell)表示,這些機(jī)制有助于識(shí)別深度偽造,同時(shí)也可以幫助藝術(shù)家追蹤他們的作品是否未經(jīng)同意或賠償?shù)赜糜谟?xùn)練模型。
米切爾補(bǔ)充說(shuō):“這不一定符合公司的利益,但我認(rèn)為它符合更多人的利益?!?/p>
評(píng)論