OpenAI推出新版圖像生成器DALL-E 3，10月份開發(fā)

作者：時間：2023-09-21 來源：網易科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

9月21日消息，周三， OpenAI發(fā)布了其新版圖像生成器DALL-E的預覽版本，該工具可以根據書面提示生成圖像。同時，OpenAI計劃將其整合到廣受歡迎的ChatGPT聊天機器人中。在立法者呼吁對生成式人工智能施加更多限制之際，OpenAI正在擴展這項有爭議技術的應用范圍。

本文引用地址：http://m.butianyuan.cn/article/202309/450799.htm

這款名為DALL-E 3的新工具在理解用戶命令和將文本轉化為圖像方面表現(xiàn)更出色，這是之前人工智能圖像生成器的短板。OpenAI的研究人員表示，語言的進步使DALL-E 3能夠更好地解析復雜指令，避免混淆詳細請求中的元素。

DALL-E 3團隊負責人阿迪提亞·拉梅什(Aditya Ramesh)表示：“普通用戶可以登錄ChatGPT聊天機器人，向它詢問一些模糊的問題?！痹谘菔酒陂g，拉梅什分享了一個企業(yè)主為名為Mountain Ramen的公司測試不同標識場景的例子。

盡管這個新工具目前僅供少數用戶進行早期測試，但OpenAI計劃在10月份向ChatGPT付費訂戶開放，從而大大增加與該技術互動的人數。

OpenAI正面臨越來越大的競爭壓力。谷歌推出了一系列人工智能驅動的產品，導致DALL-E和OpenAI旗艦聊天機器人的流量和月度用戶增長放緩。但通過將其新穎的圖像生成器整合到ChatGPT中，OpenAI正在擴大市場，并將該技術作為聊天機器人的一個功能，而不是獨立產品。

OpenAI的公關主管林賽·海德·博爾頓(Lindsey head Bolton)表示，在新聞發(fā)布會上記者們無法測試該功能，因為DALL-E 3在發(fā)布時還存在一些小故障。不過，OpenAI后來表示，到周三發(fā)布時，DALL-E 3會穩(wěn)定下來。

之前推出的DALL-E 2、Midjourney和Stable Diffusion等文本轉圖像生成器在早期就吸引了用戶，為公眾提供了掌握高級軟件能力的機會，而無需技術技能。廣告商、營銷人員、政界人士和視頻游戲開發(fā)商都在利用這些工具進行宣傳活動。

然而，數據分析公司SimilarWeb的數據顯示，DALL-E工具的在線訪問量已經放緩，從2023年3月OpenAI升級ChatGPT底層技術時的3200萬峰值降至8月份的約1300萬。

盡管文本轉圖像人工智能技術的未來存在不確定性，但其發(fā)展幾乎沒有限制，引發(fā)了人們對其制作逼真圖像能力對社會和政治產生巨大影響的擔憂。

舊版DALL-E生成的街道標志和文本顯得十分混亂，因此很容易識別出人工智能生成的圖像。然而，DALL-E 3的改進使外行人更難識別圖像的真?zhèn)?。加州大學伯克利分校教授哈尼·法里德(Hany Farid)表示：“你不再能相信自己的眼睛?！?法里德是數字取證研究專家，與Adobe合作支持內容真實性倡議。

法里德強調，DALL-E 3的改進并不足為奇，因為人工智能每六個月左右就會在模仿現(xiàn)實世界方面取得更好的表現(xiàn)。他呼吁采用先進技術，從人工智能中消除人類創(chuàng)造的東西。

OpenAI的競爭對手Stability AI和Midjourney面臨來自藝術家和Getty Images的訴訟，指控訓練生成式人工智能模型所需的大量互聯(lián)網數據構成版權侵權。

執(zhí)法部門、監(jiān)管機構和倡導團體最近開始關注這些工具的用途，例如用于制作深度偽造的成人內容以及為即將到來的總統(tǒng)選舉制作人工智能廣告等。

DALL-E 3團隊表示，他們優(yōu)先考慮了這些風險，并邀請外部專家組成的“紅隊”測試最壞情況，將其經驗融入公司的應對策略中。

對于DALL-E 2，OpenAI在一張系統(tǒng)卡片中發(fā)表了該過程的詳細簡介，詳述了AI模型的開發(fā)、微調和安全測試的公開說明。政策研究員桑德希尼·阿加瓦爾（Sandhini Agarwal）表示，OpenAI計劃在DALL-E 3向公眾開放之前發(fā)布一張類似的卡片。作為6月份在參加白宮峰會自愿承諾的一部分， OpenAI同意開發(fā)和部署預防機制，用于識別由人工智能生成的視頻或音頻內容，通過圖像水印或編碼來源數據等方法指示內容創(chuàng)建的服務或模型。拉梅什說，DALL-E 3正在試驗一種分類器，可以查看圖像的來源或內容的“來源”，這是白宮承諾中提到的一種方法。

開源模型庫公司Hugging Face的研究科學家、谷歌倫理人工智能前聯(lián)合負責人瑪格麗特·米切爾(Margaret Mitchell)表示，這些機制有助于識別深度偽造，同時也可以幫助藝術家追蹤他們的作品是否未經同意或賠償地用于訓練模型。

米切爾補充說：“這不一定符合公司的利益，但我認為它符合更多人的利益。”