OpenAI正式發(fā)布AI視頻生成工具Sora,Plus用戶每月可生成50條
12月10日消息,美國時間周一,OpenAI正式發(fā)布了其備受關(guān)注的人工智能視頻生成工具Sora。
本文引用地址:http://m.butianyuan.cn/article/202412/465339.htm這款工具的工作原理類似于OpenAI的圖像生成工具DALL-E:用戶只需輸入想要的場景描述,Sora即可生成高質(zhì)量視頻片段。此外,Sora還能夠根據(jù)靜態(tài)圖像生成相關(guān)視頻、擴展已有視頻或填補視頻缺失的幀。這一功能讓Sora在視覺生成領(lǐng)域展現(xiàn)了強大的創(chuàng)造力。今年2月,Sora首次亮相,而OpenAI去年憑借ChatGPT的廣泛流行躍入公眾視野。
根據(jù)OpenAI在YouTube上的直播介紹,Sora將于今日正式向美國以及“國際上大多數(shù)國家”的用戶開放。不過,對于歐洲、英國及其他部分國家的上線時間,OpenAI尚未給出具體安排。
用戶可以生成分辨率高達1080p、時長最長20秒的視頻,并支持寬屏、豎屏和正方形等多種畫幅比例。此外,用戶還可以導(dǎo)入自己的素材,用于擴展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
Sora將免費提供給現(xiàn)有的ChatGPT Plus和Pro訂閱用戶,無需支付額外費用;Plus用戶每月最多可生成50個480p視頻,而Pro用戶最多可生成500個。在直播中,OpenAI員工以及首席執(zhí)行官薩姆·奧特曼(Sam Altman)展示了Sora的多個功能亮點,例如“混合”功能(可以將兩個場景按照用戶指令融合為一個視頻)以及生成可無限循環(huán)播放的視頻選項。
(圖注:ChatGPT Plus每月提供1000積分; ChatGPT Pro提供10000積分)
在正式推出之前,Sora主要供一小部分“紅隊”安全測試人員使用,這些測試人員幫助檢測模型在信息偏差和誤用方面的潛在風險。
10月時,一些Reddit用戶向OpenAI高管詢問Sora的發(fā)布日期,并猜測延遲的原因是“推理計算和時間成本過高”或“出于安全考慮”。對此,OpenAI產(chǎn)品主管凱文·威爾(Kevin Weil)回應(yīng)稱:“我們需要完善模型,確保其在安全性、模擬能力及其他方面的表現(xiàn),同時擴展計算能力!”
OpenAI的Sora產(chǎn)品負責人羅漢·薩海(Rohan Sahai)在直播中表示:“作為OpenAI,我們顯然承擔著巨大的責任?!彼a充道,公司必須防止該技術(shù)被非法使用,“但我們同樣希望實現(xiàn)創(chuàng)新與創(chuàng)意表達之間的平衡?!?/p>
今年10月,OpenAI完成了最新一輪融資,估值高達1570億美元,融資金額達到66億美元,并獲得了40億美元的循環(huán)信貸額度,使公司可支配流動資金總額超過100億美元。
作為微軟支持的人工智能初創(chuàng)企業(yè),OpenAI正與眾多科技巨頭展開激烈競爭,包括亞馬遜及其支持的Anthropic、埃隆·馬斯克創(chuàng)辦的xAI,以及谷歌、Meta和微軟等。據(jù)預(yù)測,在未來十年內(nèi),生成式人工智能市場收入可能突破1萬億美元大關(guān)。
本月早些時候,OpenAI任命其首位首席營銷官,標志著公司計劃在市場推廣方面增加投入,以進一步拓展用戶基礎(chǔ)。此外,今年10月,OpenAI在ChatGPT中新增了搜索功能,使其能夠更好地與谷歌、必應(yīng)和Perplexity等搜索引擎競爭,并吸引更多用戶。
作為ChatGPT的開發(fā)者,OpenAI希望通過Sora在視頻生成領(lǐng)域與Meta和谷歌等公司展開直接競爭。谷歌今年1月推出了Lumiere,而其他初創(chuàng)公司也已發(fā)布了類似的人工智能工具,例如Stability AI的Stable Video Diffusion。此外,亞馬遜也推出了“Create with Alexa”,這是一款專注于生成基于提示的短片兒童動畫內(nèi)容的模型。
隨著聊天機器人和圖像生成工具在消費及商業(yè)領(lǐng)域的普及,視頻生成正成為生成式人工智能的下一個前沿領(lǐng)域。雖然這一技術(shù)為AI愛好者帶來了創(chuàng)造性的新機會,但也引發(fā)了對錯誤信息和深度偽造的擔憂。據(jù)機器學習公司Clarity數(shù)據(jù)顯示,AI生成的深度偽造視頻數(shù)量同比增長達900%。
OpenAI將多模態(tài)(文本、圖像和視頻生成的結(jié)合)作為其戰(zhàn)略目標的一部分,以拓展人工智能工具的應(yīng)用場景。
在Sora發(fā)布之前,一些抗議者泄露了Sora的副本,表達對OpenAI對待藝術(shù)家方式的不滿。OpenAI的早期訪問計劃中包含了約300名藝術(shù)家,這些藝術(shù)家在11月底發(fā)表了一封公開信,批評OpenAI在透明度和對藝術(shù)界的支持方面做得不夠。
公開信中提到:“我們曾承諾作為早期測試者、紅隊成員和創(chuàng)意合作伙伴參與Sora的開發(fā)。然而,我們感到自己被引導(dǎo)參與了一場‘藝術(shù)洗白’,旨在展示Sora是一個對藝術(shù)家有用的工具?!?/p>
信中指出,數(shù)百名藝術(shù)家為Sora提供了大量無償勞動,通過漏洞測試和反饋推動了模型開發(fā)?!氨M管如此,只有少數(shù)人能通過競爭脫穎而出,他們的Sora創(chuàng)作作品得以公開放映,但所獲得的回報與OpenAI的公關(guān)和營銷價值相比微不足道?!?/p>
公開信指出:“我們并不反對將人工智能技術(shù)用作藝術(shù)創(chuàng)作的工具(如果反對,我們可能根本不會被邀請參加這個項目)。但我們不認同該藝術(shù)家項目的推出方式,以及這一工具在可能公開發(fā)布前的發(fā)展方向。我們公開這一情況,是希望OpenAI能變得更加開放,更加友好地對待藝術(shù)家,并真正支持藝術(shù)的發(fā)展,而不是將其僅作為公關(guān)宣傳的手段。”
對此,OpenAI在11月下旬發(fā)表聲明回應(yīng)稱:“數(shù)百名藝術(shù)家對Sora的開發(fā)作出了重要貢獻,幫助我們確定了功能開發(fā)的優(yōu)先級,并改進了安全措施。參與完全是自愿的,我們也未要求提供反饋或使用工具。我們很高興能夠為這些藝術(shù)家提供免費訪問的機會,并將繼續(xù)通過贈款、活動及其他項目為他們提供支持。”
以下為OpenAI發(fā)布Sora的官方博客文章全文:
我們的視頻生成模型現(xiàn)已從研究預(yù)覽階段推向市場,并已在sora.com正式上線。
今年早些時候,我們推出了Sora——一款能夠通過文本生成逼真視頻的人工智能模型,同時分享了我們在世界模擬領(lǐng)域的初步研究成果。Sora是開發(fā)能與物理環(huán)境交互的人工智能模型的重要基礎(chǔ),標志著這一領(lǐng)域邁出了關(guān)鍵一步。
我們?nèi)掳l(fā)布的升級版Sora Turbo,其速度顯著超過了2月份發(fā)布的預(yù)覽版。今天,這款獨立產(chǎn)品已在sora.com上線,并向ChatGPT Plus和Pro用戶開放使用。
全新設(shè)計的Sora界面
我們?yōu)镾ora設(shè)計了一系列新功能,這些功能在此前的技術(shù)報告中已初步提及。
現(xiàn)在,用戶可以生成分辨率高達1080p、時長最長20秒的視頻,并支持寬屏、豎屏和正方形等多種畫幅比例。此外,用戶還可以導(dǎo)入自己的素材,用于擴展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
全新的界面設(shè)計讓用戶可以更方便地通過文本、圖像或視頻提示使用Sora。同時,我們的故事板工具允許用戶精確控制每一幀的輸入內(nèi)容。此外,我們還推出了“特色板塊”和“最新動態(tài)”,展示社區(qū)創(chuàng)作者的優(yōu)秀作品并持續(xù)更新。
OpenAI Sora官方使用指南 (來源:網(wǎng)易科技報道)
Sora的訂閱服務(wù)與可用性
Sora已納入ChatGPT Plus訂閱中,用戶無需支付額外費用。每月最多可生成50個視頻,分辨率為480p,或更少數(shù)量的720p視頻。
對于更高需求的用戶,ChatGPT Pro訂閱提供10倍的使用額度,同時支持更高的分辨率和更長的視頻時長。此外,我們正在為不同類型用戶開發(fā)個性化的定價方案,預(yù)計將于明年初推出。
技術(shù)部署與限制
目前推出的Sora版本在一些方面仍存在限制。例如,它可能生成不符合現(xiàn)實的物理效果,并在處理復(fù)雜動作時表現(xiàn)不足。盡管Sora Turbo相比2月份的預(yù)覽版速度快了很多,但我們?nèi)栽谂档图夹g(shù)成本,讓更多用戶可以負擔得起并輕松使用。
我們決定在此階段推出視頻生成技術(shù),是希望社會各界能有時間探索其潛力,并共同制定規(guī)范和安全保障措施,以確保技術(shù)在未來能夠被負責任地應(yīng)用。
所有通過Sora生成的視頻均嵌入了C2PA元數(shù)據(jù),用于標識內(nèi)容來源并提供透明度。這些元數(shù)據(jù)還可用于驗證視頻的真實性。盡管當前技術(shù)尚不完美,我們已默認添加了多項保護措施,例如可見水印。同時,我們開發(fā)了一個內(nèi)部搜索工具,通過生成內(nèi)容的技術(shù)屬性來輔助驗證其是否源自Sora。
目前,我們已屏蔽了一些嚴重濫用形式,例如兒童性虐待材料和深度偽造內(nèi)容。發(fā)布初期,涉及人物的上傳功能將受到限制,但隨著深度偽造緩解措施的改進,我們計劃逐步向更多用戶開放這一功能。
我們希望這個早期版本的Sora能夠激發(fā)用戶的創(chuàng)造力,讓他們探索新的敘事形式,講述自己的故事,并不斷擴展視頻敘事的可能性。我們期待著見證Sora如何塑造全新的創(chuàng)作世界。
評論