OpenAI的文本到視頻工具Sora如何改變科學(xué)與社會(huì)

作者：EEPW 時(shí)間：2024-03-14 來(lái)源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

上個(gè)月OpenAI發(fā)布了其Sora文本到視頻AI工具，這一消息受到了一些研究人員的擔(dān)憂和興奮的交織反應(yīng)，他們擔(dān)心這項(xiàng)技術(shù)可能被濫用。這家總部位于加州的公司展示了Sora從幾個(gè)簡(jiǎn)短的文本提示中創(chuàng)建逼真視頻的能力，其中包括一個(gè)女人在東京的霓虹燈街道上行走的片段，以及一只狗跳躍在兩個(gè)窗臺(tái)之間的片段。

本文引用地址：http://m.butianyuan.cn/article/202403/456327.htm

英國(guó)萊斯特的德蒙特福特大學(xué)數(shù)字文化專家特蕾西·哈伍德（Tracy Harwood）表示，她對(duì)文本到視頻人工智能（AI）的發(fā)展速度“感到震驚”。一年前，人們還在嘲笑AI制作的美國(guó)演員威爾·史密斯吃意大利面的視頻?，F(xiàn)在，一些研究人員擔(dān)心這項(xiàng)技術(shù)可能會(huì)在2024年顛覆全球政治。

OpenAI還開(kāi)發(fā)了ChatGPT和文本到圖像技術(shù)DALL·E，于2月15日首次推出了Sora，并宣布將該技術(shù)“提供給紅隊(duì)以評(píng)估可能存在危害或風(fēng)險(xiǎn)的關(guān)鍵領(lǐng)域”?！t隊(duì)測(cè)試’指的是進(jìn)行模擬攻擊或利用技術(shù)的過(guò)程，以查看它如何應(yīng)對(duì)現(xiàn)實(shí)世界中的惡意活動(dòng)，比如創(chuàng)造錯(cuò)誤信息和仇恨內(nèi)容。

Sora并不是文本到視頻技術(shù)的首個(gè)示例；其他示例包括紐約市Runway公司去年推出的Gen-2以及谷歌主導(dǎo)的Lumiere，后者于今年1月宣布。哈伍德表示，她對(duì)一些其他提供的產(chǎn)品“感到失望”。她說(shuō)：“它們?cè)诔尸F(xiàn)給你的東西方面越來(lái)越平淡無(wú)奇。”她補(bǔ)充說(shuō)，這些程序需要非常具體的提示才能產(chǎn)生引人入勝的內(nèi)容。

哈伍德補(bǔ)充說(shuō)，錯(cuò)誤信息是這些文本到視頻技術(shù)面臨的主要挑戰(zhàn)。“我們將很快會(huì)達(dá)到一個(gè)我們被大量看似令人信服的信息淹沒(méi)的地步。這真的很令人擔(dān)憂?！?/p>

選舉問(wèn)題

這在即將舉行的選舉中尤其成為問(wèn)題，包括11月的美國(guó)總統(tǒng)選舉和英國(guó)即將進(jìn)行的大選?！皩?huì)有大量的假視頻和假音頻在流傳，”英國(guó)雷丁大學(xué)研究生成AI和電影制作的多米尼克·利斯（Dominic Lees）說(shuō)。2023年10月，英國(guó)工黨領(lǐng)袖基爾·斯塔默（Keir Starmer）的假音頻被發(fā)布，而美國(guó)總統(tǒng)喬·拜登鼓勵(lì)民主黨人不要投票的假音頻在今年1月流傳。

一個(gè)解決方案可能是要求文本到視頻AI使用水印，可以是視頻上的可見(jiàn)標(biāo)記，將其標(biāo)記為AI，也可以是視頻元數(shù)據(jù)中的人工簽名，但利斯不確定這是否會(huì)成功?！澳壳八】梢员粍h除，”他說(shuō)，并且在視頻元數(shù)據(jù)中包含水印依賴于人們積極研究他們觀看的視頻是否真實(shí)?！拔也徽J(rèn)為我們可以誠(chéng)實(shí)地要求全世界的觀眾在他們看的每個(gè)視頻上都這樣做，”利斯說(shuō)。

這項(xiàng)技術(shù)也有潛在的好處。哈伍德表示，它可以用于將難懂的文本，比如學(xué)術(shù)論文，呈現(xiàn)為更容易理解的格式?！八赡鼙挥脕?lái)向普通大眾傳達(dá)發(fā)現(xiàn)，這是它可能被用于的最大的事情之一，”她說(shuō)?！八梢钥梢暬喈?dāng)復(fù)雜的概念。”

另一個(gè)潛在的用途可能是在醫(yī)療保健領(lǐng)域，文本到視頻AI能夠代替人類醫(yī)生與患者交流?！坝行┤丝赡軙?huì)感到不安，”英國(guó)顧問(wèn)科學(xué)傳播員克萊爾·馬龍（Claire Malone）說(shuō)。“如果他們想一天多次向醫(yī)生提問(wèn)，其他人可能會(huì)覺(jué)得這非常方便。”

數(shù)據(jù)管理

哈伍德說(shuō)，文本到視頻AI工具如Sora可以幫助研究人員處理龐大的數(shù)據(jù)集，比如瑞士日內(nèi)瓦附近的歐洲粒子物理實(shí)驗(yàn)室CERN和其他大型科學(xué)項(xiàng)目產(chǎn)生的數(shù)據(jù)。馬龍說(shuō)，生成AI可以“篩選出代碼并執(zhí)行研究中的單調(diào)任務(wù)”，而且還可以進(jìn)行“更復(fù)雜的工作[如]提供數(shù)據(jù)并要求它做出預(yù)測(cè)”。

創(chuàng)意產(chǎn)業(yè)的從業(yè)人員也提出了一些擔(dān)憂。美國(guó)演員湯姆·漢克斯去年表示，AI可能使他在死后繼續(xù)出現(xiàn)在電影中，“從現(xiàn)在到天國(guó)來(lái)臨之前”。利斯說(shuō)：“如果你是一位雄心勃勃的年輕演員，考慮著自己的未來(lái)，而你被告知‘對(duì)不起，湯姆·漢克斯將永遠(yuǎn)扮演主角’，你會(huì)計(jì)劃在這個(gè)行業(yè)的未來(lái)嗎？”

文本到視頻AI將引發(fā)社會(huì)面臨的廣泛?jiǎn)栴}。“我們將不得不學(xué)會(huì)以前所未有的方式評(píng)估我們看到的內(nèi)容，”哈伍德說(shuō)?！斑@些工具將媒體內(nèi)容創(chuàng)作者的機(jī)會(huì)置于每個(gè)人的手中，”她說(shuō)?！拔覀儗⒁鎸?duì)這一后果。這是對(duì)物質(zhì)被消費(fèi)方式的根本性轉(zhuǎn)變?！?/p>

新聞中心

OpenAI的文本到視頻工具Sora如何改變科學(xué)與社會(huì)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)