OpenAI的文本到視頻工具Sora如何改變科學與社會
上個月OpenAI發(fā)布了其Sora文本到視頻AI工具,這一消息受到了一些研究人員的擔憂和興奮的交織反應,他們擔心這項技術可能被濫用。這家總部位于加州的公司展示了Sora從幾個簡短的文本提示中創(chuàng)建逼真視頻的能力,其中包括一個女人在東京的霓虹燈街道上行走的片段,以及一只狗跳躍在兩個窗臺之間的片段。
英國萊斯特的德蒙特福特大學數(shù)字文化專家特蕾西·哈伍德(Tracy Harwood)表示,她對文本到視頻人工智能(AI)的發(fā)展速度“感到震驚”。一年前,人們還在嘲笑AI制作的美國演員威爾·史密斯吃意大利面的視頻。現(xiàn)在,一些研究人員擔心這項技術可能會在2024年顛覆全球政治。
OpenAI還開發(fā)了ChatGPT和文本到圖像技術DALL·E,于2月15日首次推出了Sora,并宣布將該技術“提供給紅隊以評估可能存在危害或風險的關鍵領域”?!t隊測試’指的是進行模擬攻擊或利用技術的過程,以查看它如何應對現(xiàn)實世界中的惡意活動,比如創(chuàng)造錯誤信息和仇恨內容。
Sora并不是文本到視頻技術的首個示例;其他示例包括紐約市Runway公司去年推出的Gen-2以及谷歌主導的Lumiere,后者于今年1月宣布。哈伍德表示,她對一些其他提供的產(chǎn)品“感到失望”。她說:“它們在呈現(xiàn)給你的東西方面越來越平淡無奇。”她補充說,這些程序需要非常具體的提示才能產(chǎn)生引人入勝的內容。
哈伍德補充說,錯誤信息是這些文本到視頻技術面臨的主要挑戰(zhàn)?!拔覀儗⒑芸鞎_到一個我們被大量看似令人信服的信息淹沒的地步。這真的很令人擔憂?!?/p>
選舉問題
這在即將舉行的選舉中尤其成為問題,包括11月的美國總統(tǒng)選舉和英國即將進行的大選?!皩写罅康募僖曨l和假音頻在流傳,”英國雷丁大學研究生成AI和電影制作的多米尼克·利斯(Dominic Lees)說。2023年10月,英國工黨領袖基爾·斯塔默(Keir Starmer)的假音頻被發(fā)布,而美國總統(tǒng)喬·拜登鼓勵民主黨人不要投票的假音頻在今年1月流傳。
一個解決方案可能是要求文本到視頻AI使用水印,可以是視頻上的可見標記,將其標記為AI,也可以是視頻元數(shù)據(jù)中的人工簽名,但利斯不確定這是否會成功。“目前水印可以被刪除,”他說,并且在視頻元數(shù)據(jù)中包含水印依賴于人們積極研究他們觀看的視頻是否真實。“我不認為我們可以誠實地要求全世界的觀眾在他們看的每個視頻上都這樣做,”利斯說。
這項技術也有潛在的好處。哈伍德表示,它可以用于將難懂的文本,比如學術論文,呈現(xiàn)為更容易理解的格式。“它可能被用來向普通大眾傳達發(fā)現(xiàn),這是它可能被用于的最大的事情之一,”她說?!八梢钥梢暬喈攺碗s的概念。”
另一個潛在的用途可能是在醫(yī)療保健領域,文本到視頻AI能夠代替人類醫(yī)生與患者交流?!坝行┤丝赡軙械讲话?,”英國顧問科學傳播員克萊爾·馬龍(Claire Malone)說?!叭绻麄兿胍惶於啻蜗蜥t(yī)生提問,其他人可能會覺得這非常方便?!?/p>
數(shù)據(jù)管理
哈伍德說,文本到視頻AI工具如Sora可以幫助研究人員處理龐大的數(shù)據(jù)集,比如瑞士日內瓦附近的歐洲粒子物理實驗室CERN和其他大型科學項目產(chǎn)生的數(shù)據(jù)。馬龍說,生成AI可以“篩選出代碼并執(zhí)行研究中的單調任務”,而且還可以進行“更復雜的工作[如]提供數(shù)據(jù)并要求它做出預測”。
創(chuàng)意產(chǎn)業(yè)的從業(yè)人員也提出了一些擔憂。美國演員湯姆·漢克斯去年表示,AI可能使他在死后繼續(xù)出現(xiàn)在電影中,“從現(xiàn)在到天國來臨之前”。利斯說:“如果你是一位雄心勃勃的年輕演員,考慮著自己的未來,而你被告知‘對不起,湯姆·漢克斯將永遠扮演主角’,你會計劃在這個行業(yè)的未來嗎?”
文本到視頻AI將引發(fā)社會面臨的廣泛問題?!拔覀儗⒉坏貌粚W會以前所未有的方式評估我們看到的內容,”哈伍德說?!斑@些工具將媒體內容創(chuàng)作者的機會置于每個人的手中,”她說。“我們將要面對這一后果。這是對物質被消費方式的根本性轉變?!?/p>
評論