分析師觀點：Sora正式發(fā)布前，多模態(tài)大模型爆發(fā)前夜的10個思考

作者：時間：2024-02-21 來源：IDC

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

OpenAI發(fā)布使用Sora大模型生成的1分鐘短視頻后，正式全面打開了生成式AI的想象空間。盡管目前尚未正式對外開放使用，也無法了解到更多技術細節(jié)，但可以確定的是這一波技術迭代將為AI行業(yè)參與者帶來可觀的機遇。

本文引用地址：http://m.butianyuan.cn/article/202402/455590.htm

在多模態(tài)大模型爆發(fā)前夜，IDC中國研究總監(jiān)盧言霞給出了以下10個思考，供您參考

Sora對于生成式AI的影響：在文生視頻領域真正邁出了第一步，真正做到生成式AI驅動生成短視頻。接下來也將刺激其他科技巨頭加快在該領域的技術攻關力度以及產(chǎn)品發(fā)布速度。

不可預測的未來：具體哪些公司能在什么時間點推出與Sora類似的產(chǎn)品，不可預測。當前Sora生成的是1分鐘的視頻，對于行業(yè)已經(jīng)是重大突破，下一步何時能生成2分鐘5分鐘以上的視頻，不可預測。

最先應用的領域：將最先應用于短視頻、廣告、互娛、影視、媒體等領域。在這些領域采用多模態(tài)大模型能力，輔助人類員工生成視頻，既可以提高生產(chǎn)速度又可以提高生產(chǎn)數(shù)量，還可以創(chuàng)造全新的視覺感受，能夠幫助企業(yè)真正實現(xiàn)降本增效、提升用戶體驗。

哪些公司有潛力快速推出類似產(chǎn)品：幾個最有潛力的群體——在大模型以及AI領域投入最為領先的科技巨頭，如BAT、科大訊飛等；在計算機視覺領域擁有深厚積累的公司，比如商湯、?？狄活惖墓?；以及短視頻類公司；更可大膽想象，也或許會培訓出多模態(tài)大模型的全新創(chuàng)企。

對于AI產(chǎn)業(yè)的影響：大語言模型為AI產(chǎn)業(yè)帶來新的生機，然而語言模型的應用場景有限。要全面打開生成式AI的想象力，還是要依托多模態(tài)大模型。Sora的發(fā)布，以及后續(xù)科技巨頭的跟進，有望對AI產(chǎn)業(yè)帶來再一輪爆發(fā)式的增長。

對于個體的影響：不管您是否感受得到，于個人而言，生成式AI產(chǎn)品已經(jīng)在潛移默化的改變我們的生活方式，每一個人都可以認真考慮該類產(chǎn)品如何能夠助力我們的生活與工作。

生成式AI對于全球數(shù)據(jù)空間的改變：未來5年，生成式AI生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數(shù)量將會越來越平均。而這其中，與圖像文件相關的數(shù)據(jù)量可能是文本文件的 100 倍，視頻文件是圖像文件的 10 倍。整體來看，由于 GenAI 的采用和使用日益增多，近期和遠期所創(chuàng)建數(shù)據(jù)的增長速度都將快于近幾年。

行業(yè)發(fā)展的挑戰(zhàn)：

● 高質量數(shù)據(jù)的稀缺：圖像、視頻類數(shù)據(jù)掌握在少數(shù)公司手中。這些數(shù)據(jù)也需要標注，甚至重新采集，才能用于大模型的訓練。

● 多模態(tài)大模型對算力的消耗更高，算力的可獲取性以及成本將是挑戰(zhàn)之一。

● 頂尖的大模型研發(fā)人才，也是行業(yè)發(fā)展的稀缺資源。

值得關注的事項：多模態(tài)大模型將帶來更嚴峻的安全方面的挑戰(zhàn)。一方面多模態(tài)大模型將讀取更多的圖像、視頻類數(shù)據(jù)，這些圖像視頻數(shù)據(jù)是否合規(guī)是否安全，需要得到保障；另一方面，生成的視頻與真實世界之間的差異，是否會影響到人身安全、社會穩(wěn)定、企業(yè)安全等，也需要注意。

做好準備：大語言模型的研發(fā)歷程已經(jīng)能夠看到數(shù)據(jù)的重要性。在多模態(tài)大模型領域，有數(shù)據(jù)資源的企業(yè)可以考慮如何將這些數(shù)據(jù)開發(fā)成可供模型訓練的數(shù)據(jù)產(chǎn)品，缺乏數(shù)據(jù)資源的企業(yè)也需要盡早收集能夠獲取到的數(shù)據(jù)源。

免責聲明

本文中的內(nèi)容和數(shù)據(jù)均來源于IDC所發(fā)布的報告，所有內(nèi)容及數(shù)據(jù)均為我公司所有。未經(jīng)IDC書面許可，任何機構和個人不得以任何形式翻版、復制、刊登、發(fā)表或引用。

新聞中心

分析師觀點：Sora正式發(fā)布前，多模態(tài)大模型爆發(fā)前夜的10個思考

評論

相關推薦

技術專區(qū)

新聞中心

分析師觀點：Sora正式發(fā)布前，多模態(tài)大模型爆發(fā)前夜的10個思考

評論

相關推薦

技術專區(qū)

分析師觀點：Sora正式發(fā)布前，多模態(tài)大模型爆發(fā)前夜的10個思考