分析師觀點:Sora正式發(fā)布前,多模態(tài)大模型爆發(fā)前夜的10個思考
OpenAI發(fā)布使用Sora大模型生成的1分鐘短視頻后,正式全面打開了生成式AI的想象空間。盡管目前尚未正式對外開放使用,也無法了解到更多技術細節(jié),但可以確定的是這一波技術迭代將為AI行業(yè)參與者帶來可觀的機遇。
本文引用地址:http://m.butianyuan.cn/article/202402/455590.htm在多模態(tài)大模型爆發(fā)前夜,IDC中國研究總監(jiān)盧言霞給出了以下10個思考,供您參考
Sora對于生成式AI的影響:在文生視頻領域真正邁出了第一步,真正做到生成式AI驅動生成短視頻。接下來也將刺激其他科技巨頭加快在該領域的技術攻關力度以及產(chǎn)品發(fā)布速度。
不可預測的未來:具體哪些公司能在什么時間點推出與Sora類似的產(chǎn)品,不可預測。當前Sora生成的是1分鐘的視頻,對于行業(yè)已經(jīng)是重大突破,下一步何時能生成2分鐘5分鐘以上的視頻,不可預測。
最先應用的領域:將最先應用于短視頻、廣告、互娛、影視、媒體等領域。在這些領域采用多模態(tài)大模型能力,輔助人類員工生成視頻,既可以提高生產(chǎn)速度又可以提高生產(chǎn)數(shù)量,還可以創(chuàng)造全新的視覺感受,能夠幫助企業(yè)真正實現(xiàn)降本增效、提升用戶體驗。
哪些公司有潛力快速推出類似產(chǎn)品:幾個最有潛力的群體——在大模型以及AI領域投入最為領先的科技巨頭,如BAT、科大訊飛等;在計算機視覺領域擁有深厚積累的公司,比如商湯、??狄活惖墓?;以及短視頻類公司;更可大膽想象,也或許會培訓出多模態(tài)大模型的全新創(chuàng)企。
對于AI產(chǎn)業(yè)的影響:大語言模型為AI產(chǎn)業(yè)帶來新的生機,然而語言模型的應用場景有限。要全面打開生成式AI的想象力,還是要依托多模態(tài)大模型。Sora的發(fā)布,以及后續(xù)科技巨頭的跟進,有望對AI產(chǎn)業(yè)帶來再一輪爆發(fā)式的增長。
對于個體的影響:不管您是否感受得到,于個人而言,生成式AI產(chǎn)品已經(jīng)在潛移默化的改變我們的生活方式,每一個人都可以認真考慮該類產(chǎn)品如何能夠助力我們的生活與工作。
生成式AI對于全球數(shù)據(jù)空間的改變:未來5年,生成式AI生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數(shù)量將會越來越平均。而這其中,與圖像文件相關的數(shù)據(jù)量可能是文本文件的 100 倍,視頻文件是圖像文件的 10 倍。整體來看,由于 GenAI 的采用和使用日益增多,近期和遠期所創(chuàng)建數(shù)據(jù)的增長速度都將快于近幾年。
行業(yè)發(fā)展的挑戰(zhàn):
● 高質量數(shù)據(jù)的稀缺:圖像、視頻類數(shù)據(jù)掌握在少數(shù)公司手中。這些數(shù)據(jù)也需要標注,甚至重新采集,才能用于大模型的訓練。
● 多模態(tài)大模型對算力的消耗更高,算力的可獲取性以及成本將是挑戰(zhàn)之一。
● 頂尖的大模型研發(fā)人才,也是行業(yè)發(fā)展的稀缺資源。
值得關注的事項:多模態(tài)大模型將帶來更嚴峻的安全方面的挑戰(zhàn)。一方面多模態(tài)大模型將讀取更多的圖像、視頻類數(shù)據(jù),這些圖像視頻數(shù)據(jù)是否合規(guī)是否安全,需要得到保障;另一方面,生成的視頻與真實世界之間的差異,是否會影響到人身安全、社會穩(wěn)定、企業(yè)安全等,也需要注意。
做好準備:大語言模型的研發(fā)歷程已經(jīng)能夠看到數(shù)據(jù)的重要性。在多模態(tài)大模型領域,有數(shù)據(jù)資源的企業(yè)可以考慮如何將這些數(shù)據(jù)開發(fā)成可供模型訓練的數(shù)據(jù)產(chǎn)品,缺乏數(shù)據(jù)資源的企業(yè)也需要盡早收集能夠獲取到的數(shù)據(jù)源。
免責聲明
本文中的內(nèi)容和數(shù)據(jù)均來源于IDC所發(fā)布的報告,所有內(nèi)容及數(shù)據(jù)均為我公司所有。未經(jīng)IDC書面許可,任何機構和個人不得以任何形式翻版、復制、刊登、發(fā)表或引用。
評論