微軟開源多模態(tài)AI Agent
《科創(chuàng)板日?qǐng)?bào)》26日訊,今天凌晨3點(diǎn),微軟在官網(wǎng)開源了多模態(tài)AI Agent基礎(chǔ)模型——Magma。與傳統(tǒng)Agent相比,Magma具備跨數(shù)字、物理世界的多模態(tài)能力,能自動(dòng)處理圖像、視頻、文本等不同類型數(shù)據(jù),此外,Magma還能內(nèi)置了心理預(yù)測(cè)功能,增強(qiáng)了對(duì)未來視頻幀中時(shí)空動(dòng)態(tài)的理解能力,能夠準(zhǔn)確推測(cè)視頻中人物或物體的意圖和未來行為。
本文引用地址:http://m.butianyuan.cn/article/202502/467314.htm
評(píng)論