品玩2月27日讯,据界面新闻报道,微软在官网开源多模态AI Agent基础模型Magma。
据介绍,与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据。
此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。

微软开源多模态AI Agent基础模型Magma
13小时前品玩2月27日讯,据界面新闻报道,微软在官网开源多模态AI Agent基础模型Magma。
据介绍,与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据。
此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。
下载品玩App,比99.9%的人更先知道关于「微软」的新故事
下载品玩App
比99.9%的人更先知道关于「微软」的新故事
0 条评论
请「登录」后评论