品玩3月15日讯,Arxiv 页面显示,苹果正式公布了自研多模态大模型 MM1,其参数最高可达 300 亿。
论文显示,MM1多模态大模型由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现 SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。
MM1 在上下文预测、多图像和思维链推理等方面具有不错的表现。同样,MM1 在指令调优后展现出了强大的少样本学习能力。
苹果公布多模态大模型 MM1 ,具备300亿参数
3月15日品玩3月15日讯,Arxiv 页面显示,苹果正式公布了自研多模态大模型 MM1,其参数最高可达 300 亿。
论文显示,MM1多模态大模型由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现 SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。
MM1 在上下文预测、多图像和思维链推理等方面具有不错的表现。同样,MM1 在指令调优后展现出了强大的少样本学习能力。
下载品玩App,比99.9%的人更先知道关于「多模态大模型」的新故事
下载品玩App
比99.9%的人更先知道关于「多模态大模型」的新故事
0 条评论
请「登录」后评论