英伟达发布大模型NVILA，专注于优化准确性和效率-品玩

英伟达发布大模型NVILA，专注于优化准确性和效率

12月9日

品玩12月9日讯，据 analyticsindiamag 报道，英伟达近日发布了名为 NVILA 的全新开放式视觉语言模型系列，该模型专注于优化准确性和效率。

据悉，该模型的训练成本降低了 4.5 倍，微调内存降低了 3.4 倍。此外，它还将预填充和解码的延迟降低了近 2 倍。这些数据都是与 LLaVa OneVision 模型相比得出的，LLaVa OneVision 模型是另一个结合了 Qwen 2 语言模型的大型视觉模型。

从基准测试结果来看，NVILA 在视频基准测试中的表现优于 GPT 4o Mini，与 GPT 4o、Sonnet 3.5 和 Gemini 1.5 Pro 相比，性能更具竞争力。尽管如此，NVILA 的性能仍优于大多数开放式型号。与 Llama 的 3.2 型号相比，它也略胜一筹。

下载品玩App，比99.9%的人更先知道关于「英伟达」的新故事

下载品玩App

比99.9%的人更先知道关于「英伟达」的新故事

AI阅读助手

以下有两点提示，请您注意：
1. 请避免输入违反公序良俗、不安全或敏感的内容，模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务，但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时，您需要自行判断并承担风险；
感谢您的理解与配合

该功能目前正处于内测阶段，尚未对所有用户开放。如果您想快人一步体验产品的新功能，欢迎点击下面的按钮申请参与内测申请内测