品玩

科技创新者的每日必读

打开APP
关闭

英伟达发布大模型NVILA,专注于优化准确性和效率

12月9日

品玩12月9日讯,据 analyticsindiamag 报道,英伟达近日发布了名为 NVILA 的全新开放式视觉语言模型系列,该模型专注于优化准确性和效率。

据悉,该模型的训练成本降低了 4.5 倍,微调内存降低了 3.4 倍。此外,它还将预填充和解码的延迟降低了近 2 倍。这些数据都是与 LLaVa OneVision 模型相比得出的,LLaVa OneVision 模型是另一个结合了 Qwen 2 语言模型的大型视觉模型。

从基准测试结果来看,NVILA 在视频基准测试中的表现优于 GPT 4o Mini,与 GPT 4o、Sonnet 3.5 和 Gemini 1.5 Pro 相比,性能更具竞争力。尽管如此,NVILA 的性能仍优于大多数开放式型号。与 Llama 的 3.2 型号相比,它也略胜一筹。

取消 发布

下载品玩App,比99.9%的人更先知道关于「英伟达」的新故事

下载品玩App

比99.9%的人更先知道关于「英伟达」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测