品玩4月10日讯,据 Venturebeat 报道,英伟达发布了一款基于Meta公司旧型号Llama-3.1-405B-Instruct模型的全新完全开源大型语言模型Llama-3.1-Nemotron-Ultra-253B-v1。
Llama-3.1-Nemotron-Ultra-253B-v1是一个密集的2530亿个参数,旨在支持高级推理、指令跟踪和人工智能助手工作流。在今年 3 月举行的 Nvidia 年度 GPU 技术大会(GTC)上,它被首次提及。
该模型代码已在 Hugging Face 上公布,并公开了权重和后期训练数据。该模型设计为在 “推理开启 ”和 “推理关闭 ”两种模式下高效运行,允许开发人员根据系统提示在高复杂度推理任务和更直接的输出之间切换。

0 条评论
请「登录」后评论