品玩9月25日讯,据英伟达官方消息,英伟达近日宣布推出 Llama-3.1-Nemotron-51B AI 模型。
该模型根据 Meta 的Llama-3.1-70B 训练而成,该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负荷下,只需要一片 H100 GPU 即可运行,大大降低了内存消耗、计算复杂性以及与运行此类大型模型相关的成本。
英伟达认为这种方式在保持了出色的精度前提下,显著降低了内存占用、内存带宽和 FLOPs,并证明可以在创建另一个更小、更快的变体来加以推广。
0 条评论
请「登录」后评论