品玩6月6日讯,据智谱AI 官方消息,GLM-4-9B系列模型现已正式开源,其模型性能全面超越Llama3-8B模型。
GLM-4-9B使用了10T 高质量多语言数据进行训练,数据量是 ChatGLM3-6B 模型的 3 倍以上。同时,采用了 FP8 技术进行高效的预训练,相较于第三代模型,训练效率提高了 3.5 倍,预训练计算量增加了 5 倍。
GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等突出能力。本次开源的GLM-4-9B 系列模型包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。人人都可以到始智社区部署在线体验。
0 条评论
请「登录」后评论