品玩3月18日讯,据爱范儿报道,国际权威大模型评测榜单LiveBench放榜,阿里巴巴最新开源的推理模型通义千问 QwQ-32B 冲入全球前五,超过 OpenAI-GPT-4.5 preview、Google-Gemini2.0、DeepSeek-R1 等国内外顶尖模型,成为全球性能最强的开源模型。
据了解,LiveBench 是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对大模型的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性,是业界公认的最权威、最公正的大模型榜单之一。
此前千问 QwQ-32B 开源当天即登顶全球最大的 AI 社区 HuggingFace 模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问 QwQ-32B 还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。

0 条评论
请「登录」后评论