4月20日,亮相仅3个月的深度推理大模型讯飞星火X1再度升级,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升。
除了在常见通用任务取得显著进步之外,星火X1融入了更多场景复杂类型数据,模型的泛化性也取得了进步,在多个行业任务上展现出了业界领先的能力。在重点行业如教育、医疗、司法等进一步扩大了领先优势。
对于当下中国人工智能产业来说,这称得上是一个鼓舞人心的好消息。
在国家技术自主可控和战略安全的视角下,大模型的全栈自主可控绝非可选项,而是必答题。特别是在医疗、法律、央国企等关键领域,大模型的自主可控直接关系到国家数据安全、技术主权和产业安全。
中国当下几乎所有的国产大模型仍然是基于海外算力底座,算力“卡脖子”问题仍然存在。讯飞星火是唯一基于全国产算力底座训练的大模型。早在大模型研发初期,科大讯飞就与华为紧密合作,坚定选择以国产算力平台为基础训练大模型,从飞星一号到飞星二号,持续构建自主可控的AI技术体系。
这种自主可控的战略价值,在中美科技博弈已进入深水区时愈发凸显。
不久前,美国政府刚刚对英伟达芯片实施新一轮的禁令,要求所有面向中国出售的H20芯片都必须获得许可证。这意味着即便是英伟达此前推出的中国特供版芯片,也将面临出口管制。
在英伟达 H20 芯片禁令全面收紧的背景下,讯飞星火 X1 的升级意义尤为特殊——作为业界唯一基于全国产算力训练的深度推理大模型,其在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。这证明了基于国产算力训练的全栈自主可控大模型,具备登顶业界最高水平的实力和持续创新的潜力。
自主可控这条路并不容易。国产算力探索无前路可循,尽管我国在算法创新上已取得显著进展,但在算子库、工具链、开源框架等基础设施方面尚不完善,国产算力软件生态基础薄弱。
但科大讯飞依然克服了国产化训练的难题,交出一份亮眼答卷。
斯坦福大学最新发布的《2025人工智能指数报告》中,讯飞星火是国内唯一入围MixEval-nard基准测试前十的中文大模型,在所有国产大模型排名第一。
市场也给予积极反馈。去年,讯飞星火拿下央国企中标金额和中标项目的双第一,包括中石油、中石化、中海油等多家央国企单位纷纷选择科大讯飞。今年3月IDC发布的中国央国企大模型市场调研报告中,科大讯飞市场份额位居首位。
在包括医疗、教育、金融、汽车、城市、运营商工业等关键行业和赛道中,科大讯飞持续落地应用并取得广泛成效。今年3月,教育部公布国家智慧教育平台2.0智能版首批筛选的10款AI应用,讯飞星火大模型与北大、清华、复旦等顶尖学院与机构的应用一同入选。
值得一提的是,全新升级的讯飞星火X1在行业实际应用中尤其具有显著优势。
在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。
同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,有效降低了企业AI的定制门槛,使各行业能更便捷地落地AI应用价值。
“2025年,我最希望推动完全自主可控的通用人工智能生态体系建设。”科大讯飞董事长刘庆峰在 2025全国两会期间表示。从科大讯飞坚持自主可控的战略选择背后,我们看到的是中国人工智能产业的崛起与自信。此次讯飞星火X1的全面升级,不仅展示了中国人工智能技术在国产算力平台上的创新突破,也为各行各业数字化转型提供了新的可能。作为基于国产算力训练的大模型代表作,星火X1的表现证明,在技术自主可控的道路上,中国AI已具备与国际顶尖模型同台竞技的实力。
0 条评论
请「登录」后评论