品玩

科技创新者的每日必读

打开APP
关闭
品驾

小鹏要把DeepSeek的“知识蒸馏”技术用到智能车端

小鹏的“世界基座模型”,又一场系统性的技术跃迁。

王飞

发布于 4月18日

特斯拉提出“世界模型”之后,行业开始重新思考AI与物理世界的融合路径。而现在,挑战者又出现了。

在2025年4月14日的一场分享会上,小鹏汽车正式披露其自动驾驶核心大脑——720亿参数的“世界基座模型”,并首次公开采用DeepSeek验证过的“知识蒸馏”路径,将超大模型能力迁移至车端。换句话说,小鹏正在尝试通过一场系统性的技术跃迁,为“AI汽车”装上真正的大脑。

这无疑是一次在算力、算法、架构和数据四个层面的全面迭代,也是一场由汽车企业发起的AI时代对垒。过去半年,DeepSeek在AI学术界引发广泛关注——通过“知识蒸馏”技术,它成功将大模型能力压缩进中小模型,实现了性能与效率的平衡突破。现在,小鹏也正在自动驾驶领域探索这一策略。

不同的是,DeepSeek的主战场是数字世界,而小鹏的战场在物理世界——后者的复杂程度显然高得多。自动驾驶不仅需要感知和理解世界,更关键的是要实时做出决策和动作输出。这是一种带有“执行力”和“判断力”的 AI,而不仅仅是语言层面的智能。

小鹏汽车自动驾驶副总裁李力耘在分享会上表示:“我们不仅希望模型会理解,更要会控车,要有大脑,也要有身手。”

早在2024年下半年,小鹏汽车已开始面向L4级别的自动驾驶研发全新的“AI大脑”,即小鹏世界基座模型。

此次亮相的小鹏世界基座模型,参数规模高达720亿(72B),远远超过业内主流VLA模型的20亿左右体量,堪称一次参数级别的断代升级。

据介绍,世界基座模型以大语言模型为骨干网络,融合海量优质驾驶数据进行训练,是一个具备视觉理解、链式推理、动作生成等能力的多模态模型。通过强化学习不断自我进化,未来有望发展出媲美甚至超越人类的自动驾驶能力。

为了训练这一超大模型,小鹏从零搭建了“云端模型工厂”,核心是中国车企首个10EFLOPS、万卡级别智算集群,支持高频率的云端预训练、强化学习、知识蒸馏和车端部署。每轮“云到端”的完整迭代周期仅需5天,最短“车间”甚至可实现每日两次模型更新。

与之配套的是小鹏自研的数据基础设施。小鹏世界基座模型负责人刘博士介绍,多模态模型的训练瓶颈往往不止于GPU,更在于数据访问与吞吐。

为此,小鹏开发了底层的数据基础设施(Data Infra):数据上传带宽提升22倍、训练读取带宽提升15倍,整体训练速度提升5倍。目前,训练所使用的视频数据量已达2000万clips,预计年底增长至2亿clips。

这套工业级 AI 体系,实现了从“原料”到“上车”的模型闭环生产,为智能驾驶注入工程化迭代能力。

李力耘将这套体系称为“软件3.0”:从传统手写代码(1.0)、神经网络主导的软件(2.0),走向“模型生成模型”的新范式。

在这一架构下,小鹏实现三大跃升:

  1. 训练规模突破:720亿参数 × 2亿clips多模态训练数据,构建语言+视觉+行为融合的认知能力;
  2. 强化学习补全长尾场景:不仅通过模仿学习,还建立起三层奖励体系,提升自动驾驶在极端工况下的泛化表现;
  3. 知识蒸馏降低部署门槛:将大模型“提炼”为适配不同芯片的小模型,实现“千人千面”的智能驾驶体验。

值得一提的是,小鹏强化学习系统的设计,来自三个维度的奖励机制:

  • 奖励函数(Reward Function):以“合规、舒适、安全”等规则构建最基础的评价标准,这些原本的“规则遗产”如今转化为AI训练的第一批生产力;
  • 奖励模型(Reward Model):通过真实用户接管数据和市场反馈,构建更连续、多维、可泛化的奖励体系;
  • 世界模型(World Model):不仅用于仿真,还构建起一个能理解并响应外部世界变化的“闭环博弈系统”——例如车辆绕行时,模拟对向车辆的响应,从而更真实地还原交互场景。

在这三重机制作用下,小鹏强化学习系统不仅补强传统模型在安全和复杂场景中的短板,也将物理AI的推理与行动力推向新高度。

强化学习、云端蒸馏等技术的一思路与DeepSeek略有相似:用一个“大老师”培养千个“小学生”,学生足够聪明,且可快速上岗。

在分享会上,小鹏汽车透露,世界基座模型已在后装算力平台完成控车测试:无需规则兜底,模型可独立完成复杂驾驶任务。例如在复杂路口智能避障、非结构化道路自主绕行、在陌生停车场自主寻找车位与出口等测试中,学生模型展现出明显的“拟人化”判断与动作控制能力。这不仅是模仿,更是具备独立认知与决策的具身智能。

对于迈向L3、L4自动驾驶而言,这意味着极具突破性的前景。

不可避免地,小鹏的世界基座模型路径被拿来与特斯拉FSD的“世界模型”对比。

表面看,两者均采用端到端架构、强调自监督学习+世界建模。但小鹏进一步指出,其模型不仅是仿真器,更是一个具备多智能体博弈与闭环反馈能力的主动智能系统。比如在仿真中,当小鹏车辆尝试绕行时,系统不会默认对向车辆静态不变,而是模拟其主动避让反应,提升模拟训练真实性与泛化效果。

世界模型+强化学习训练了云端超大参数基座模型,再蒸馏到车端模型上。根据车端芯片能力,还可以蒸馏适配不同的车端模型除了模型与算法。小鹏还宣布在芯片上完成关键一环,未来希望自研芯片的蒸馏能够通过自己软硬件一体的优化给大家带来事半功倍的效果。

小鹏团队透露,自研芯片将在今年第二季度上车,该芯片为AI大模型定制,集成2个神经网络处理核心,相比通用芯片算力利用率提升20%,最高支持30B参数模型的实时推理执行。

这将大大增强车辆在边缘场景中的即时决策能力,也意味着“车载AI大脑”不再仅依赖云端协同,而可真正“自主运行”。

“可以预见的是,无论是今天的双Orin车型,还是未来自研芯片平台,随着Scaling Law持续生效,AI驾驶体验都将获得长足跃升。”

下载品玩App,比99.9%的人更先知道关于「品驾」的新故事

下载品玩App

比99.9%的人更先知道关于「品驾」的新故事

iOS版本 Android版本
立即下载
王飞

资深作者 线索采集微信:xcodejk关注智能硬件市场及汽车商业领域

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测