品玩2月25日讯,DeepSeek开源全新项目 DeepEP,这是一个面向MoE模型训练与推理的开源EP通信库,专门针对Hopper GPU(未来可能支持更多架构或设备)优化通信效率。
DeepSeek 优化了速度和效率,支持低精度操作如 FP8,这是一种计算更快但精度稍低的数字表示方式,类似于用更简单的工具完成任务。
它还针对特定的硬件连接(如 NVLink 和 RDMA)进行了优化,这些是 GPU 之间的高速通信方式,确保在大规模 AI 项目中通信效率最高。

DeepSeek 开源新项目 DeepEP,解锁MoE模型通信瓶颈
4小时前品玩2月25日讯,DeepSeek开源全新项目 DeepEP,这是一个面向MoE模型训练与推理的开源EP通信库,专门针对Hopper GPU(未来可能支持更多架构或设备)优化通信效率。
DeepSeek 优化了速度和效率,支持低精度操作如 FP8,这是一种计算更快但精度稍低的数字表示方式,类似于用更简单的工具完成任务。
它还针对特定的硬件连接(如 NVLink 和 RDMA)进行了优化,这些是 GPU 之间的高速通信方式,确保在大规模 AI 项目中通信效率最高。
下载品玩App,比99.9%的人更先知道关于「DEEPseek」的新故事
下载品玩App
比99.9%的人更先知道关于「DEEPseek」的新故事
0 条评论
请「登录」后评论