首页 > 新闻中心 > 展会报道 > 详情阅读

DeepSeek第二炸：开源首个用于MoE模型训练通信库

2025-02-26 15:26:38 admin

导读：DeepSeek的DeepEP是首个用于MoE模型训练和推理的开源EP通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。
　　2月25日消息，今天是DeepSeek开源周第二日，一早，DeepSeek如约就放出了开源代码库DeepEP王炸。

　　据了解，DeepEP是首个用于 MoE 模型训练和推理的开源EP通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。

　　在这里，简单介绍一下DeepEP的技术性能特点：

　　1、高效通信架构

　　支持优化的全对全通信模式，实现节点内和节点间的NVLink与RDMA互联，提升数据传输效率。

　　2、多精度与调度优化

　　原生支持FP8低精度运算调度，降低计算资源消耗。

　　3、重性能内核

　　据介绍，高吞吐量内核可适用于训练和推理预填充场景，最大化数据处理能力。

　　4、低延迟内核

　　它针对推理解码场景设计，采用纯RDMA通信和自适应路由技术，减少延迟。

　　5、资源控制与重叠机制

　　通过灵活的GPU资源控制策略，实现计算与通信过程的高效重叠，避免资源闲置。

　　6、深度优化场景

　　针对NVLink到RDMA的非对称带宽转发场景进行专项优化，提升异构网络下的传输性能。

　　此外，它还支持SM（Streaming Multiprocessors）数量动态控制，平衡不同任务(如训练与推理)的吞吐量需求。

相关文章推荐

第十九届北京国际智能制造展

2025 年 05 月 21 日- 23 月日

主办方：京尚国际会展

参展地址：中国国际展览中心朝阳馆

最新发布

星光农机获得“一种再生稻收割台及再生稻联合收割机”实用新型专利授权

和利时边缘智能控制技术赋能机场机电系统智慧升级

全国AI企业超420万，春招算法岗需求激增

炬光科技获欧洲知名汽车制造商两个项目定点预计供货突破330万套

中国自研无线皮层脑机接口植入人脑通道数破世界纪录：已完成第三例

未来5年将发射7万颗低轨道卫星中国独占超5万颗

第十九届北京国际智能制造展

时间：2025.05.21-23 地点：中国国际展览中心朝阳馆

主办单位

联系我们: 电话:010-88808897 传真:010-88808867 地址:北京市石景山区八角南路65号融科创意产业中心A座1606

展览负责人：李瑞

销售经理：王雨

第十九届北京国际智能制造展联系我们新闻中心展商品牌获取参观证

京禾展览@京尚国际会展有限公司@京公网安备11010702001733 京ICP备10038152号-10 技术支持：极点科技