DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 10:51 星期二
【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
XZY落子无悔回复1年前·云南3
DeepEP通信库的冲击核心在于:通过开源技术降低AI开发成本与硬件依赖,直接威胁依赖高算力投入和高溢价的科技企业,短期内美股GPU制造商、云计算巨头及闭源AI公司,可能面临估值调整压力,长期看,开源生态的崛起会重塑全球AI产业竞争格局。
cls1888888回复1年前·福建4
牛逼!国之重器!