当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

2个月前 (02-25)Deepseek最新资讯150

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

为什么作家阿来不用DeepSeek

为什么作家阿来不用DeepSeek

日前,作家、四川省作家协会主席阿来亮相复旦大学,在“人是出发点,也是目的地”主题研讨会间隙接受文汇报记者专访。原标题:《为什么作家阿来不用DeepSeek》...

DeepSeek-R1“思维学”;苹果:原生多模态模型的Scaling Laws|今日热门论文

DeepSeek-R1“思维学”;苹果:原生多模态模型的Scaling Laws|今日热门论文

速览热门论文1.DeepSeek-R1“思维学”2.苹果:原生多模态模型的 Scaling Laws3.7B 模型超越 o1!视觉推理新突破:所需样本少,还能自提升4.MIT 团队提出“自我引导”LM...

光迅科技:Deepseek应用将推动高速光模块需求

光迅科技:Deepseek应用将推动高速光模块需求

金融界4月2日消息,有投资者在互动平台向光迅科技提问:您好,请问deekseep的崛起对公司有哪些利好?公司芯片能否用在deekseep上是否有合作?公司回答表示:Deepseek的广泛应用将有力推动...

DeepSeek引发国际关注 外交部回应

DeepSeek引发国际关注 外交部回应

据央视新闻消息,2月10日,外交部发言人郭嘉昆主持例行记者会。有记者就深度求索(DeepSeek)引发国际社会广泛讨论一事提问。对此,郭嘉昆表示,具体的专业问题建议你向主管部门了解。我想强调的是,当前...

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

DeepSeek+腾讯双重龙头!“强得可怕”,连创历史新高!

云计算利好频出。2月18日,A股主要指数集体调整。截至收盘,沪指跌0.93%,深证成指跌1.61%,两大科创指数跌幅均在2%左右水平。沪深两市成交额接近1.8万亿元,较昨日缩量逾千亿。行业板块呈现普跌...

关于DeepSeek的常见误区与真相

关于DeepSeek的常见误区与真相

最近,DeepSeek火得有点不讲道理。从我的朋友圈到国外媒体,从华尔街到硅谷,几乎所有人都在热议这个中国AI新秀。560万美元训练成本、开源大模型、链式推理能力、股市动荡...故事真是越讲越玄乎,热...