当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

4个月前 (02-25)Deepseek最新资讯220

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

不开玩笑,DeepSeek让成人玩具率先受益

不开玩笑,DeepSeek让成人玩具率先受益

 出品 | 妙投APP 作者 | 董必政 头图 | AI制图 Deepseek已经席卷全球。在此之前,代表硬件端侧的AI消费电子,仍是不温不火。 De...

联想DeepSeek一体机月销千台,构建国产AI算力生态

联想DeepSeek一体机月销千台,构建国产AI算力生态

随着全球AI竞争白热化,美国对中国的AI芯片限制一步步升级。据日本瑞穗证券的最新报告,美国正在筹划出台新一轮对华AI芯片管控,继限制高性能AI芯片流入中国市场后,将进一步管制包括英伟达专为中国市场设计...

人工智能新成员Manus和DeepSeek有何区别

人工智能新成员Manus和DeepSeek有何区别

原标题:人工智能新成员Manus和DeepSeek有何区别?近期,一款既能思考问题又能执行任务的“智能体”AI产品——Manus引发广泛关注,它和其他的AI大模型有什么区别,又能做什么呢?一起来看。记...

广东江门:举办DeepSeek大模型专题培训

广东江门:举办DeepSeek大模型专题培训

为帮助干部职工及时掌握前沿人工智能技术,提升数字化办公能力,近日,广东省江门市退役军人事务局举办DeepSeek大模型专题培训。培训会上,老师从DeepSeek简介、如何使用DeepSeek、Deep...

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

《数势科技黎科峰博士:Agent接入DeepSeek,将帮助企业打通数据应用最后一公里》

近日,数势科技创始人兼 CEO 黎科峰博士出席由知名科技媒体InfoQ 策划的 DeepSeek 系列直播系列节目。在直播中,极客邦科技创始人  &CEO 霍太稳对话黎科峰博士,深入探讨了回归...

DeepSeek发布免费网页版服务-DeepSeek发布官方渠道说明:官方网页端与App内不含广告和付费项目

DeepSeek发布免费网页版服务-DeepSeek发布官方渠道说明:官方网页端与App内不含广告和付费项目

自 DeepSeek-R1 模型 1 月 20 日发布至今,已经过去了半个多月的时间。海内外全网都见证了其强大的力量。据悉,官方提供免费的网页版服务,并且其API价格远低于OpenAI o1。这引起了...