当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

5个月前 (02-25)Deepseek最新资讯302

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

15+车企怕掉队,紧急宣布接入DeepSeek

15+车企怕掉队,紧急宣布接入DeepSeek

DeepSeek火爆全球,凭借一己之力,戳破英伟达算力“泡沫”,以低成本、开源、免费的形式“哪吒闹海”。这个中国的AI助手,拥有媲美ChatGPT的能力,甚至让美国战略部门高度重视。面对DeepSee...

政务系统拥抱DeepSeek,会带来哪些改变?

政务系统拥抱DeepSeek,会带来哪些改变?

最近,DeepSeek的“朋友圈”极速扩容。本周起,广东深圳市基于政务云环境面向全市各区各部门,正式提供DeepSeek模型应用服务;在深圳市福田区,70名政务AI“数智员工”已正式上岗。不仅是深圳,...

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

沈阳市注评行业党委举办DeepSeek专题培训班,以科技赋能行业提质增效

为提升注册会计师和资产评估行业从业人员专业能力与新技术应用水平,促进DeepSeek技术在注评行业内的普及与应用,沈阳市注评行业党委分阶段、分主题开展沈阳市注评行业DeepSeek专题培训班,通过前沿...

两连板宏景科技:与“DeepSeek”暂无业务合作

两连板宏景科技:与“DeepSeek”暂无业务合作

【两连板宏景科技:与“DeepSeek”暂无业务合作】财联社2月14日电,宏景科技发布股票交易异常波动公告,近期公司经营情况正常,内外部经营环境未发生重大变化。截至目前,公司主营业务未发生变动,公司作...

DeepSeek:如何把留学花的300万赚回来

DeepSeek:如何把留学花的300万赚回来

在当今全球化的时代,越来越多的中国家庭选择将孩子送出国留学,希望通过优质的教育资源为孩子铺就一条通往成功的道路。然而,留学费用动辄数百万元,尤其是对于普通家庭来说,这无疑是一笔巨大的投资。面对300万...

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?

DeepSeek在医疗诊断中的具体应用有哪些?思考和行动过程用户希望了解DeepSeek在医疗诊断中的具体应用。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能在医...