当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

5个月前 (02-26)Deepseek最新资讯321

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

DeepSeek激发信心,A股渐入佳境

DeepSeek激发信心,A股渐入佳境

本周A股进一步走强,上证综指全周累计上涨1.30%至3346.72点;深综指、创业板综指、科创50、北证50全周分别上涨1.86%、2.57%、0.36%、3.84%。DeepSeek的技术突破提振了...

DeepSeek海关执法应用场景初探

DeepSeek海关执法应用场景初探

人工智能(AI)应用场景越来越广泛,探索将其与海关执法深度融合,或将有效促进海关工作现代化。深度求索(DeepSeek)作为我国自主研发的AI大模型,其在海关领域的应用,可为海关执法智能化转型开辟新路...

学而思学练机接入DeepSeek,AI学习进入“深度思考”时代

学而思学练机接入DeepSeek,AI学习进入“深度思考”时代

在当下教育与科技加速融合的大环境里,学而思学练机凭借一系列务实又极具创新性的举措,正逐步改变着学生日常的学习模式。它积极拥抱前沿技术,在教育AI化的进程中不断探索,力求为广大学生带来更高效、更智能的学...

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

 DeepSeek 一经问世便迅速赢得了众多用户的青睐,彼时,公众对 AI 的强烈需求直接体现在了注册数量上。经过多次迭代,DeepSeek-R1 和 DeepSeek-V3 现已发展成为能够进行深度...

云南电信:携手DeepSeek赋能数字云南建设再升级

云南电信:携手DeepSeek赋能数字云南建设再升级

近日,云南多地政务、教育领域迎来智能化升级新突破。中国电信云南公司携手DeepSeek,通过AI大模型本地化部署,在教育教学、基层社会治理、政务服务等领域打造了一批具有示范效应的创新案例,为推动行业数...

DeepSeek引发国际关注 外交部回应

DeepSeek引发国际关注 外交部回应

据央视新闻消息,2月10日,外交部发言人郭嘉昆主持例行记者会。有记者就深度求索(DeepSeek)引发国际社会广泛讨论一事提问。对此,郭嘉昆表示,具体的专业问题建议你向主管部门了解。我想强调的是,当前...