当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

4个月前 (02-26)Deepseek最新资讯241

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

华胜天成公司部分自有产品中部署应用Deepseek

华胜天成公司部分自有产品中部署应用Deepseek

华胜天成公司部分自有产品中部署应用Deepseek每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepS...

DeepSeek:传统体育的未来

DeepSeek:传统体育的未来

传统体育的未来将在传承与创新中寻找平衡,既保留其文化精髓,又通过现代化手段焕发新的活力。以下是传统体育未来发展的主要方向:  1.文化传承与保护  非物质文化遗产保护:传统体育作为文化遗产的重要组成部...

中信银行谷凌云:本月在部分业务中布局了DeepSeek模型

中信银行谷凌云:本月在部分业务中布局了DeepSeek模型

新京报贝壳财经讯(记者姜樊)3月27日,中信银行副行长谷凌云在2024年业绩发布会上表示,在DeepSeek R1发布后,中信银行立即组织了对应的分析和跟进,本月已在部分业务场景中部署了DeepSee...

「撸起袖子加油干 风雨无阻向前行」河北加速DeepSeek落地应用 推动多个行业质效齐升

「撸起袖子加油干 风雨无阻向前行」河北加速DeepSeek落地应用 推动多个行业质效齐升

随着DeepSeek的出圈,新一轮人工智能大模型落地应用的热潮也随之而来。记者探访发现,DeepSeek正在我省加速落地应用,推动多个行业质效齐升。在河北医科大学第一医院,DeepSeek-R1已经完...

《DeepSeek赋能数字政府应用指南》出版发行-电子书将在国内各大数字阅读平台上线

《DeepSeek赋能数字政府应用指南》出版发行-电子书将在国内各大数字阅读平台上线

新华社北京3月21日电 《DeepSeek赋能数字政府应用指南》一书近日由新华出版社出版并面向全国发行。该书电子书将在国内各大数字阅读平台上线。该书由中国经济信息社编写,内容聚焦人工智能技术在数字政府...

工信部谈DeepSeek等大模型“出圈”:我国人工智能产业基础不断夯实

工信部谈DeepSeek等大模型“出圈”:我国人工智能产业基础不断夯实

封面新闻记者 代睿4月18日,国新办举行经济数据例行新闻发布会,介绍2025年一季度工业和信息化发展情况。工业和信息化部总工程师谢少锋在谈到以DeepSeek为代表的国产大模型火爆“出圈”现象时表示,...