当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯263

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek说:为什么感觉时间越过越快?

DeepSeek说:为什么感觉时间越过越快?

关于时间感知随年龄增长而加快的现象,科学界提出了多个理论来解释这一普遍体验。以下是主要原因的解析:1. 记忆密度理论(新异刺激理论)◦ 核心机制:大脑通过存储新体验的数量来衡量时间长度。童年...

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

当警用无人机遇上人工智能会擦出怎样的火花?在郑州街头一场由"无人机+DeepSeek"引领的交通变革正在悄然上演从空中侦察员、安全宣讲员,到事故调解员再到智能调度师郑州交警正在逐步...

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?DeepSeek在金融证券行业的应用十分广泛,主要体现在以下几个方面:一、风险管理与信用评估企业信贷风险分析:整合企业财报、舆情数据、供应链关系等信...

特斯联极特DeepSeek一体机发布,加速智能体商业场景落地

特斯联极特DeepSeek一体机发布,加速智能体商业场景落地

计算成本的加速下降,令大模型持续向端侧及边缘侧落地,越来越多的企业开始尝试用大模型技术实现不同模态数据间的相互理解和转换,催生了智能体的出现。有业内人士表示,智能体或将成为人类充分利用AI的关键所在。...

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条

DeepSeek写材料提示词100条 1常用模板生成1、生成一份标准的......会议通知模板2、撰写关于......工作的请示报告框架3、创建一份年度工作总结模板(包含成绩、不足、计划)4...

为什么作家阿来不用DeepSeek

为什么作家阿来不用DeepSeek

日前,作家、四川省作家协会主席阿来亮相复旦大学,在“人是出发点,也是目的地”主题研讨会间隙接受文汇报记者专访。原标题:《为什么作家阿来不用DeepSeek》...