当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-24)Deepseek最新资讯182

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek高校上线,智能“助教”为师生深度思考赋能

DeepSeek高校上线,智能“助教”为师生深度思考赋能

国产AI大模型DeepSeek(深度求索)的风,已经吹到了高校。近日,中国人民大学、北京师范大学、北京交通大学等多所高校发布消息,表示正在探索开展有关DeepSeek的实践应用,部分高校已在自主研发的...

深城交:前期已接入DeepSeek并进行深度融合应用

深城交:前期已接入DeepSeek并进行深度融合应用

每经快讯,深城交在互动平台表示,公司前期已接入DeepSeek并进行深度融合应用,包括赋能规划咨询设计、软件代码开发与硬件操控等。...

别踩坑!DeepSeek官方发布声明

别踩坑!DeepSeek官方发布声明

DeepSeek“网课热”背后:消费者是如何被步步“收割”的?随着国产AI大模型DeepSeek的爆火,近期市场上出现大批炒作DeepSeek概念的网络课程,更有卖课机构推出利用DeepSeek“搞钱...

广东多地政府部门接入DeepSeek

广东多地政府部门接入DeepSeek

【广东多地政府部门接入DeepSeek】财联社2月15日电,广东多地政府部门开始在政务系统部署接入DeepSeek。据了解,2月8日,深圳市龙岗区政务服务和数据管理局已经在政务外网部署上线了DeepS...

DeepSeek赋能临床诊疗 医生助手还是有限工具?上海多家医院接连宣布完成DeepSeek的本地化部署

DeepSeek赋能临床诊疗 医生助手还是有限工具?上海多家医院接连宣布完成DeepSeek的本地化部署

目前,上海多家医院接连宣布完成DeepSeek的本地化部署。那么,医院中DeepSeek的实际应用场景都有哪些?对医生来说,它在日常诊疗中的“使用边界”又在哪里?  张践 朱奕上海报道https://...

DeepSeek有哪些优势和不足之处呢

DeepSeek有哪些优势和不足之处呢

DeepSeek的优势和不足之处具体如下:优势性能卓越:语言理解能力强:在多项权威测试中表现出色,能准确把握复杂语句含义。语言生成能力佳:生成的文本自然流畅、逻辑连贯,且生成速度快,每秒可以生成60个...