当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-25)Deepseek最新资讯265

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

智领未来,观遍天下!四川观察接入DeepSeek大模型开启智能媒体新时代

智领未来,观遍天下!四川观察接入DeepSeek大模型开启智能媒体新时代

近日,四川观察正式接入DeepSeek,以AI技术赋能内容生产、分发传播、用户互动及安全风控全链条,开启媒体行业“智变”新篇章。此举标志着四川观察在媒体融合与技术创新领域再攀高峰,以“技术+内容”双轮...

贵州金元茶园电厂完成DeepSeek本地化部署

贵州金元茶园电厂完成DeepSeek本地化部署

近日,贵州金元茶园电厂利用现有服务器,成功构建基于DeepSeek-R1人工智能模型的本地知识库,实现检索、校核等基础功能,助力传统火电企业生产管理模式向数字化、智能化转型升级。今年年初,DeepSe...

科大讯飞:公司与DeepSeek无直接或间接股权关系

科大讯飞:公司与DeepSeek无直接或间接股权关系

科大讯飞在互动平台上表示,目前公司与DeepSeek无直接或间接股权关系。(本文来自第一财经)...

OPPO发布首台“直播手机”,深度整合DeepSeek

OPPO发布首台“直播手机”,深度整合DeepSeek

5月15日,OPPO在广东珠海正式推出备受瞩目的Reno14系列手机,搭载更AI的ColorOS 15,深度整合DeepSeek大模型,支持全新小布记忆和升级的AI灵感成片。此次OPPO Reno14...

DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程

DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程

【好课推荐】DeepSeek全攻略:入门到精通附讲解视频本地电脑部署教程 在当今数字化时代,人工智能技术飞速发展,深度学习更是成为了热门领域。DeepSeek作为一款强大的工具,为深度学习爱...

李开复最新预测中国大模型终局,DeepSeek目前势头最强

李开复最新预测中国大模型终局,DeepSeek目前势头最强

近日,零一万物创始人兼CEO李开复在参与一档对话节目时公开表示,DeepSeek掀起的行业变革彻底颠覆了人工智能行业的发展模式,“可能让OpenAI创始人辗转难眠”。他同时预测,中国市场最终可能只剩下...