当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯139

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

豆神教育:公司目前已与DeepSeek达成MIT开源协议,获得DeepSeek的官方本地部署授权

豆神教育:公司目前已与DeepSeek达成MIT开源协议,获得DeepSeek的官方本地部署授权

每经AI快讯,有投资者在投资者互动平台提问:贵公司是否和Deepseep合作?豆神教育(300010.SZ)3月17日在投资者互动平台表示,公司2024年10月正式推出的豆神AI APP接入了包括De...

阿里否认“10亿美元投资DeepSeek”

阿里否认“10亿美元投资DeepSeek”

2月7日,阿里方面否认了投资DeepSeek的传闻。2月7日,阿里巴巴集团副总裁颜乔在朋友圈表示:“同为中国杭州企业,我们为DeepSeek鼓掌,但是外界流传阿里投资DeepSeek的信息是假消息。”...

ai.com跳转至DeepSeek

ai.com跳转至DeepSeek

鞭牛士 2月9日消息,近日有网友发现,输入ai.com域名会跳转到DeepSeek官网,以为DeepSeek买了该域名。输入该域名后,跳转至该页面:2023年,OpenAI的ChatGPT风靡全球,a...

信阳市审计局举办DeepSeek专题大数据审计论坛

信阳市审计局举办DeepSeek专题大数据审计论坛

为深入践行科技强审理念,推动审计工作提质增效,2月20日,市审计局举办以人工智能为主题的大数据审计论坛,探讨人工智能技术在审计领域的最新进展及其实际应用。  该局三名年轻大数据审计能手潜心研究、精心准...

政务系统拥抱DeepSeek,会带来哪些改变?

政务系统拥抱DeepSeek,会带来哪些改变?

最近,DeepSeek的“朋友圈”极速扩容。本周起,广东深圳市基于政务云环境面向全市各区各部门,正式提供DeepSeek模型应用服务;在深圳市福田区,70名政务AI“数智员工”已正式上岗。不仅是深圳,...

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型

新国都子公司上海拾贰区信息技术公司相关产品已接入DeepSeek大模型每经AI快讯,新国都2月25日在互动平台表示,DeepSeek为开源大模型,各家厂商均可根据自身需求对其进行模型的适配与本地化部署...