当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

5个月前 (02-26)DeepSeek技术交流362

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

国家超算互联网平台宣布AI生态伙伴加速计划DeepSeek API接口免费使用

国家超算互联网平台宣布AI生态伙伴加速计划DeepSeek API接口免费使用

近日国家超算互联网平台宣布推出“AI生态伙伴加速计划”计划的核心内容包括提供3个月DeepSeek API接口免费使用“超算”+AI推动产业化进程2023年中国科技部启动国家超算互联网部署工作促进超算...

接入DeepSeek之后,企业什么样?

接入DeepSeek之后,企业什么样?

阅读提示随着DeepSeek等人工智能技术的不断成熟,传统企业和行业正站在转型升级的关键节点。这场由技术驱动的变革浪潮,在提升效率和优化成本的同时,也催生出新的商业模式和增长点,为经济发展注入新的动力...

扬州海关政务终端接入DeepSeek

扬州海关政务终端接入DeepSeek

原标题:扬州海关政务终端接入DeepSeek科技日报讯 (尹红燕 单晓明 记者陈瑜)近日,扬州海关依托DeepSeek研发的大模型技术在政务服务领域取得突破,首批3台“扬关小智”智能政务终端正式投入运...

传化智联接入DeepSeek 加速物流产业新质生产力发展

传化智联接入DeepSeek 加速物流产业新质生产力发展

在全国两会热议科技创新与产业升级的背景下,全国人大代表、传化集团董事长徐冠巨提出"大力推动人工智能与产业创新融合,赋能新质生产力发展"的建议,引发物流行业高度关注。徐冠巨指出:&q...

鸿合科技:自研AI平台已接入DeepSeek开源大模型应用于教育场景

鸿合科技:自研AI平台已接入DeepSeek开源大模型应用于教育场景

金融界4月9日消息,有投资者在互动平台向鸿合科技提问:公司有没有对deepseek适配和接入?公司回答表示:公司自主研发AI应用开放平台,并积极推动AI技术在教育场景的应用。目前平台已接入DeepSe...

智能应对多种场景 DeepSeek助力四川环境应急

智能应对多种场景 DeepSeek助力四川环境应急

4月6日,记者从四川省生态环境厅获悉,近日新增一位环境应急“助手”——一款基于DeepSeek大模型与生态环境应急指挥平台深度融合的AI助手。目前,通过阶段性探索,该AI助手已初步形成智能问答、智能分...