当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

掌握AI搜索流量密码:DeepSeek优化排名成为企业增长新引擎

掌握AI搜索流量密码:DeepSeek优化排名成为企业增长新引擎

  10万预算选家用油车,哪些品牌值得考虑?当这个问题抛给AI助手时,企业的品牌是否出现在答案里,正在决定真实的销售机会流向。这不是科幻剧情——中国AI搜索月活用户已突破6.5亿,每天9....

让AI在金融企业落地——2025全球商业创新大会金融专题论坛成功举办!

让AI在金融企业落地——2025全球商业创新大会金融专题论坛成功举办!

  2025年8月16日,在“2025全球商业创新大会”上,用友金融成功举办“让AI在金融企业落地”金融专题论坛。来自银行、证券、保险、租赁等领域的领军企业高管、权威学者与技术专家齐聚一堂...

每日互动股价上涨8.49% 市场关注DeepSeek-R2发布时间传闻

每日互动股价上涨8.49% 市场关注DeepSeek-R2发布时间传闻

  截至2025年8月12日15时28分,每日互动股价报40.88元,较前一交易日上涨3.20元,涨幅8.49%。盘中最高触及42.48元,最低下探37.13元,成交额40.21亿元,换手...

DeepSeek:已在平台内对AI生成合成内容添加标识

DeepSeek:已在平台内对AI生成合成内容添加标识

  9月1日,DeepSeek发布关于AI生成合成内容标识的公告。公告称,为贯彻落实《人工智能生成合成内容标识办法》(2025年9月1日起施行)及《网络安全技术人工智能生成合成内容标识方法...

AI X巡礼︱中国黄金在京启动2025年“金彩中华,智创未来”珠宝首饰设计大赛

AI X巡礼︱中国黄金在京启动2025年“金彩中华,智创未来”珠宝首饰设计大赛

  9月19日,为深入推动人工智能在黄金珠宝行业中的运用,中国黄金集团黄金珠宝股份有限公司(股票中国黄金,代码600916.SH)与中国地质大学(北京)在京联合启动“金彩中华,智创未来”珠...

守正出新,智驭未来:索象集团的2025“定”与“变”

守正出新,智驭未来:索象集团的2025“定”与“变”

  2025年,中国消费市场步入深度结构化调整阶段。伴随疫后经济与社会形态的变迁,行业整体从追求规模扩张转向精细化、分层化运营的新范式。消费者行为理性分化,企业组织持续重构,人才需求结构同...