当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

3个月前 (08-21)Deepseek最新资讯302

  8月21日,DeepSeek正式发布其最新版本DeepSeek-V3.1,该版本采用了UE8M0 FP8 Scale的参数精度。据悉,这一技术规格专门为即将发布的下一代国产芯片进行优化设计。

  新版本在技术架构方面实现重要突破,引入了混合推理架构设计。该架构允许单一模型同时支持思考模式与非思考模式两种运行状态。用户可通过官方应用程序或网页端的深度思考按钮自由切换不同模式。

  与此同时,V3.1版本在运行效率方面取得显著提升。相比前代DeepSeek-R1-0528,新版本能够在更短时间内提供响应结果。通过思维链压缩训练技术,模型在输出token数量减少20%至50%的情况下,仍能保持相同的任务表现水平。

  在智能体能力方面,V3.1通过后训练优化实现了质的飞跃。新模型在工具使用、编程任务以及复杂搜索等智能体相关任务中表现获得较大幅度提升。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。

  技术规格方面,V3.1版本将上下文窗口扩展至128K,并新增对Anthropic API格式的支持。API接口同步升级deepseek,提供deepseek-chat与deepseek-reasoner两个不同接口,分别对应非思考模式和思考模式。

  值得注意的是,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。这些调整旨在更好地适配即将推出的国产芯片硬件环境。

  官方应用程序与网页端模型已同步升级为DeepSeek-V3.1版本。据了解,公司计划于2025年9月6日起执行新的API定价方案并取消夜间优惠政策。原文出处:DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构” 的相关文章

独家|对话北京人形机器人创新中心CTO唐剑:世界模型有望带来具身智能的“Deep

独家|对话北京人形机器人创新中心CTO唐剑:世界模型有望带来具身智能的“Deep

  距离唐剑离开学术界,已经过去七年。这七年里,他曾在自动驾驶的一线摸爬滚打,也亲眼见证了AI从“认知”走向“行动”的关键转折。和许多从自动驾驶跨入具身智能的学者与工程师一样,唐剑的轨迹也...

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

DeepSeek据悉计划年底前发布拥有更先进代理功能的人工智能模型

  据知情人士透露,DeepSeek正在开发具有更先进代理功能的人工智能AI模型,以与诸如OpenAI等美国同行在这个技术领域的一个新前沿展开竞争。   知情人士表示,这...

11月4日DeepSeek预测:湖人vs开拓者,东契奇率队复仇,湖人险胜开拓者

11月4日DeepSeek预测:湖人vs开拓者,东契奇率队复仇,湖人险胜开拓者

  NBA常规赛西部焦点战即将打响,洛杉矶湖人将客场挑战波特兰开拓者。两支球队目前分列西部第三和第四,仅相差0.5个胜场,这场比赛对西部排名至关重要。   湖人目前5胜2...

DeepSeek-R2要来了?速领450元代金券,模型测评快人一步!

DeepSeek-R2要来了?速领450元代金券,模型测评快人一步!

  近日,关于DeepSeek-R2计划于8月15日至30日之间发布的消息,在市场上引起了广泛关注。对此,也有接近DeepSeek人士表示该消息不实,DeepSeek-R2在8月内并无发布...

吉大通信股价微跌0.98% 公司回应智慧食堂平台接入DeepSeek

吉大通信股价微跌0.98% 公司回应智慧食堂平台接入DeepSeek

  截至2025年8月13日15时0分,吉大通信股价报10.07元,较前一交易日下跌0.10元,跌幅0.98%。当日开盘价为10.22元,最高触及10.24元,最低下探10.02元,成交量...

10月15日DeepSeek预测:湖人vs太阳,东契奇率队客场复仇

10月15日DeepSeek预测:湖人vs太阳,东契奇率队客场复仇

  北京时间10月15日上午10点,NBA季前赛将迎来焦点战——西部第三的湖人客场挑战第11名的太阳。尽管是热身性质比赛deepseek,但两队10月4日交锋时太阳曾以103-81大胜,此...