当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

3小时前Deepseek最新资讯13

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

Deepseek推荐全国旅游百强区第3名:云南昆明市盘龙区

Deepseek推荐全国旅游百强区第3名:云南昆明市盘龙区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

科技人才济济的印度,为何搞不出英伟达和DeepSeek?

科技人才济济的印度,为何搞不出英伟达和DeepSeek?

  英国《金融时报》日前的一篇报道,曾发出了一个疑问——印度作为全球顶尖科技人才的“摇篮”,为硅谷输送了无数精英工程师,为何却未能在本土培育出像英伟达或中国DeepSeek这样的尖端科技企...

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

  习近平总书记高度重视文化建设,早在二十多年前,他在浙江工作时对文化就有着深刻的思考与实践,他将“加快建设文化大省”列为“八八战略”重要内容,部署实施了文化大省建设“八项工程”,为浙江文...

迭戈莱昂看起来不会租出去了,这身体太超标了

迭戈莱昂看起来不会租出去了,这身体太超标了

  既然想把阿马斯租出去,那就说明莱昂在曼联更有未来,大概率留队了,阿马斯去年踢的确实不太好,传中都不敢   既然想把阿马斯租出去,那就说明莱昂在曼联更有未来,大概率留队...

即将截止!最新版《清单计价标准》解读与Deepseek新技术在造价全流程应用实务

即将截止!最新版《清单计价标准》解读与Deepseek新技术在造价全流程应用实务

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台将为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理...

429 元 HMD 巴萨联名版 3210 功能机首销,支持 Deepseek A

429 元 HMD 巴萨联名版 3210 功能机首销,支持 Deepseek A

  IT之家 8 月 1 日消息,HMD Global 旗下巴塞罗那足球队联名版 3210 功能手机现已在京东开启首销,这款功能机配备足球队定制外壳、壁纸、系统界面,同时支持支付宝被扫支付...