当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek发布更新

1周前 (09-23)Deepseek最新资讯74

  DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂deepseek、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。

  今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

  9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

  在模型迭代方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

  其中,智能体支持能力方面,DeepSeek聚焦热门发展方向对编程智能体、搜索智能体展开测评,测试结果显示,DeepSeek-V3.1相较此前模型均有提升。在编程智能体方面,在代码修复测评SWE-bench(最具代表性的代码修复评测基准之一)等复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。在搜索智能体方面,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能已大幅领先DeepSeek-R1-0528。

  同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

  华安证券研报称,DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨。未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AI Agent商业化场景应用。原文出处:刚刚,DeepSeek发布更新,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek发布更新” 的相关文章

你的主队愿意出多少年薪签老詹?

你的主队愿意出多少年薪签老詹?

  这有啥偷着乐的……现在老詹也不是当年的水平了,来了之后还需要战术地位,再加上一堆詹密詹黑涌进来,社区环境这块算是完蛋了,联盟现在也没必要在哨子方面偏袒他,也不会有啥额外的照顾。非要说的...

DeepSeek-R1训练方法发布!

DeepSeek-R1训练方法发布!

  DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能...

AI帮你打工是种什么体验:测评搭载Deepseek的讯飞AI智能鼠标办公效率

AI帮你打工是种什么体验:测评搭载Deepseek的讯飞AI智能鼠标办公效率

  你有没有想过,有一天你的鼠标不再只是一个点击工具,而是一位坐在你桌边的“全能助理”?它不仅能听懂你的话,还能帮你写报告、做PPT、翻译外语资料,甚至替你开会做记录?...

DeepSeek破解GPT5推理机密 奥特曼破大防

DeepSeek破解GPT5推理机密 奥特曼破大防

  【#DeepSeek破解GPT5推理机密# 奥特曼破大防】#AI Deep Talk#当地时间8月7日,OpenAI官方正式推出了备受外界期待的、性能更强的新一代人工智能模型GPT-5...

直播带货激发图书消费潜力 出版社加速拓展市场新空间

直播带货激发图书消费潜力 出版社加速拓展市场新空间

  中金易云近日发布的一份报告显示,2025年上半年图书市场码洋为468.19亿,同比下降9.64%,降幅较一季度有所扩大。在各类图书零售渠道中,短视频电商渠道依旧是唯一正增长的渠道,增速...

美团大模型来了!开源“长猫”,性能追平DeepSeek V3.1,同样主打“算力

美团大模型来了!开源“长猫”,性能追平DeepSeek V3.1,同样主打“算力

  LongCat-Flash推理速度超过100词元/秒,每处理一百万输出词元的成本仅为0.7美元。该模型不仅在多个方面与DeepSeek V3.1、Qwen3等顶尖模型旗鼓相当,甚至在某...