当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

8个月前 (03-25)Deepseek最新资讯553

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek“崩上热搜”,官网回应:APP、WEB对话功能已恢复正常

DeepSeek“崩上热搜”,官网回应:APP、WEB对话功能已恢复正常

DeepSeek今日(5月13日)登上微博热搜,不少网友反馈一直在转圈、无法使用。晚间,DeepSeek服务状态页面更新称,APP、WEB对话功能恢复正常,对话历史有概率获取失败。...

浙商银行:已部署DeepSeek并落地多场景应用

浙商银行:已部署DeepSeek并落地多场景应用

上证报中国证券网讯(记者 黄坤)4月17日,上证报记者从投资者互动平台获悉,有投资人向浙商银行提问:贵公司是否已经部署了DeepSeek?浙商银行回应称,该行当前已部署DeepSeek并落地多场景应用...

DeepSeek赋能,美的空调开启 AI 智能新篇

DeepSeek赋能,美的空调开启 AI 智能新篇

2025年初,中国人工智能大模型 DeepSeek火遍全球,让全世界看到了中国AI技术的巨大潜力。国内家电行业也迅速乘上了这股东风,持续探索人工智能大模型与智能家居结合的无限可能性。据悉,家电巨头美的...

钉钉宣布全面接入DeepSeek系列模型

钉钉宣布全面接入DeepSeek系列模型

  2025年2月17日,钉钉正式启动第八届开工节,宣布全面接入DeepSeek系列模型,并推出四大AI礼包,为企业提供“开箱即用”的智能化解决方案,覆盖协同办公、数据处理、应用开发及专属模型定制等领...

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

本文参考报告:《2025中国DeepSeek对AI产业的影响》,首发于头豹科创网。DeepSeek在春节期间刷屏朋友圈,引发了AI产业关于低训练成本、开源与闭源模型选择、模型蒸馏及知识产权等话题的热烈...

腾讯云:腾讯地图等四款产品接入DeepSeek

腾讯云:腾讯地图等四款产品接入DeepSeek

每经快讯,2月17日,腾讯云公布接入DeepSeek新进展:腾讯云AI代码助手、腾讯元器、腾讯乐享和腾讯地图四款产品已接入DeepSeek。其中,腾讯云AI代码助手和腾讯元器全免费、不限量开放;腾讯乐...