当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

6个月前 (03-25)Deepseek最新资讯477

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

朱民:大家现在都在讲DeepSeek,这是未来的全球化

朱民:大家现在都在讲DeepSeek,这是未来的全球化

北京商报讯(记者李海媛)3月25日至3月28日,博鳌亚洲论坛2025年年会在海南博鳌举行。3月27日,在“构建开放世界经济:挑战与出路”分论坛中,中国国际经济交流中心副理事长、国际货币基金组织原副总裁...

神州数码郭为:DeepSeek最大贡献在于通过开源推动AI惠普

神州数码郭为:DeepSeek最大贡献在于通过开源推动AI惠普

人民财讯4月3日电,在近日举行的神州数码2024年度业绩说明会上,神州数码董事长郭为表示,DeepSeek最大的贡献和价值在于通过开源,推动了AI的普惠,AI的开源和普惠,给各行各业带来了非常大的机会...

百度的后DeepSeek时代,一切为了应用

百度的后DeepSeek时代,一切为了应用

“模型有很多,但统治这个世界的是应用”,百度创始人李彦宏更直白地表达了对应用的重视。近日召开的Create2025百度AI开发者大会上,百度一口气发布了从模型到应用、生态的“九件套”,包括性能提升价格...

甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

甘肃简牍博物馆导览AI机器人接入DeepSeek大模型每日甘肃网兰州讯(新甘肃·甘肃日报记者 白永萍)近日,甘肃简牍博物馆导览AI机器人“小简”“小牍”正式接入DeepSeek大模型,将以更加智能高效...

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

【新智元导读】DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不...

AI助教上岗啦!多所高校接入DeepSeek

AI助教上岗啦!多所高校接入DeepSeek

今年伊始,来自中国的开源AI模型DeepSeek火爆全球。这段时间,就有不少高校引入了“DeepSeek”,不仅实现了24小时答疑解惑、精准回应校园生活诉求,还大幅提升了老师的办公科研效率,智慧教学与...