当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

8个月前 (03-25)DeepSeek技术交流500

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

DeepSeek预测2025年高考十大热门填报专业,结果让人意外

DeepSeek预测2025年高考十大热门填报专业,结果让人意外

今天,我们一同探讨DeepSeek对2025年高考热门专业的预测,剖析这些专业是否真的具备吸引力,值得广大学子的关注。一、智能科技与大数据——数字经济的支柱智能科技与大数据,作为数字经济的核心领域,正...

淮北市人民政府网站完成DeepSeek大模型接入

淮北市人民政府网站完成DeepSeek大模型接入

日前,市人民政府网站完成DeepSeek大模型接入工作,同步梳理并接入全市政府网站群近153万条海量数据。自上线以来,DeepSeek大模型智能问答累计处理各类咨询、办事等业务请求超1.5万件次,政民...

DeepSeek专题培训会助力民营企业把握AI技术革新机遇

DeepSeek专题培训会助力民营企业把握AI技术革新机遇

为深入贯彻落实党的二十届三中全会精神,促进数字经济与实体经济深度融合,助力民营企业把握人工智能技术革新机遇,近日,怀来县工商联举办以“把握AI浪潮,赋能企业创新,共启智慧未来”为主题的DeepSeek...

西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式

西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式

【西安工业大学研究团队发布基于DeepSeek的智能仿真想定新范式】财联社5月15日电,西安工业大学傅妍芳教授团队近日通过人工智能实现军事仿真想定的自动生成。传统指挥员48小时的编排,AI能用48秒重...

DeepSeek已经给儿童看病了 业内:“D医生”不为建议担责

DeepSeek已经给儿童看病了 业内:“D医生”不为建议担责

DeepSeek热潮下,有人拿它算命,有人用它看病。近日互联网上出现大量用DeepSeek求医问药的帖子,有观点称DeepSeek有三甲医院专家水平,也有不少人对AI看病开方表现出审慎态度。甚至这位“...

中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek,他们究竟要干嘛?

中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek,他们究竟要干嘛?

三大运营商开始在大模型领域角力,究竟哪家实力更强一些?2025年伊始,中国电信、中国移动、中国联通三大运营商相继宣布全面接入DeepSeek,在通信与AI融合领域激起千层浪。银河证券研报指出,三大运营...