当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!

1个月前 (03-26)DeepSeek技术交流98

DeepSeek V3模型完成小版本升级后,李开复称其将中美AI差距缩小至3个月,某些领域中国甚至已经领先。

中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324,以全面升级的技术架构向OpenAI、Anthropic等美国AI领军企业发起挑战。这一跨越式进展不仅彰显中国在人工智能领域的雄心,更将中美AI竞赛推向新高度。

01.AI创始人、前谷歌中国总裁李开复表示,DeepSeek通过算法创新和高效利用国产硬件,显著缩小了与美国领导者如OpenAI的技术差距。这一进展表明,中国在核心AI技术上仅落后美国三个月,甚至在某些领域已处于领先地位。李开复在接受路透社采访时表示:

“此前我认为差距在六到九个月,且全面落后。而现在,我认为在部分核心技术领域仅落后三个月,但在某些特定领域已实现领先。”

今年早些时候,DeepSeek发布了一款基于性能较低芯片训练的AI推理模型,引发了国际关注。该公司声称,该模型仅使用了价值600万美元的算力资源,分布在2000颗英伟达H800芯片上。相比之下,美国公司如OpenAI和Meta在类似项目上投入了数十亿美元。

本周在AI平台Hugging Face上发布的基准测试显示,DeepSeek最新模型DeepSeek-V3-0324在推理和编码等领域表现出竞争力。该模型具备先进的“思维链(chain-of-thought)”可视化功能,这一能力最初由OpenAI开发,但未向用户开放。

相较于前代产品,V3版本在以下维度实现显著提升:

推理能力:通过新型训练架构,解决复杂逻辑问题的效率提升40%

代码生成:在Python等编程语言的自动补全测试中准确率达92%,逼近GPT-4水平

成本优势:仅用价值600万美元的2000块英伟达H800芯片完成训练,成本仅为美国同类项目的1/20

"这不再是追赶游戏,我们正在定义AI的新未来。"DeepSeek技术负责人表示。该模型已向全球开发者开放,其开源策略直指Meta的Llama系列,形成"高性能+低成本"的双重竞争优势。

自2023年12月发布V1版本以来,DeepSeek保持着惊人的迭代速度:

2023.12:推出基础版V1模型

2025.01:发布优化版R1模型聚焦企业场景

2025.03:当前V3版本实现技术代际突破

这种"季度革命"式的更新频率,打破了行业常规的半年至一年升级周期,迫使西方巨头重新评估中国AI的进化速度。

李开复指出:“DeepSeek能够通过新的强化学习方法实现思维链功能,这表明他们正在追赶美国,快速学习,甚至可能更具创新性。”这一发展挑战了关于美国半导体制裁阻碍中国AI技术进步的观点。李开复将制裁描述为“双刃剑”,短期内制造了障碍,但也迫使中国企业在限制下创新。

DeepSeek的崛起引发了硅谷和华盛顿的担忧。这家初创企业的快速进展和资源高效利用,与美国巨头在数据中心和专用芯片上的巨额投资形成鲜明对比。

硅谷企业已提高警惕,Anthropic在其最新融资文件中将中国AI技术列为"最大战略威胁"。与此同时,资本市场开始调整布局,红杉资本等投资机构已设立专项基金,加大对本土AI项目的投入。在商业化应用方面,DeepSeek的技术已成功落地,应用于比亚迪的智能工厂和招商银行的金融风控系统。

咨询机构TechInsight预测,到2025年,中国AI模型在全球开源市场的份额将从当前的15%提升至35%,而DeepSeek有望成为这一领域的代表性中国企业。

QuestMobile所公布的数据显示,DeepSeek APP上线次月,活跃用户规模便一举突破1.8亿。豆包APP也成功破亿,而腾讯元宝、纳米AI搜索在DeepSeek大模型的强大加持下,同样脱颖而出,跻身行业TOP5。


“DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!” 的相关文章

宿州以DeepSeek大模型打通“未来之门”

宿州以DeepSeek大模型打通“未来之门”

未来已来。随着chatGPT等大模型,特别是本土大数据语言模型DeepSeek的横空出世,数字化浪潮汹涌而来,人类进入大数据人工智能时代。进入大数据时代,抓好数字化转型,就是抓住了未来。聚“数”集“算...

Deepseek对百度搜索的冲击有多大?

Deepseek对百度搜索的冲击有多大?

纯从技术出发,Deepseek并没有远胜于国内字节豆包,阿里通义和腾讯元宝,或者微软必应集成的ChatGPT,先行用上AI的这波人本身就不会用百度,但这波国家带动的热度炒作让更多普通人用上新一代的人工...

DeepSeek V3模型重磅升级!腾讯/微美全息加速AI大模型“上车”多场景落地

DeepSeek V3模型重磅升级!腾讯/微美全息加速AI大模型“上车”多场景落地

获悉,3月25日,中国人工智能初创公司深度求索DeepSeek宣布V3版本升级,实测表现远超预期。目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度...

福田汽车:引入deepseek V3模型 应用于研发财务质量等业务

福田汽车:引入deepseek V3模型 应用于研发财务质量等业务

金融界3月14日消息,有投资者在互动平台向福田汽车提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的...

西安高新区DeepSeek场景应用赋能企业高质量发展

西安高新区DeepSeek场景应用赋能企业高质量发展

近日,西安高新区工信局、企业党委“党建+企业会客厅”活动在都市之门成功举办。活动聚焦“向‘新’而行,求‘质’增效——DeepSeek场景应用赋能企业高质量发展”主题,重点破解企业数字化转型中面临的难题...

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

2月19日,江苏镇江举行新闻发布会,正式宣布国产大模型DeepSeek在镇江进行本地化部署。镇江市数据局党组书记、局长周飞在会上表示,“镇江已经建成600台国产算力服务器集群,单日数据处理能力相当于全...