当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

4个月前 (07-17)DeepSeek技术交流285

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

DeepGEMM的特点包括哪些?

DeepGEMM的特点包括哪些?

‌DeepGEMM‌是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,由DeepSeek宣布开源。DeepGEMM支持普通和混合专家(MoE)分组的GEMM运算,采用CUDA编写,在安装过程...

专家建议:利用DeepSeek实施“穿透式”监管国企

专家建议:利用DeepSeek实施“穿透式”监管国企

本报记者 索寒雪 北京报道近日,在《国有企业数字化监管的有效性研究:风险防范与效率提升》报告发布会上,天津社会科学院党组成员、副院长王双指出,数字化技术正在推动国有企业监管模式的革新。借助DeepSe...

deepseek被唱衰真凉了?其实它早就潜伏在你身边

deepseek被唱衰真凉了?其实它早就潜伏在你身边

导读•AI导读带你速览精华"你以为deepseek凉了?比亚迪车机、百度阿里都在悄悄用!外媒的‘94%到1%’数据连统计口径都说不清,真正懂行的工程师只在群里调侃‘稳得很’。AI圈就像NBA...

DeepSeek为何引发全民心态变化?刘俏:科技革命催生出新节点产业

DeepSeek为何引发全民心态变化?刘俏:科技革命催生出新节点产业

 正值2025博鳌亚洲论坛召开期间,3月26日,新浪财经、北京大学光华管理学院在博鳌举办“2025博鳌新浪财经之夜”活动,北京大学光华管理学院院长、教授刘俏发表主题为《从国际到国内预测经济走势,中国如...

从DeepSeek、《哪吒2》爆火,透视社交平台传播密码

从DeepSeek、《哪吒2》爆火,透视社交平台传播密码

【洞见·TMT】DeepSeek,火了两个多月了。2025年春节前夕,国产AI大模型DeepSeek以现象级的姿态引发全民讨论。这不仅是一场技术狂欢,更是社交平台与新技术深度融合下的一场价值重构实验。...

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利?要抓住DeepSeek这类AI技术公司的红利,普通人可以从以下几个方向切入,结合自身资源和能力选择最适合的路径:一、成为技术应用的早期参与者抢先体验产品注册成为De...