当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek R2有哪些看点和优势?

3个月前 (04-28)DeepSeek技术交流824

三个月前的春节,DeepSeek R1火爆出圈,让“东升西落”成为了随后一段时间的叙事和预期。

三个月后五一临近。DeepSeek R2临近发布时间窗口(预期)。已有“小作文”称R2模型总参数再提升一倍,多模态性能媲美国际竞品。

政策定调+技术破局,这场AI盛宴,你是否准备好了“再次上车”?

周末消息面增量信息较多,美的机器人商业化再进一步、离境退税放宽等,进一步勾勒科技与消费螺旋上升的新图景。

DeepSeek R2快要来了?

昨日晚间,有账号@deedydas在社交媒体平台爆料了深度求索即将发布的下一代AI大模型DeepSeek-R2的参数信息。

根据爆料信息,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),结合了更加智能的门控网络层(Gating Network),以优化高负载推理任务的性能。在MoE架构的加持下,DeepSeek-R2的模型总参数量预计将达到1.2万亿,较之DeepSeek-R1(6710亿参数)提升约1倍。

从规模上来看,DeepSeek-R2与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当。

具体来看,DeepSeek R2的技术突破三大核心:

1.模型架构创新层面,采用自主研制的Hybrid MoE3.0架构,实现1.2万亿动态激活参数(实际计算消耗仅780亿参数),经阿里云实测验证,在处理长文本推理任务时,单位token成本较GPT-4Turbo下降97.3%(数据来源:IDC算力经济模型测算);

2.数据工程,构建覆盖金融、法律、专利等垂直领域的5.2PB高质量语料库,通过多阶段语义蒸馏技术,使指令遵循准确率提升至89.7%(对比测试集:C-Eval2.0);

3,硬件适配突破,其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能(华为实验室验证数据)。

从应用层突破来看,DeepSeek R2在多模态领域实现三大技术迭代:

1)视觉理解模块采用ViT-Transformer混合架构,在COCO数据集物体分割任务中取得92.4 mAP精度,较CLIP模型提升11.6个百分点;

2)工业质检场景中,基于自适应特征融合算法,在光伏EL缺陷检测项目中将误检率压缩至7.2E-6(隆基股份产线实测数据);

3)医疗诊断模块通过知识图谱增强技术,在胸部X光片多病种识别任务中达到98.1%准确率,超越放射科主任医师专家组平均水平的96.3%(北京协和医院双盲测试结果)。

A股,消费与科技之争

四月以来,以机器人、AI算力为主的科技题材股明显回落,而消费股,特别是一些新消费概念股明显走强。时间往前推,春节之后到3月中旬是科技股大涨的时间窗口。整体来看,今年科技与消费各自演绎了一波较大行情。

当前,高层时隔七年再次集体学习人工智能,DeepSeek R2基本也快要发布的时间窗口。政策和技术事件能否共振成为强烈催化剂,吸引资金回流科技板块?

有市场人士称,近期市场风格源于两大核心变量:一是科技股经历一季度快速拉升后估值进入压力区间,部分资金兑现收益转向防御性更强的消费板块;二是经济弱复苏背景下消费刺激政策频出(如以旧换新补贴),形成短期催化。但当前高层集体学习人工智能释放出强烈的政策升级信号,叠加DeepSeek R2等国产大模型迭代节点临近,科技板块有望在政策与技术的双重驱动下重获资金关注。

中金公司研报指出,此次定调较2018年"促进新一代人工智能健康发展"的表述更具实操性,预计后续部委及地方将加速推出场景开放、算力补贴、数据交易等配套政策。中信证券统计显示,2023年各省AI专项政策资金规模约280亿元,而今年在高层定调后,全年扶持资金或突破500亿元,重点向智能驾驶、工业质检等商业化清晰的场景倾斜。

尽管4月科技股遭遇回调,但资金流向显示机构正在逢低布局一些龙头:北向资金近两周逆势加仓中际旭创、沪电股份等算力龙头超15亿元;主动权益基金对TMT板块的配置比例仍低于历史均值约2个百分点,存在增配空间。

野村证券观察到,对冲基金在AI概念股上的空头头寸较3月高点下降27%,显示市场悲观情绪有所缓解。华泰证券认为,当前中证人工智能指数动态市盈率回落至45倍(3月高点为62倍),已进入配置性价比区间。

具体到R2的热门概念股,拓维信息、中科曙光、云赛智联周末关注度较高。

拓维信息:华为昇腾生态核心代工厂,承接Deepseck超算中心50%以上算力基建订单。

中科曙光:为Deepseek提供国产液冷服务器集群,单机柜功率密度达40kW。

云赛智联:为Deepseek搭建政务大模型专用云,已落地15个省级智慧城市项目。

还有三个交易日就是五一小长假,做多要注意控制过节仓位,做好风险管理。

周末,还有哪些增量信息?

1、美的公布人形机器人落地时间表:5月部署工厂,下半年进线下门店

距离上次披露不到40天,美的人形机器人即将进入商业化落地阶段。美的中央研究院智能技术与应用研究所所长、人形机器人创新中心负责人奚伟向透露,美的集团与库卡联合研发的类人形机器人将于今年5月进入工厂,用于机器运维、设备检测和搬运等场景。同时,预计今年下半年,美的人形机器人将陆续进入线下门店,主要用在展示、产品介绍、制作咖啡等场景。

他强调,这些商业化尝试主要体现一些人形机器人的基本能力,并不断通过产品迭代方式解决电池续航、关节轻量化、数据采集和仿真等挑战,他预期还需要至少3-5年的时间,人形机器人才能真正地产业化。

2、商务部:将离境退税起退点从500元下调至200元

商务部有关负责人介绍,这次出台的《关于进一步优化离境退税政策扩大入境消费的通知》将切实解决地方、企业和入境旅客反映的堵点卡点问题,突出针对性和可操作性。优化退税商店布局,鼓励各地在大型商圈、步行街、旅游景区、度假区等境外旅客聚集地增设退税商店。支持具备条件的地区打造一批离境退税特色街区,提升退税商店可及性。将离境退税起退点从500元下调至200元,不断丰富和优化商品供给,增加老字号产品、非遗产品、名优特产、“智能、健康、时尚”消费名品和国货潮品等中国特色优质产品供应。

优化退税办理流程,完善离境退税管理系统,提高商店开单效率,缩短旅客等待时间,将“即买即退”服务措施推广至全国。将现金退税限额由1万元大幅上调至2万元,鼓励相关机构通过移动支付、银行卡、现金等多种方式提供退税服务,更好满足境外旅客多样化支付服务需求。(中国中免)

3、2025年1—3月份全国规模以上工业企业利润增长0.8%

1—3月份,全国规模以上工业企业实现利润总额15093.6亿元,同比增长0.8%。1—3月份,规模以上工业企业中,国有控股企业实现利润总额5599.5亿元,同比下降1.4%;股份制企业实现利润总额11101.5亿元,增长0.1%;外商及港澳台投资企业实现利润总额3883.5亿元,增长2.8%;私营企业实现利润总额3709.7亿元,下降0.3%。

4、乘联分会崔东树:2025年1—3月进口汽车9.5万辆 同比下降39%

乘联分会秘书长崔东树发文称,中国进口车进口量从2017年的124万辆持续以年均8%左右下行,到2023年仅有80万辆。2024年汽车进口70万辆,同比下降12%。2025年1—3月进口汽车9.5万辆,同比下降39%,这是近期少见的1—3月巨大下滑。其中3月进口车3.9万辆,下滑27%,下滑稍有改善。

本文源自:价值线


“DeepSeek R2有哪些看点和优势?” 的相关文章

DeepSeek干什么用的?探索人工智能技术的前沿应用

DeepSeek干什么用的?探索人工智能技术的前沿应用

标题:DeepSeek干什么用的?探索人工智能技术的前沿应用关键词:DeepSeek,人工智能,技术创新,大数据,机器学习,智能分析,产业升级描述:深入了解DeepSeek,这款人工智能应用是如何帮助...

硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署

硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署

【硅基流动:全面支持基于昇腾算力的DeepSeek-R1&V3私有化集群部署】财联社2月15日电,硅基流动联合北京昇腾人工智能计算中心,支持基于昇腾算力的 DeepSeek-R1 &...

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

未来,我们可能需要构建自己的统一计算框架,一旦能够打造好,那国内的GPU芯片生态建设必将向前迈出一大步。腊月二十八那天,中科闻歌董事长王磊跟团队开会到凌晨2点,技术嗅觉敏感的他们一直在讨论DeepSe...

DeepSeek加速推开ASIC时代大门

DeepSeek加速推开ASIC时代大门

近日,DeepSeek研究团队再放大招,公开NSA算法。同日,马斯克发布Grok 3模型,试与DeepSeek和Open AI来比高。此外,Open AI首款AI ASIC芯片即将完成,有望明年量产....

签约6个亿:中国电信董事长柯瑞文谈DeepSeek的高性能、低成本、轻量化和开源为人工智能发展提供前所未有发展机遇

签约6个亿:中国电信董事长柯瑞文谈DeepSeek的高性能、低成本、轻量化和开源为人工智能发展提供前所未有发展机遇

 【通信产业网讯】(记者 崔亮亮)3月25日,中国电信(601728)举行2024年度业绩说明会。针对人工智能对今后增长的提问,中国电信董事长柯瑞文表示,DeepSeek的高性能、低成本、轻量化和开源...

DeepSeek有哪些优势和不足之处呢

DeepSeek有哪些优势和不足之处呢

DeepSeek的优势和不足之处具体如下:优势性能卓越:语言理解能力强:在多项权威测试中表现出色,能准确把握复杂语句含义。语言生成能力佳:生成的文本自然流畅、逻辑连贯,且生成速度快,每秒可以生成60个...