当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

5个月前 (04-11)Deepseek应用场景331

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

近3000个假DeepSeek......面对网络乱象,江苏精准狙击不正当竞争行为

近3000个假DeepSeek......面对网络乱象,江苏精准狙击不正当竞争行为

交汇点讯 随着人工智能的快速发展,deepseek的应用热度不断攀升,据不完全统计,仅在其面世两个月内,一些页面高度类似、名称“微加工”的仿冒钓鱼网站已激增至近3000个,误导消费者下载安装。在这些虚...

阿里否认“10亿美元投资DeepSeek”

阿里否认“10亿美元投资DeepSeek”

2月7日,阿里方面否认了投资DeepSeek的传闻。2月7日,阿里巴巴集团副总裁颜乔在朋友圈表示:“同为中国杭州企业,我们为DeepSeek鼓掌,但是外界流传阿里投资DeepSeek的信息是假消息。”...

从钓鱼台到博鳌:“顶流”DeepSeek改变世界的看法

从钓鱼台到博鳌:“顶流”DeepSeek改变世界的看法

“那些对中国科技创新感到惊讶的人,一定是活在石头下,闭上眼睛还捂住了耳朵。”作为AI界的“顶流”,DeepSeek是年后两场高级别论坛的焦点。“DeepSeek不光在性能上接近世界最好的模型,而且成本...

清华免费发布DeepSeek入门手册遭网店打印兜售,团队回应

清华免费发布DeepSeek入门手册遭网店打印兜售,团队回应

近日,清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室团队免费发布的《DeepSeek 从入门到精通》电子文档引发了网友的广泛关注。然而,某电商平台上随后出现出售的打印版,价格超过13元/本,引发...

DeepSeek大模型落地,多个医疗智能体在这家医院上线!

DeepSeek大模型落地,多个医疗智能体在这家医院上线!

湖南日报2月16日讯(全媒体记者 周顺 通讯员 杨正强 陈志明)记者今日从湖南省胸科医院获悉,该院基于国家超级计算长沙中心DeepSeek大模型推理服务,已上线“医学科研小助手”智能体,首次应用于“胸...

DeepSeek走红三个月,第一批想靠它赚钱的怎么样了?

DeepSeek走红三个月,第一批想靠它赚钱的怎么样了?

文 | 螺旋实验室,作者丨安晓,编辑丨坚果 如果你在2023年躲过了Chatgpt,在2024年又躲过了Sora,那么2025年你也很有可能成为DeepSeek的潜在受众,逃不出它天罗密布织...