当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

3周前 (04-11)Deepseek应用场景78

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

10万元跑满血版DeepSeek,这家公司掀了一体机市场的桌子

10万元跑满血版DeepSeek,这家公司掀了一体机市场的桌子

DeepSeek一体机,能满足的不止再是情绪价值了。作者|王艺编辑|王博「甲子光年」今日获悉,行云集成电路推出了全新的一体机产品“褐蚁”,仅需10万元就可以跑满血版DeepSeek R1/V3大模型(...

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

2月27日上午,由共青团三明市委、兴业银行三明分行、兴业证券三明分公司等联合举办的“三明青年说”在兴业银行三明分行举行,本次活动以“学习探索DeepSeek技术 赋能青年科技创新”为主题,吸引了团市委...

大连企业发布全国首款公交专属DeepSeek一体机

大连企业发布全国首款公交专属DeepSeek一体机

记者近日从高新区智达科技公司了解到,该公司成功发布基于DeepSeek大模型的公交行业专属一体机Z-AI Cube,为全国首款。智达科技为国家高新技术企业和国家级专精特新“小巨人”企业,专注于“公共交...

广东超40所高校完成DeepSeek教育系统本地化部署,有何影响?你的院校AI了吗?丨AI校园奇遇记

广东超40所高校完成DeepSeek教育系统本地化部署,有何影响?你的院校AI了吗?丨AI校园奇遇记

在人工智能浪潮席卷教育领域之际,新学期伊始,广东多所高校宣布完成DeepSeek-R1大模型的教育系统本地化部署,将这一国产AI大模型融入教学、科研、管理与校园服务场景,为师生提供智能化服务,助力教育...

DeepSeek发布免费网页版服务-DeepSeek发布官方渠道说明:官方网页端与App内不含广告和付费项目

DeepSeek发布免费网页版服务-DeepSeek发布官方渠道说明:官方网页端与App内不含广告和付费项目

自 DeepSeek-R1 模型 1 月 20 日发布至今,已经过去了半个多月的时间。海内外全网都见证了其强大的力量。据悉,官方提供免费的网页版服务,并且其API价格远低于OpenAI o1。这引起了...

DeepSeek R2有哪些看点和优势?

DeepSeek R2有哪些看点和优势?

三个月前的春节,DeepSeek R1火爆出圈,让“东升西落”成为了随后一段时间的叙事和预期。三个月后五一临近。DeepSeek R2临近发布时间窗口(预期)。已有“小作文”称R2模型总参数再提升一倍...