当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

2个月前 (03-03)Deepseek最新资讯147

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

浦东头部企业纷纷接入DeepSeek大模型!“人工智能+”在千行百业加快应用

“deepseek的出现,标志着ai进入‘效率革命’的阶段,开辟了在垂直领域深度赋能的新战场,推动行业竞争焦点从‘参数竞赛’转向‘成本控制与场景适配’。”深耕人工智能领域多年的极豆科技ceo汪奕菲在本...

​与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

​与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

经济观察网 周信/文 2025年2月22日,在“2025全球开发者先锋大会(GDC)”的商汤大模型生产力论坛上,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚发布了行业首个“与世界模型...

DeepSeek应用基础篇:从入门到基本实操(附12个案例与分析)

DeepSeek应用基础篇:从入门到基本实操(附12个案例与分析)

DeepSeek,自2025年春节横空出世,惊艳全球。应时而动,我们积极应用AI,学习DeepSeek提升人机交互协同工作,从而降本增效,高效完成工作。郭朝刚:撰写此篇,作为DeepSeek初学者入门...

景嘉微发布全国产 AI 加固服务器:预置 DeepSeek,开箱即用

景嘉微发布全国产 AI 加固服务器:预置 DeepSeek,开箱即用

IT之家 2 月 16 日消息,国产 GPU 厂商景嘉微昨日推出预置 DeepSeek-R1 模型的全国产加固 AI 服务器,号称“算力自主”“开箱即用”。IT之家附设备参数如下:CPU:64~128...

中海物业接入DeepSeek大模型,推出“海宝AI助手”

中海物业接入DeepSeek大模型,推出“海宝AI助手”

乐居财经 李兰 3月11日,中海物业通过官方微信公众号宣布,正式接入DeepSeek大模型,推出智能化服务平台“海宝AI助手”。该产品通过AI技术深度赋能物业服务全链条,旨在提升运营效率与标...

请整理一份deepseek提示词技巧教程?

请整理一份deepseek提示词技巧教程?

以下是针对DeepSeek提示词设计的系统化教程,从核心原则到进阶技巧,帮助高效引导AI输出:DeepSeek提示词技巧教程一、核心设计原则精准定位任务明确任务类型:创作/分析/计算/设计示例:错误:...