当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

6个月前 (03-19)Deepseek应用场景327

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

美团神抢手全面接入DeepSeek

美团神抢手全面接入DeepSeek

3月26日,记者从美团获悉,美团外卖“神抢手”目前已全面接入DeepSeek。消费者可以使用AI进行“缘分测试”,获得商品卖点和健康指引等信息。此前,“神抢手”已经通过DeepSeek上线了AI智能提...

“牵手”端侧,DeepSeek推动AI“个人化”

“牵手”端侧,DeepSeek推动AI“个人化”

“DeepSeek·深一度”系列①接入“朋友圈”不断扩大、全球知名科技公司负责人频繁“点赞”、日活突破3000万……仅用一个春节,DeepSeek应用火爆全球。其中,DeepSeek对端侧AI的影响备...

DeepSeek说:我们打赢关税战了吗?

DeepSeek说:我们打赢关税战了吗?

从2025年5月12日发布的中美联合声明内容来看,双方在关税等问题上取得了阶段性突破,但长期博弈态势仍未改变。结合相关信息分析如下:一、短期成果:关税大幅下调超出预期1. 关税对等削减双方同意将4月2...

中原消金:用DeepSeek解锁消费金融新机遇

中原消金:用DeepSeek解锁消费金融新机遇

近日,国产大模型深度求索(DeepSeek)凭借卓越的性能表现,迅速赢得了金融机构的青睐,在金融业内掀起了一股应用人工智能的新热潮。金融机构纷纷接入DeepSeek,期望在实际业务中开拓新的增长点。截...

德州数字水网牵手DeepSeek,迈向智能水网新篇章

德州数字水网牵手DeepSeek,迈向智能水网新篇章

大众网记者 武红鹏 通讯员 李巍伦 德州报道近日,德州数字孪生水网“智水德州”平台成功接入DeepSeek,通过部署德州水利个性化知识库,为复杂水网调度注入了全新的智能化元素,通过DeepSeek的A...

​快手可灵AI已全面接入DeepSeek-R1

​快手可灵AI已全面接入DeepSeek-R1

快手可灵AI已全面接入DeepSeek-R1。在视频生成、图片生成等场景下,用户可通过DeepSeek协助生成或者优化提示词。在文生视频场景下,DeepSeek灵感版还可以和此前的“灵感词库”功能联动...