CES2026英伟达宣布Vera Rubin平台全面投产,推理性能大幅跃升加速产业落地

当前全球人工智能产业正处于关键转折期。

从生成式AI的大规模应用到智能代理和物理AI的兴起,产业对计算能力的需求呈现出新的特征——不仅要求更强的推理性能,更需要系统性解决长期运行中的算力、网络和存储瓶颈。

在此背景下,英伟达推出的新一代AI计算平台应运而生。

北京时间1月6日凌晨,英伟达CEO黄仁勋在拉斯维加斯CES 2026展会上发表长达90分钟的主题演讲,正式宣布Vera Rubin平台进入全面投产阶段。

这一平台代表了当前AI计算领域的最新进展,也反映了产业发展方向的深刻变化。

从性能指标看,Rubin GPU实现了显著的技术突破。

其推理性能达到Blackwell平台的5倍,搭载第三代Transformer引擎,NVFP4推理算力达到50 PFLOPS。

在训练方面,Vera Rubin平台性能达到前代的3.5倍;HBM4带宽达22TB/s,为Blackwell的2.8倍;晶体管数量增至3360亿个,相比Blackwell增加60%。

这些数据表明,英伟达在芯片工艺、架构设计和系统集成等多个维度都取得了重要突破。

然而,单纯的性能提升还不足以应对产业面临的真实挑战。

黄仁勋在演讲中指出,人工智能的发展重心正从"生成式AI"转向"代理式AI"和"物理AI"。

这意味着AI模型不再仅限于文本生成,而是需要具备主动推理、问题解决和学习自然法则的能力。

为此,Vera Rubin平台采用了六芯片协同设计,集成了Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换机。

这一系统级架构设计的核心目标,是将AI推理成本降至Blackwell平台的十分之一,同时将训练混合专家模型所需的GPU数量减少至四分之一。

在实际应用层面,英伟达展示了多个具体的创新方向。

在机器人领域,英伟达推进了GR00T系列基础模型的发展,支持机器人实时交互和模拟环境学习。

在自动驾驶领域,英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo,这款模型具备链式推理能力,能够理解复杂场景中的因果关系并解释决策逻辑。

首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路,这标志着AI在交通运输领域的商业化应用正在加速推进。

为应对AI智能体长期运行产生的海量上下文数据挑战,英伟达推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。

该平台在GPU高速内存与传统存储之间建立了新的"记忆层",能够将每秒处理令牌数提升最高5倍,确保AI在长时间运行中保持稳定和高效。

新一代DGX SuperPOD系统则能够将多达576个Rubin GPU协同工作,为超大规模AI训练和推理任务提供了集群级解决方案。

在生态建设方面,英伟达大力推动开源AI模型的发展。

扩展后的"Open Model Universe"开源模型库覆盖了机器人、物理AI、生物医学等多个关键领域。

黄仁勋认为,开源AI模型相比最前沿模型落后约6个月,但这一差距正在缩小。

Deepseek R1等开源模型的出现已成为推动全球AI创新的重要催化剂,这表明开源生态正在成为产业创新的重要驱动力。

从市场反应看,Rubin平台的商业前景已初步显现。

截至发布会当日,相关订单已达3000亿美元,这充分说明全球产业界对这一新平台的高度认可和迫切需求。

英伟达此次技术突破不仅是一次算力飞跃,更标志着人工智能从工具向“自主代理”的范式转变。

随着超级计算平台的应用落地,AI将更深层次融入科研、制造与日常生活,重塑全球产业竞争格局。

然而,如何在效率与伦理、创新与安全之间取得平衡,仍是技术发展亟待思考的命题。