CES2026英伟达宣布Vera Rubin平台全面投产，推理性能大幅跃升加速产业落地

当前全球人工智能产业正处于关键转折期。

从生成式AI的大规模应用到智能代理和物理AI的兴起，产业对计算能力的需求呈现出新的特征——不仅要求更强的推理性能，更需要系统性解决长期运行中的算力、网络和存储瓶颈。

在此背景下，英伟达推出的新一代AI计算平台应运而生。

北京时间1月6日凌晨，英伟达CEO黄仁勋在拉斯维加斯CES 2026展会上发表长达90分钟的主题演讲，正式宣布Vera Rubin平台进入全面投产阶段。

这一平台代表了当前AI计算领域的最新进展，也反映了产业发展方向的深刻变化。

从性能指标看，Rubin GPU实现了显著的技术突破。

其推理性能达到Blackwell平台的5倍，搭载第三代Transformer引擎，NVFP4推理算力达到50 PFLOPS。

在训练方面，Vera Rubin平台性能达到前代的3.5倍；HBM4带宽达22TB/s，为Blackwell的2.8倍；晶体管数量增至3360亿个，相比Blackwell增加60%。

这些数据表明，英伟达在芯片工艺、架构设计和系统集成等多个维度都取得了重要突破。

然而，单纯的性能提升还不足以应对产业面临的真实挑战。

黄仁勋在演讲中指出，人工智能的发展重心正从"生成式AI"转向"代理式AI"和"物理AI"。

这意味着AI模型不再仅限于文本生成，而是需要具备主动推理、问题解决和学习自然法则的能力。

为此，Vera Rubin平台采用了六芯片协同设计，集成了Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换机。

这一系统级架构设计的核心目标，是将AI推理成本降至Blackwell平台的十分之一，同时将训练混合专家模型所需的GPU数量减少至四分之一。

在实际应用层面，英伟达展示了多个具体的创新方向。

在机器人领域，英伟达推进了GR00T系列基础模型的发展，支持机器人实时交互和模拟环境学习。

在自动驾驶领域，英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo，这款模型具备链式推理能力，能够理解复杂场景中的因果关系并解释决策逻辑。

首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路，这标志着AI在交通运输领域的商业化应用正在加速推进。

为应对AI智能体长期运行产生的海量上下文数据挑战，英伟达推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。

该平台在GPU高速内存与传统存储之间建立了新的"记忆层"，能够将每秒处理令牌数提升最高5倍，确保AI在长时间运行中保持稳定和高效。

新一代DGX SuperPOD系统则能够将多达576个Rubin GPU协同工作，为超大规模AI训练和推理任务提供了集群级解决方案。

在生态建设方面，英伟达大力推动开源AI模型的发展。

扩展后的"Open Model Universe"开源模型库覆盖了机器人、物理AI、生物医学等多个关键领域。

黄仁勋认为，开源AI模型相比最前沿模型落后约6个月，但这一差距正在缩小。

Deepseek R1等开源模型的出现已成为推动全球AI创新的重要催化剂，这表明开源生态正在成为产业创新的重要驱动力。

从市场反应看，Rubin平台的商业前景已初步显现。

截至发布会当日，相关订单已达3000亿美元，这充分说明全球产业界对这一新平台的高度认可和迫切需求。

英伟达此次技术突破不仅是一次算力飞跃，更标志着人工智能从工具向“自主代理”的范式转变。

随着超级计算平台的应用落地，AI将更深层次融入科研、制造与日常生活，重塑全球产业竞争格局。

然而，如何在效率与伦理、创新与安全之间取得平衡，仍是技术发展亟待思考的命题。