一、算力需求进入爆发拐点,万亿营收目标折射行业趋势 全球智能计算需求持续扩张的背景下,英伟达于2026年3月16日在美国举办GTC年度技术大会。黄仁勋在主题演讲中提出,2025年至2027年三年间,公司数据中心业务累计营收目标为1万亿美元。相比去年大会披露的“两年5000亿美元”目标,该预期明显上调,整体与市场主流判断接近。不过,分析人士认为,市场更关注的仍是更具体的订单信息与客户部署进度。 从行业角度看,大型语言模型的规模化落地正推动推理算力需求进入新一轮增长。不同于训练阶段相对集中的算力投入,推理服务意义在于持续供给、高并发、低延迟等特征,对数据中心吞吐能力与能效提出更高要求。英伟达本次大会的核心叙事,正围绕这一“推理拐点”展开。 二、数据中心向"算力工厂"转型,分层定价体系初现雏形 黄仁勋在演讲中提出,将数据中心定义为“算力工厂”,其输出不再只是传统计算服务,而是以“token”为计量单位的智能结果。 在这一框架下,数据中心受制于物理功率上限(例如1吉瓦),需要在吞吐量与响应速度之间进行更精细的资源调度。英伟达据此提出分层定价思路:从面向大众的免费高吞吐层,到每百万token定价3美元、6美元、45美元,再到面向极致低延迟场景的150美元层级,形成类似大宗商品分级定价的结构。 该定价模型在于,将算力的商业价值与应用场景直接挂钩,既为数据中心运营商提供差异化变现路径,也为英伟达硬件产品线建立更清晰的价值标尺。以同等功率的数据中心为例,新一代Grace Blackwell系统相较上一代Hopper系统可带来约5倍营收提升,而即将量产的Vera Rubin系统预计可在此基础上再提升约5倍。 三、Vera Rubin架构全面升级,工程创新与供应链能力同步兑现 本次大会最受关注的硬件发布之一,是对新一代Vera Rubin系统架构的集中披露。该系统在工程设计上做出多项调整:全面采用液冷方案,以45摄氏度热水冷却替代传统风冷;取消线缆连接,将系统安装时间从两天缩短至两小时;同时引入共封装光学交换机,并与台积电联合研发实现量产。 在处理器层面,Vera CPU采用LPDDR5内存接口,英伟达称其为目前数据中心领域唯一使用该规格的处理器产品。单个计算托盘集成8颗处理器,每颗处理器拥有88个计算核心,单插槽内存带宽达到每秒1.2太字节。英伟达表示,该CPU将作为独立产品线销售,目标培育为数十亿美元规模的业务单元。 进展上,Vera Rubin系统已微软Azure平台完成首批机架部署,显示其正从研发走向商用落地。此外,英伟达供应链已具备每周生产数千套系统的能力,月度产能可达数吉瓦级别,反映其对产能爬坡已做好准备。 四、Groq芯片整合引发关注,软件协同成为关键变量 本次大会另一看点,是英伟达将此前收购的Groq团队有关技术正式纳入产品体系。新推出的Groq 3 LPU由三星代工,预计三季度开始发货。 不过,Groq架构也存在明显约束:单颗Groq芯片仅配备500兆字节静态随机存储器,而单颗Rubin芯片的高带宽内存容量达到288吉字节,差距显著。这意味着Groq芯片若独立运行,难以承载主流大模型的参数规模以及对话记忆缓存需求。 为此,英伟达推出名为Dynamo的推理调度软件,将推理流程拆分为预填充与解码两个阶段,并交由不同硬件协同完成:计算密集型的预填充阶段由Vera Rubin处理;解码阶段中涉及存储与计算并重的注意力机制运算同样由Vera Rubin承担,Groq芯片则在特定环节发挥其高速计算优势。该方案反映了英伟达在异构计算调度与系统整合上的能力。
当算力开始像水电一样按需供给、按性能分级计价,智能化基础设施的形态也在随之改变。英伟达此次发布的技术蓝图,不仅尝试重塑数据中心的经济模型,也预示全球数字经济底座可能进入新一轮重构。在这场长期竞逐中,决定胜负的仍是持续的工程创新与体系化落地能力,而不只是短期指标。