2026年的gtc 大会,黄仁勋在ai全栈布局上的家底,还拉着全球超百家企业和科研机构一起

咱们先把时间拨回到2026年英伟达的GTC大会,那会儿黄仁勋可是把场子给热得足足的。他就着AI基础设施、芯片技术、生态合作还有行业落地这几块儿,给大家伙儿好好梳理了一下英伟达在AI全栈布局上的家底,并且把未来的路数也都摊开讲了。 核心还是集中在怎么把AI推理给做大做强,还有AI工厂这一块的基础设施建设上。这次大会他可是发布了好几款重量级产品,不光是想自己闷头干,还拉着全球超百家企业和科研机构一起动手,这就是要把全行业的AI生态给建起来。黄仁勋在那儿强调,数据才是AI的命根子,结构化的数据是衡量AI的真家伙,这都已经是1200亿美元的大生意了,而且那种没怎么规整过的非结构化数据现在增长得特别快,那才是AI真正要面对的语境。 为了证明这玩意儿管用,他举了好几个例子。雀巢现在的运营数据能做到分钟级刷新,Snap那个A/B实验平台的算力需求也从原来的4.5万个CPU一下子降到了1000个GPU,数据处理的效率提上去了,成本自然也就下来了。 说到硬件这块儿也很猛。Vera Rubin系列直接给推出来了,有Rubin GPU、Vera CPU、BlueField-4 STX这几款核心产品。尤其是Rubin GPU,它那个显存用的是HBM4,算出来的力能达到50 PFLOPs;Groq 3 LPU就把超高内存带宽给打通了,这俩要是结合起来那就是个推理算力的天花板。还有那个NVL72更是了不得,性能能效比翻了十倍,当之无愧的“推理之王”。 为了支撑大规模的推理算力需求,英伟达还搞了个1GW规模的AI工厂架构。每个工厂能塞进30万个GPU,总计算力达到了16 ZFLOPS。这一套系统每秒能处理7亿个令牌,简直就是把规模化的基础设施给铺到了地底下。另外他们还弄出了Space-1 Vera Rubin模块,这就给AI硬件拓展了不少新玩法。 软件和生态这一块也不能落下。英伟达把全栈的AI平台都升级了一遍,cuDNN、NeMo、Cosmos这些框架全都在那儿等着用呢。还专门出了NemoClaw工具包去适配OpenClaw,就是为了帮企业搭专属的智能体平台,想把IT架构的底子从传统的SaaS慢慢转向“智能体即服务”。开源模型Nemotron 3 Super/Ultra在好几项基准测试里都拿了第一,已经成了OpenClaw里最好的开源模型了。 为了这事他们还成立了个Nemotron联盟,带着字节跳动、谷歌云、微软、阿里这些大厂一块儿搞前沿模型研发,覆盖的范围特别广,云计算、零售、制造、医疗、汽车这些全行业都被囊括进来了。 这次大会里黄仁勋也没避讳直接指出了一个事实:AI推理现在已经成了AI时代最核心的活儿了。“令牌”这个概念就好比是新的商品一样。算力转化成企业的收入那是实实在在的东西。英伟达靠着Blackwell+Rubin这个架构加上CUDA云生态死死咬住了全球AI推理规模化市场的大头儿。它那个推理平台不管是输出速度还是能效比都把竞争对手甩在了后面。单单是那个单吉瓦的算力工厂一年就能贡献3000亿美元的营收潜力。 除了这之外他们还做了极致的协同设计工作。从芯片到机架再到整个AI工厂这条线上都能看到性能的提升。他们推出了DSX AI工厂平台来提供液冷、算力调度这些全套的解决方案。这就把企业低能耗、规模化部署AI工厂的路给铺平了。 未来嘛黄仁勋还是会在AI原生技术这块儿继续深耕下去。推动AI往各个行业、各个地方渗透。用AI工厂作为工业基础设施再加上智能体技术开启企业IT的新篇章。同时也会通过开源生态和全球合作巩固自己在全球AI领域标准制定者的地位。