王智:英伟达的未来推理硬件起码会分化成三类

王智认为,英伟达此次在GTC大会上的表态是关键一环。作为行业龙头,这家芯片巨头已经决定彻底转型,不再只是单纯卖硬件,而是要做整个AI系统的服务商。Bill Dally说,未来推理硬件起码会分化成三类。公司创始人黄仁勋抛出了"Token即新大宗商品"的新说法。英伟达正通过五层Token定价体系来应对需求侧的巨大变化。这种定价策略背后,是因为医疗诊断、金融交易和工业质检等场景对算力的要求已经天差地别。 王智指出,这个过程跟软件发展的逻辑很像。以前我们用机器语言写代码,现在有了高级编程语言,就是通过不断抽象化来封装功能。现在英伟达也想在AI算力领域玩这一套,把那些复杂的底层组件打包成标准化模块,让客户像搭乐高积木一样快速搭建系统。这种做法不仅降低了使用门槛,更是在重塑产业竞争格局。 二十年前推出的CUDA平台曾是英伟达的杀手锏。这个编程框架把底层硬件细节都给抽象掉了,让开发者能专心搞算法开发。经过二十年积累,CUDA现在已经形成了巨大的生态壁垒,有数亿装机量、数十万开源项目和庞大的工程师群体撑腰。但这只是第一步,真正的大动作还在后面。 在硬件布局上,英伟达正构筑多维防御体系。传统GPU在训练上强,但在推理上遇到了麻烦。推理任务更看重低延迟和灵活调度,这对CPU性能提出了新要求。为此,英伟达给算力中心专门设计了CPU,还跟Groq展开了合作。Groq开发的LPU芯片用的是SRAM片上集成技术,在存储密集型任务里跑得比传统DRAM方案快得多。 某风险投资人觉得,国内头部算力芯片公司正面临战略抉择:是继续走训练芯片这条路上市,还是转向前景更好的推理市场。这个选择会决定企业能不能突破路径依赖,建立符合中国实际的产品体系。随着领先者优势越来越大,留给后来者的时间窗口正在收窄。 有行业分析师说,英伟达的帝国虽然在扩张,但不可能覆盖所有细分市场。特别是在边缘计算和中等定制化场景里还存在机会空间。可重构计算技术被看作破局的关键。它通过动态调整芯片功能来平衡通用性与专用性。比如工厂质检摄像头,不同生产线的检测指标不一样,可重构芯片就能快速适配这些需求。 国内某半导体企业负责人表示,在这个领域中国跟国际先进水平差距相对较小,而且在定制化场景里有成本和部署速度优势。推理市场的爆发带来了机遇也带来了挑战。数据显示今年春节国内大模型流量激增,部分原因是海外企业为了省钱改用了中国的模型。这就揭示了一个新规律:机器工作流产生的算力需求远超人类对话场景。 某半导体企业负责人说中国在这个领域跟国际先进水平差距不大。这说明在未来的竞争中中国还有机会突围。不过挑战也很大,毕竟领先者优势持续扩大后留给后来者的时间不多了。