人工智能产业快速发展过程中,芯片供应链的稳定与效率正成为影响企业竞争力的关键;近期有关OpenAI与英伟达关系的报道,再次把此议题推到台前。争议的核心集中在推理环节的性能瓶颈。多位知情人士称,OpenAI对英伟达最新推出的部分人工智能芯片在推理阶段的表现并不满意。推理指模型响应用户查询与请求的过程,速度直接决定用户体验。OpenAI的主要不满在于响应速度:在软件开发、系统间通信等特定任务中,英伟达硬件给出结果的速度未达到预期,这一点在OpenAI重点推广的代码生成产品Codex上表现更为明显。 深层原因与芯片架构差异有关。传统英伟达GPU多采用依赖外部存储的架构,而推理任务需要频繁读取数据,导致在部分场景中出现结构性掣肘。相比之下,专为推理设计的芯片,尤其是集成大容量静态随机存取存储器(SRAM)的方案,能够在应对海量请求时带来更快的响应。谷歌自研的张量处理单元等专用芯片已被Anthropic等竞争对手采用,并在特定场景中形成优势。 基于上述判断,OpenAI开始主动寻找替代方案。自去年起,公司与Cerebras、Groq等研发大容量SRAM芯片的初创企业展开接触。今年1月底,OpenAI首席执行官奥尔特曼在电话会议中确认,公司已与Cerebras达成正式合作,以满足客户对编程响应速度的要求。据悉,OpenAI计划通过这类替代方案覆盖约百分之十的推理算力需求。 然而,调整并不顺利。有知情人士透露,OpenAI与芯片企业Groq的合作洽谈受挫:英伟达通过一笔二百亿美元的授权协议锁定Groq的核心技术,并吸纳其芯片设计团队,使双方合作实际上难以推进。这也显示出英伟达在维护市场地位上的强硬姿态。 对于对应的报道,各方很快作出回应。OpenAI发言人表示,公司绝大多数推理算力集群仍由英伟达芯片支撑,且英伟达芯片在推理场景下的性价比依然最好。英伟达则称,客户持续选择其产品用于推理,原因在于其可在规模化部署中提供更优性能与总拥有成本。奥尔特曼也在社交媒体上澄清,称OpenAI乐于与英伟达合作,英伟达生产世界上最好的人工智能芯片,OpenAI希望长期成为其重要客户。 这一事件背后,还牵涉双方巨额投资谈判的迟滞。去年九月,英伟达曾宣布拟向OpenAI注资最高一千亿美元,交易达成后英伟达将获得OpenAI股权,OpenAI则可获得采购高端芯片所需资金。但这笔原本预计数周内完成的交易,谈判实际拖延了数月。知情人士称,在谈判停滞期间,OpenAI已与超威半导体公司及其他企业达成合作,采购可与英伟达竞争的图形处理器。同时,OpenAI产品路线图持续调整,对算力资源的类型需求发生变化,也更拖慢了与英伟达的谈判进度。 从产业视角看,这一动向反映出人工智能芯片市场格局正在变化。英伟达长期形成的主导地位正面临多方挑战:一上,专用芯片特定场景下的优势愈发清晰;另一上,大型科技公司与初创企业加大芯片研发投入,试图改变市场高度集中的局面。多元竞争格局的形成,可能推动技术迭代加速,并带来成本结构的优化。
从训练热潮到推理落地,算力竞赛正在从“拼规模”转向“拼效率”。OpenAI与英伟达的最新动向,折射出大模型产业进入深水区后的现实约束:体验要提升、成本要下降、供给要稳定。未来一段时期,硬件路线之争或将延续,但决定胜负的关键仍在于能否把技术能力转化为可持续的产品与服务能力,并在供给不确定的环境中建立更具韧性的算力体系。