问题——Token消耗快速增长,算力供给结构面临新考验。 随着大模型政务、金融、制造、互联网等场景加速落地,衡量模型调用强度的重要指标Token消耗量持续上升。数据显示,我国日均Token消耗量已达180万亿,意味着模型调用的频次与规模进入新阶段。与早期以训练为主不同,当前新增需求更多来自在线推理、实时交互和规模化部署。推理业务“高并发、低时延、持续运行”,对算力稳定性、成本和能效提出更高要求,也深入加大了数据中心布局、网络传输与算力调度的压力。 原因——应用扩散叠加工程化落地,推动算力从“集中训练”走向“常态服务”。 一上,大模型能力提升与工具链成熟,降低了行业接入门槛,企业从试点验证加速走向生产系统部署;另一方面,用户对智能问答、内容生成、辅助编程、智能客服等需求增长,使推理调用逐步呈现连续化、规模化。同时,数据要素流通与算力调度机制持续完善,“东数西算”推进带来的跨区域协同能力增强,为推理任务更大范围内优化资源配置创造了条件。总体来看,Token增长既来自应用侧需求扩散,也与供给侧基础设施升级同步对应的。 影响——算力基础设施景气度抬升,产业链从机房到芯片同步受拉动。 首先是数据中心与算力服务环节。推理业务更看重稳定运营与持续供给,具备资源、能耗与运维优势的专业数据中心服务商有望获得更多订单并提升机柜利用率。随着算力成为企业数字化、智能化的重要生产要素,“算力即服务”将更普及,算力租赁、混合云部署与边云协同等模式有望加快落地。 其次是服务器与系统集成环节。推理需求增长将带动AI服务器、通用服务器,以及高速网络、存储等配套设备出货,推动整机与系统方案提升迭代。在推理成本更敏感的背景下,集群能效、部署密度与运维自动化将成为竞争焦点,服务器厂商在产品迭代与供应链保障上的重要性进一步上升。 再次是芯片与关键器件环节。近期国际厂商上调服务器CPU价格的市场变化,反映出供需与成本波动对产业链的传导效应,也促使行业更加重视多元供给与自主可控。国产CPU、GPU及相关生态信创与行业市场持续推进,有望在推理侧放量过程中获得更多验证与应用机会。与此同时,RISC-V等开放指令集生态协同正在加强,上游芯片设计、IP、封装测试与软件栈适配的联动价值也在提升。 对策——以“降本增效、统筹布局、强化生态”为抓手夯实算力底座。 业内人士指出,面对推理算力常态化需求,可从以下上持续推进: 一是优化算力基础设施布局与调度能力。依托“东数西算”,推动算力枢纽节点与数据中心集群协同建设,完善跨区域网络时延与传输效率,提升算力资源统筹与弹性调度水平。 二是强化能耗约束下的技术与管理创新。面向高并发推理场景,加快液冷、功耗管理、集群运维自动化等技术应用,改善PUE等关键指标,降低单位Token成本。 三是加快软硬件协同与生态建设。围绕国产CPU/GPU与系统软件、编译器、推理框架、加速库等开展适配优化,推进标准化、模块化部署,降低迁移与集成成本,提升供应链韧性。 四是完善算力服务的安全与合规体系。随着模型服务深入行业核心业务,数据安全、业务连续性与合规要求同步提高,应加强全链路安全防护与容灾体系建设,提升服务可用性。 前景——推理侧将成为算力需求主战场,算力有望从“项目型投入”转向“运营型刚需”。 从趋势看,Token规模增长可能具有持续性,推理需求扩张将推动算力从阶段性建设转向常态化供给,行业竞争也将从“拼规模”逐步转向“拼成本、能效与服务质量”。随着更多企业把模型能力嵌入生产流程,算力基础设施将像电力、网络一样,成为数字经济的重要公共能力。可以预期,围绕数据中心、服务器、芯片与软件栈的产业协同将进一步加深,具备技术积累、资源能力与生态整合能力的企业有望获得更大增长空间。 结语:Token快速增长的背后,是数字经济从“连接”走向“智能”的结构性变化。把算力作为新型基础设施抓紧抓实,关键不在于短期扩容有多快,而在于以更高效率、更低能耗、更强安全保障支撑各行业持续创新。谁能在技术、能源与治理体系上形成综合优势,谁就更可能在新一轮产业变革中赢得主动。
Token快速增长的背后,是数字经济从“连接”走向“智能”的结构性变化。把算力作为新型基础设施抓紧抓实,关键不在于短期扩容有多快,而在于以更高效率、更低能耗、更强安全保障支撑各行业持续创新。谁能在技术、能源与治理体系上形成综合优势,谁就更可能在新一轮产业变革中赢得主动。