上市公司年报折射“Token”计费加速落地:云端火热与亏损压力并存考验定价权

问题:从“卖项目”到“卖调用”,Token成为业绩变量 3月末,国内大模型企业披露上市后首份年度财务报告;报告显示,面向开发者与企业客户的开放平台、API服务及企业级智能体等业务增速领先,云端调用需求明显走高;此外,本地化部署仍是营收的重要来源,但增长趋于放缓。“按调用量计费”逐渐成为主流的背景下,Token正从工程侧的计量单位,变成影响收入弹性、毛利结构与客户黏性的关键变量。市场关注点也从“发布了多少模型”转向“调用规模、单价水平与成本曲线”,企业竞争随之从参数与榜单,延伸到商业化能力与定价权的较量。 原因:入口扩大、成本优化、开源扩散共同放大调用量 Token是大模型处理文本与多模态信息的最小计量单元。模型在推理、生成、检索与反馈中持续消耗Token,企业通过API或订阅调用模型能力,按量付费降低了试用门槛和前期投入。随着超级应用、行业软件与智能体产品成为新入口,调用场景从客服、办公、营销更扩展到研发、风控、政务与制造等领域,带动Token需求上升。 同时,国产模型能力提升与工程优化推动单位成本下探,让更多中小企业进入使用链条。开源生态进一步放大扩散效应:模型与工具链被开发者共享、改进并再分发,迭代更快、覆盖更广。入口扩大、成本优化、开源扩散叠加,构成Token消费持续增长的基础,也让“调用量”成为检验商业化成色的重要指标。 影响:云端火热与亏损压力并存,盈利拐点取决于成本与定价 财报显示出明显的“两面性”:一上,云端开放平台业务增长迅速、需求旺盛,部分企业提价后调用热度仍,说明头部模型在特定能力与生态上具备一定稀缺性;另一上,高额研发投入、算力采购与基础设施建设使亏损压力依旧突出,云端规模扩大并不必然带来利润同步改善。 盈利拐点取决于两条曲线:一是单位Token的综合成本曲线,涵盖训练摊销、推理成本、带宽与运营;二是Token单价以及分层服务的定价曲线。若成本下降快于价格下调,或企业能以差异化能力维持价格并获得高端服务溢价,云端业务有望逐步接近盈亏平衡甚至转正。反之,若同质化竞争引发新一轮价格战,规模扩张可能转化为更重的成本负担。 对策:从“标准化商品”走向“分层定价”,并以场景与生态稳住议价权 业内普遍认为,Token难以长期停留单一价格的“标准化商品”形态。更可持续的方向是分层定价与结构化供给:按模型能力(推理深度、上下文长度、多模态能力)、时延与稳定性(SLA)、安全合规与私有知识接入、行业工具链完善度等维度,形成梯度化产品体系,用“高价值Token”撑起利润空间。 为此,企业需要在三上发力:一是持续推进推理加速、算子优化与软硬协同,压低单位成本,形成效率与规模优势;二是以行业智能体、企业工作流与数据闭环提升客户黏性,让调用从“可替代”变为“难替代”;三是做强开发者生态与合作伙伴网络,完善工具、插件与应用市场,降低获客成本并覆盖更多长尾场景。监管与行业层面也需关注数据合规、服务可用性与计费透明度,推动市场在可比、可监管的框架下有序竞争。 前景:竞争焦点将回到“生产力定价权”,基础创新与算力自主仍是关键 从概念走向现实只是开始。Token经济的核心并不只是“按调用付费”,而是围绕智能生产力如何定价与分配展开。未来一段时间,行业大概率会经历“规模扩张—价格调整—分层定价—生态固化”的路径:低门槛调用提升渗透率,高端能力与行业解决方案承载利润空间,平台型企业通过生态与标准争夺议价权。 同时也要看到,调用规模领先不等于底层技术领先。模型架构创新、训练与推理范式升级、核心软硬件能力,以及算力供给的稳定性,将决定长期成本曲线与安全边界。只有在基础创新与关键能力上持续突破,企业才能在全球竞争中稳住定价权与产业主动权。

Token经济的落地正在改写科技产业的估值逻辑——从关注用户规模,转向关注价值创造效率;随着技术红利逐步消退,这场围绕生产力定价权的竞争,将检验企业是否真正打通从实验室到商业化的路径。正如业内人士所言:“未来的赢家不是消耗最多Token的企业,而是能让每个Token产生乘数效应的创新者。”这个进程不仅影响个别公司的财报表现,也将成为中国人工智能产业能否实现高质量发展的重要标尺。