智谱公开致歉并推出补偿方案 GLM-5分层策略引发用户关切

问题—— 近期，部分订阅 GLM Coding Plan 的用户集中反馈：模型“消耗变快”、用量看板更新延迟、套餐升级与计费规则不够清楚，加之新模型开放节奏不稳定，影响了用户对成本与可用性的预期；对此，智谱发布致歉说明，称规则展示、发布节奏以及存量用户承接机制上“考虑不周”，并公布处理与补偿方案。原因—— 一是产品分层与计费说明存在信息落差。智谱表示，GLM-5 参数规模较上一代明显提升，定位为处理复杂任务的更高规格模型，因此采用分层计费：日常任务优先推荐 GLM-4.7；GLM-5 在高峰期按更高倍数计费，非高峰期按相对较低倍数计费。虽然倍数规则已提前制定，但在用户购买和使用前未能清楚说明“为何倍增、何时倍增、如何选择”，导致体验与预期不一致。二是供给侧扩容与风险对抗不足。智谱在说明中提到，GLM-5 发布后访问量超出预期，同时灰产账号、“号池”、倒卖等行为挤占资源，导致集群在高峰时段承压。为保障整体可用性，公司采取按 Max、Pro、Lite 分层逐步开放的应急策略，但灰度节奏偏慢，加之负载波动带来的限流提示，使部分用户产生“付费但不可用”的感受。三是存量用户迁移设计不够细致。新旧套餐并行期间，部分用户短时间内从旧套餐升级到新套餐，出现“误操作”或“误触发”，暴露出升级路径、权益对比与风险提示仍需完善。影响—— 对用户而言，计费不确定和看板延迟会抬高试错成本，影响开发排期、预算控制与模型选型判断，高频调用的开发者和小团队感受更明显。对企业而言，规则不透明容易放大舆情与信任损耗；若不能及时解释分层逻辑并稳定供给，将影响新模型口碑与商业化节奏。对行业而言，大模型服务正从“能力竞赛”转向“工程与运营能力竞争”，算力供给、风控治理、计费披露与客户支持已成为衡量平台成熟度的重要指标。对策—— 围绕用户关切，智谱提出整改与补偿安排：其一，提升规则透明度。公司称已在购买页面更完整展示消耗倍数、分层策略等关键信息，并将继续优化表述，降低理解成本，方便用户在“效果—成本—时段”之间作出选择。其二，加快用量信息更新。针对“看板延迟”，智谱表示已将用量看板刷新频率从约 1 小时一次提升至约 10 分钟一次，减少信息滞后带来的决策偏差。其三，优化开放节奏与体验保障。智谱称将加快资源扩容与服务优化：Max 用户已全面开放；Pro 用户已开放，但高峰期可能因负载出现限流；Lite 用户将于节后在非高峰期逐步灰度开放。同时，公司将加强对灰产账号与倒卖行为的治理，减少对正常用户的资源挤占。其四，推出补偿与纠错机制。公司明确，受影响的 Lite 和 Pro 用户可自主申请退款，按特定时间段费用“请客”的原则执行；对 2 月中旬因升级机制导致从旧套餐误升新套餐的用户，支持一键回滚，降低因机制不完善产生的额外成本。前景—— 从趋势看，随着模型能力提升与调用规模扩大，平台运营需要在三上建立更稳的机制：其一，用更直观方式披露计费规则与时段策略，形成可预测的成本体系；其二，通过弹性扩容、负载调度与分级保障提升峰值稳定性，减少“高峰不可用”；其三，加强账号风控与交易治理，遏制灰产对公共资源的挤占。对企业而言，能否将“能力上线”同步落到“服务可用、规则易懂、成本可控”，将决定新一代模型从发布走向规模化落地的速度与质量。

智谱科技此次事件的处置，既检验了企业的责任边界，也为行业提供了一个现实参照：当大模型进入规模化服务阶段，技术之外的透明度、可用性与用户体验同样关键；在人工智能深度重塑生产与协作方式的当下，只有在更规范、可解释的框架下推进创新，才能减少误解与摩擦，真正释放技术价值。这场由算力与计费引发的风波也指向一个更直接的结论：科技企业的竞争力不仅来自参数与算法的突破，更取决于对服务品质与用户感受的长期投入。