智谱公开致歉并推出补偿方案 GLM-5分层策略引发用户关切

问题—— 近期,部分订阅 GLM Coding Plan 的用户集中反馈:模型“消耗变快”、用量看板更新延迟、套餐升级与计费规则不够清楚,加之新模型开放节奏不稳定,影响了用户对成本与可用性的预期;对此,智谱发布致歉说明,称规则展示、发布节奏以及存量用户承接机制上“考虑不周”,并公布处理与补偿方案。 原因—— 一是产品分层与计费说明存在信息落差。智谱表示,GLM-5 参数规模较上一代明显提升,定位为处理复杂任务的更高规格模型,因此采用分层计费:日常任务优先推荐 GLM-4.7;GLM-5 在高峰期按更高倍数计费,非高峰期按相对较低倍数计费。虽然倍数规则已提前制定,但在用户购买和使用前未能清楚说明“为何倍增、何时倍增、如何选择”,导致体验与预期不一致。 二是供给侧扩容与风险对抗不足。智谱在说明中提到,GLM-5 发布后访问量超出预期,同时灰产账号、“号池”、倒卖等行为挤占资源,导致集群在高峰时段承压。为保障整体可用性,公司采取按 Max、Pro、Lite 分层逐步开放的应急策略,但灰度节奏偏慢,加之负载波动带来的限流提示,使部分用户产生“付费但不可用”的感受。 三是存量用户迁移设计不够细致。新旧套餐并行期间,部分用户短时间内从旧套餐升级到新套餐,出现“误操作”或“误触发”,暴露出升级路径、权益对比与风险提示仍需完善。 影响—— 对用户而言,计费不确定和看板延迟会抬高试错成本,影响开发排期、预算控制与模型选型判断,高频调用的开发者和小团队感受更明显。 对企业而言,规则不透明容易放大舆情与信任损耗;若不能及时解释分层逻辑并稳定供给,将影响新模型口碑与商业化节奏。 对行业而言,大模型服务正从“能力竞赛”转向“工程与运营能力竞争”,算力供给、风控治理、计费披露与客户支持已成为衡量平台成熟度的重要指标。 对策—— 围绕用户关切,智谱提出整改与补偿安排: 其一,提升规则透明度。公司称已在购买页面更完整展示消耗倍数、分层策略等关键信息,并将继续优化表述,降低理解成本,方便用户在“效果—成本—时段”之间作出选择。 其二,加快用量信息更新。针对“看板延迟”,智谱表示已将用量看板刷新频率从约 1 小时一次提升至约 10 分钟一次,减少信息滞后带来的决策偏差。 其三,优化开放节奏与体验保障。智谱称将加快资源扩容与服务优化:Max 用户已全面开放;Pro 用户已开放,但高峰期可能因负载出现限流;Lite 用户将于节后在非高峰期逐步灰度开放。同时,公司将加强对灰产账号与倒卖行为的治理,减少对正常用户的资源挤占。 其四,推出补偿与纠错机制。公司明确,受影响的 Lite 和 Pro 用户可自主申请退款,按特定时间段费用“请客”的原则执行;对 2 月中旬因升级机制导致从旧套餐误升新套餐的用户,支持一键回滚,降低因机制不完善产生的额外成本。 前景—— 从趋势看,随着模型能力提升与调用规模扩大,平台运营需要在三上建立更稳的机制:其一,用更直观方式披露计费规则与时段策略,形成可预测的成本体系;其二,通过弹性扩容、负载调度与分级保障提升峰值稳定性,减少“高峰不可用”;其三,加强账号风控与交易治理,遏制灰产对公共资源的挤占。对企业而言,能否将“能力上线”同步落到“服务可用、规则易懂、成本可控”,将决定新一代模型从发布走向规模化落地的速度与质量。

智谱科技此次事件的处置,既检验了企业的责任边界,也为行业提供了一个现实参照:当大模型进入规模化服务阶段,技术之外的透明度、可用性与用户体验同样关键;在人工智能深度重塑生产与协作方式的当下,只有在更规范、可解释的框架下推进创新,才能减少误解与摩擦,真正释放技术价值。这场由算力与计费引发的风波也指向一个更直接的结论:科技企业的竞争力不仅来自参数与算法的突破,更取决于对服务品质与用户感受的长期投入。