广州首创词元级算力调度平台 破解企业"用算难用算贵"困局

问题:大模型应用加速落地,算力供需错配与成本压力愈发明显。当前,人工智能大模型正从训练阶段转向推理应用,企业用算需求呈现高频、碎片化、即时化特点。但现实中,算力资源分散不同运营主体之间,供需信息不对称、交易链路不顺、计量方式较粗等问题叠加,使企业尤其是中小企业在“找得到、用得起、用得好”上面临门槛:一上,算力服务多按“机器数量、租用时长”等方式计费,难以准确对应实际消耗;另一方面,供给侧资源受峰谷波动影响明显,部分时段紧张、部分时段闲置,整体效率仍有提升空间。 原因:技术演进与产业结构变化推动计量与调度方式更新。随着模型能力提升——推理端调用频次显著增加——“一次提问一次计算”的成本成为应用普及的关键变量。传统以硬件租赁为核心的供给模式,更适合长期、稳定占用的场景,却难以匹配推理应用“按次、按量、按需”的消费方式。同时,城市层面算力基础设施加快布局,多主体、多类型算力资源并存,若缺少统一的监测、调度与交易规则,容易形成新的信息壁垒和重复建设,影响算力要素的高效配置。 影响:词元级计量有望推动算力从“资产型投入”转向“要素化使用”。广州市政务和数据管理局有关负责人介绍,新发布的平台以词元为统一计量基准,将算力消耗与模型调用直接对应,替代过去相对粗粒度的计费方式,使算力使用更精细、更可核算。对企业而言,算力可像“按需采购的生产要素”一样灵活购买,有助于降低试错成本、缩短研发周期;对城市而言,则有利于形成更透明的价格机制和更高效的跨域调配,通过错峰使用、就近匹配等方式提升资源利用率,逐步建立“可流动、可追溯、可监管”的算力运行体系。 平台价值也体现供需对接效率的提升上。以新兴无人机企业为例,企业在本地开展数据处理与分析时,可在平台发布需求,系统据此匹配就近且具备相应能力的供算单位,减少多头询价、跨平台沟通等隐性成本,推动算力服务从“项目制采购”向“标准化调用”转变。业内企业代表表示,随着大模型研发重心转向推理应用,词元成本将直接影响应用能否规模化推广;若调用成本明显下降,中小企业和初创团队会更愿意开展产品验证与市场试水,应用创新有望更快扩散。 对策:以平台化方式提升供给组织能力,并以项目建设补强算力底座。广州市此次发布的平台定位为城市综合算力运行服务平台,集算力交易、供需撮合与监管能力于一体,旨在把分散资源纳入统一视野,通过统一计量、统一规则与统一调度,降低交易摩擦,提高供给质量与服务可得性。按规划,平台未来纳管算力规模将达7万P,打造面向全市的算力资产流通枢纽。 平台上线同步,广州移动、广州联通、云下科技、连云大数据等4个获批算力项目集中开工,总投资48.39亿元,建成后将新增智算规模4万P,并实现广州单体万卡万P智算中心建设“零的突破”。在行业普遍关注算力供给能力与服务稳定性的背景下,这些项目将为平台提供更扎实的算力支撑,也为产业端带来更可预期的资源保障。广州市政务和数据局相关负责人表示,将通过“一站式”算力服务,持续缓解企业用算难、用算贵问题,支持企业更专注于研发与市场拓展。 前景:算力要像水电一样成为基础要素,关键在标准、生态与监管的协同。总体来看,词元级调度平台为算力要素的市场化配置提供了新的城市样本:一是以统一计量提升可比性与透明度,为价格形成与成本控制打基础;二是以供需撮合提升交易效率,释放闲置资源,缓解阶段性紧张;三是以监测调度增强治理能力,为安全合规、可信交易与风险防控提供支撑。下一步,平台能否持续释放红利,还取决于能否扩大接入主体、丰富应用场景、完善结算与信用体系,并在数据安全、模型合规、服务稳定性诸上形成可复制的制度安排。随着算力基础设施深入完善、产业需求持续增长,广州有望在粤港澳大湾区算力协同与人工智能应用创新中形成更强的集聚效应。

从“看得见的机房”到“用得起的服务”,算力治理正从重建设转向重运营。广州以词元级计量与城市级调度为抓手,一上降低企业创新成本,另一方面提升城市资源配置效率。下一步,如何在扩大供给的同时做好安全合规、标准衔接与跨区域协同,将决定算力能否真正成为支撑新质生产力的日常基础设施。