算力成本大幅下降推动人工智能从高端应用走向普遍赋能 专家认为有望成为新型基础设施

问题:大模型走向规模化应用,成本瓶颈仍待打通 当前,大模型正从科研与试点阶段加快进入办公协同、工业质检、智能客服、内容生成、智能终端等多元场景;但从“能用”迈向“好用、常用、规模化用”的过程中,算力供给、芯片能力与推理成本依然是关键掣肘:一上,大模型训练与推理对算力消耗巨大;另一方面,面向海量用户与高频调用的商业模式必须经得起成本核算,尤其是单位推理成本若难以持续下探,企业端部署与行业端扩散就会受到限制。郑文先认为,降低算力成本将推动大模型从工具属性走向基础设施属性,成为支撑数字经济的新型公共底座。 原因:需求高增长与商业可持续之间的矛盾集中体现在“推理经济学” 从产业链看,芯片是算力系统的核心组成部分,也是影响性能、能耗与成本的重要环节。随着各类应用对实时交互、多模态理解、边云协同的需求快速增长,推理调用量呈现高频化、常态化趋势,成本结构因此发生变化:过去更多关注训练投入,如今推理侧的长期成本成为规模化落地的决定因素。郑文先提出“百亿Token一分钱”的长期目标,意在以明确的成本曲线牵引技术与产品迭代,使大模型服务在单位成本可控的前提下实现更广覆盖。其逻辑在于,只有当每一次调用的边际成本持续下降,企业才敢在更多业务环节“上模型、跑流程”,终端产品才可能真正走向大众消费。 影响:算力下探带动应用普及,智能硬件与制造业迎来新一轮迭代 算力成本“数量级下降”将直接改变应用形态与产业节奏。面向消费端,随着推理价格降低与时延改善,智能终端的功能边界将被重新定义,从单一的文本生成扩展到更贴近生活与工作的场景,如实时翻译、智能搜索、个性化陪伴与多设备联动等。郑文先以智能眼镜、智能耳机、家庭机器人等为例指出,云端大模型的稳定推理能力将成为终端体验的关键支撑,带动智能硬件加速普及并提升效率。 面向产业端,低成本算力将更深度嵌入制造业全流程,从研发设计、排产调度、质量检测到售后服务形成闭环,推动“制造”向“智造”跃迁。同时,服务业的数字化能力也将反向提升制造业的市场触达与品牌运营能力,例如通过数字营销、数字人交互等方式提升企业获客与服务效率,深入促进“先进制造+现代服务”的双向增值。广东作为制造业大省,凭借机电产业基础与数智技术优势,在人工智能与机器人领域加快布局,市场空间大、应用场景多,为新技术验证与规模复制提供了土壤。 对策:企业加码推理芯片与云端架构,政策工具降低中小企业转型门槛 在产业实践层面,云天励飞将芯片战略聚焦于云端大算力与大模型专用推理芯片,指向规模化商用的核心诉求——成本、效率与可持续运营。郑文先强调,无论是移动端助手、可穿戴设备中的实时语音能力,还是AR眼镜背后的智能交互,其关键都在云端推理的稳定供给与成本下降,只有打破推理成本瓶颈,才可能形成覆盖更广用户与更多行业的应用生态。 在政策层面,多地正探索以市场化方式降低算力使用门槛。广东鼓励设立“模型券”“算力券”等工具,意在缓解中小企业在算力采购、模型调用、试点验证阶段的成本压力,提升其“敢用、会用、用得起”的能力。郑文先认为,这类政策工具有助于加快企业转型升级、提质增效,推动技术从头部企业扩散到更广泛的产业链与供应链。 前景:算力有望成为“水电式”资源,产业竞争转向“成本曲线+场景深耕” 展望未来,算力与大模型服务的基础设施化趋势将更加明显。随着专用推理芯片、系统软件栈与云端服务能力持续迭代,算力价格下降、效率提升将推动更多应用从“点状试用”走向“规模部署”。,产业竞争也将从单纯比拼参数与模型体量,转向比拼单位成本、工程化交付与场景落地能力:谁能以更低成本提供更稳定的推理服务,谁就更有可能在行业应用中形成持续优势。 在更长周期内,智能网联、新能源汽车、智能出行等领域的融合将进一步加深制造业与服务业的协同。业内人士认为,随着自动驾驶与车路云协同演进,未来交通出行可能出现新的运营模式与服务形态,带动有关产业链在制造、运营、数据服务等环节形成新增长点。对广东等制造业重镇而言,抓住算力成本下探与应用扩散窗口期,加快形成可复制、可推广的行业解决方案,将有助于在新一轮产业变革中赢得主动。

人工智能技术的普惠化发展正在改写全球产业竞争规则。在这场变革中,既要抓住算力降本带来的战略机遇加快核心技术攻关和市场应用推广,也要清醒认识到技术创新最终要服务于实体经济转型升级。让科技之光照亮每个车间,不仅需要政策引导、市场驱动和企业实践的共同发力,更需要在成本、效率与应用场景的深度融合中找到可持续的发展路径。(完)