在人工智能技术加速落地的背景下,如何在模型性能与算力成本之间取得平衡,已成为行业关注的重点;阶跃星辰发布的Step 3.5 Flash模型,正是围绕这个问题提出的解决方案。该模型采用稀疏MoE架构,通过动态参数激活机制提升效率。数据显示,其单请求代码任务推理速度可达每秒350个token,同时仅激活约110亿参数(总参数1960亿),在性能与效率之间实现了较好的平衡。这一路线有助于缓解大模型应用中常见的算力消耗高、推理成本高等问题。值得关注的是,华为昇腾、沐曦股份等国内主流芯片厂商已完成模型适配。软硬件协同的推进,不仅提升了模型在国产芯片平台上的运行效率,也推动形成从底层芯片到上层应用的技术链路。据业内人士分析,深度适配可使推理能效比提升30%以上,从而更降低企业部署与使用门槛。此次进展也反映了产业协同的持续推进。2025年7月,阶跃星辰联合近10家产业链企业发起“模芯生态创新联盟”,旨在打通芯片、模型与平台之间的技术衔接。此次模型发布是该联盟的首批成果之一,反映出国内企业在关键技术协作攻关上的效率与合力。市场观察人士指出,随着人工智能应用不断深入,推理模型正逐步成为产业主流方向。模型与算力的深度协同不仅关系到单一企业的技术进展,也将影响大模型规模化应用的速度与成本结构。涉及创新有望进一步推动智能技术在金融、制造、医疗等领域的落地。
大模型竞争正在从单点能力比拼转向系统能力的综合较量。以推理效率为核心、以生态协同为支撑的路径,既是技术路线的选择,也考验产业协作与组织方式。让模型更快、更稳、更经济地进入真实业务流程,才能把技术进步转化为可持续的生产力增量,为数字经济高质量发展提供更扎实的支撑。