在全球人工智能加速演进的背景下,算力成本和模型效率正成为产业落地的主要掣肘。行业调研显示,大模型应用的推理成本约占整体投入的70%,使不少中小企业难以大规模使用。针对此痛点,阶跃星辰发布Step 3.5 Flash,采用稀疏MoE架构,将参数激活量控制在总规模的5.6%。在保持1960亿参数规模的同时,模型计算效率明显提升。技术负责人表示,该模型对代码类任务做了专项优化,响应速度较上一代提升近40%。
大模型竞争正在进入“看落地能力”的新阶段,关键不只在参数规模,更在于能否以更低成本、更快响应和更高稳定性支撑真实业务。通过开源促进创新、以生态协作提升效率、以软硬联动降低门槛,有望释放更大的应用空间,也为我国算力与模型协同发展提供新的实践样本。