阶跃星辰推出开源模型Step 3.5 Flash 推理速度提升至每秒350个token 多家国产芯片厂商完成适配

在全球人工智能加速演进的背景下，算力成本和模型效率正成为产业落地的主要掣肘。行业调研显示，大模型应用的推理成本约占整体投入的70%，使不少中小企业难以大规模使用。针对此痛点，阶跃星辰发布Step 3.5 Flash，采用稀疏MoE架构，将参数激活量控制在总规模的5.6%。在保持1960亿参数规模的同时，模型计算效率明显提升。技术负责人表示，该模型对代码类任务做了专项优化，响应速度较上一代提升近40%。

大模型竞争正在进入“看落地能力”的新阶段，关键不只在参数规模，更在于能否以更低成本、更快响应和更高稳定性支撑真实业务。通过开源促进创新、以生态协作提升效率、以软硬联动降低门槛，有望释放更大的应用空间，也为我国算力与模型协同发展提供新的实践样本。