阶跃星辰刚开源了新一代agent 基座模型step 3.5 flash,把华为腾、沐曦股份还有壁仞科技这些国内大厂

阶跃星辰刚开源了新一代Agent基座模型Step 3.5 Flash,把华为昇腾、沐曦股份还有壁仞科技这些国内大厂都给吸引过来做适配。这次他们不光发布了这款基于MoE架构的模型,还把它定位成“Agent搭子”,想给开发者当个可靠的助手。这个模型最大的亮点是在总共1960亿的参数量里,只动用到了最相关的110亿个参数干活,这就把大容量和高效率给平衡好了。官方数据说,它在处理代码类任务时能达到每秒350个token的推理速度,特别适合那些需要快速响应的场景。 其实这次能有这么多家芯片厂商快速跟进适配,靠的是阶跃星辰去年发起的“模芯生态创新联盟”。这个联盟把几十家公司拉到了一起,目的就是把芯片、算法和应用平台之间的壁垒打通。现在大家都意识到了,光是靠模型算法进步或者堆硬件是不够的,必须要模型和算力深度协同才能解决成本、效率这些问题。芯片厂商提前看懂模型架构,去优化驱动和编译器;模型开发者也根据国产芯片的特性来调整算法,这就是“双向奔赴”。这种做法能把调试周期缩短,最后把大家的使用门槛给降下来。 分析人士说,Step 3.5 Flash获得快速适配,就是“模芯生态创新联盟”理念的一次成果展示。它说明只要建立紧密的协作机制,国内的人工智能产业就能在关键环节形成合力。现在大模型的发展重点已经转到了推理落地阶段,单纯的模型进步或者硬件堆叠已经不够用了。这种以应用为导向、牵引芯片、模型、应用协同发展的模式,对构建健康的生态体系很有好处。 这次开源基座模型发布跟国产芯片集群的快速适配结合在一起,正好是我国人工智能产业向纵深发展的一个生动例子。它超越了单一产品或技术的范畴,展现了产业链上下游通过开放协作来应对大模型规模化应用挑战的新路子。以后推理侧会成为主战场,软硬一体、算模融合的深度协同能给千行百业的智能化转型注入更强劲的动力,把人工智能技术变成实实在在的社会生产力。