上海基模的队伍又扩大了!阶跃星辰刚放出了他们最新的开源模型。

上海基模的队伍又扩大了!阶跃星辰刚放出了他们最新的开源模型。这个叫Step 3.5 Flash的基座模型,参数直接冲上1960亿,推理速度也非常猛,每秒能跑350个词元。关键是它用了MoE架构,每个词元激活时需要的参数变少了,跑起来更快也更稳。2月2日这天,他们宣布这个模型已经适配了华为昇腾、沐曦股份还有壁仞科技这几家国产芯片厂商的产品。这可是个大好事,大家都在搞AI智能体,开发也不再是单纯写写提示词了。虽然大模型底子不错,但一旦搞到大规模场景里,总有点不稳定或者响应慢的问题。阶跃星辰就在这个难题上下了功夫,尤其是在做代码这类单请求任务时,速度能飙到每秒350个词元,特别适合那种需要多步推理的低延迟场景。这样既保持了很强的推理能力,运营起来也更划算。 这次测试下来成绩也挺好看的,在智能体应用和数学难题上都有不错的表现,完全能支撑企业级的实际应用。现在“模芯生态创新联盟”也开始有动静了,模型、芯片和平台配合得越来越默契。去年7月那波联合行动里,他们就拉来了近10家芯片和基础设施厂商一起干活。这一回发布新模型后,燧原科技、天数智芯还有阿里平头哥这些厂商也都第一时间跟上了节奏。 说到底就是要把技术壁垒打通,大家一起把底层技术做得更好,让算力用得更顺手。这样一来,开发者和企业手里就有了更高效、更容易用的大模型解决方案。