一、问题:开源谨慎与开发需求存断层 近期,全球大模型开源呈现"部分开放"趋势:一些项目仅发布推理权重或有限版本,缺少完整的训练链路、关键权重阶段和工程工具。对开发者来说,缺乏预训练和中训练权重以及可复用的训练框架,导致难以进行深度定制、复现实验过程,也难以开发适用于特定行业的稳定迭代Agent能力。这种断层现象限制了开源生态从"能用"向"可改、可训、可持续"的发展。 二、原因:高成本与落地需求推动"工程化开源" 大模型训练和维护成本高企,数据安全合规要求趋严,模型责任压力加大,促使一些机构在开源上采取保守策略。同时,产业对落地效率的要求不断提升,开发者更关注模型在有限算力和内存条件下的运行效果。阶跃星辰此次开放预训练权重、中训练权重和训练框架,旨在降低二次开发门槛,让社区能够复用并创新关键环节。 三、影响:从调用到定制,推动社区验证与应用 Step 3.5 Flash采用稀疏MoE架构,总参数规模约1960亿,每个token激活参数约110亿,在代码类任务中最高推理速度可达每秒350个token。该模型经过Agent场景和数学任务优化,显示出处理复杂长链条任务的潜力。 市场反馈显示,该模型已获验证:Hugging Face平台下载量超30万次;3月2日单日调用量突破400亿,在OpenClaw榜单中名列前茅。研发团队积极回应开发者问题,明确了模型规模与硬件适配的工程目标,增强了开源项目的可持续性。 四、对策:完善工具链与权重链促进共建 阶跃星辰表示,团队设定了让模型在128GB内存系统运行的目标。考虑到230B规模模型在个人设备4位量化下接近承受上限,适度收缩规模以换取可用性和速度。此次同步开源Base、Midtrain权重和Steptron训练框架,满足了"可训可改"的需求,为社区提供了统一训练流程和安全加固的工具基础。 业内人士指出,更大范围的开源协作需要完善数据合规、模型评测、风险提示诸上工作,确保开源项目既能用得好也能管得住。 五、前景:开源竞争转向生态与落地能力 随着行业进入深度应用阶段,开源项目的竞争焦点正从单一性能扩展到全链条能力:是否提供透明权重阶段、可复用训练框架、主流硬件适配性以及可持续的社区互动机制。此次全面开放有望促进开发者开展垂直微调和工作流编排,推动Agent应用从演示走向生产。同时,更彻底的开源也对行业提出了评测标准、责任边界和治理机制等方面的新要求。
阶跃星辰此次技术开放不仅展示了产品升级成果,更说明了我国在数字基础设施领域的自主创新能力。在全球科技治理调整的背景下,"开放创新、共享发展"的实践路径为国内开发者提供了自主可控的技术选择,也为全球技术生态贡献了中国方案。如何将技术优势转化为产业动能,值得持续关注。(完)