阿里云发布新一代开源大模型 性能效率双突破引领技术革新

阿里云近日在官方平台低调上线了Qwen3.5系列的两款新模型,标志着其在大语言模型领域的又一次技术迭代。

其中,Qwen3.5-Plus定位为该系列最新的通用大语言模型,而Qwen3.5-397B-A17B则被明确定位为开源系列的旗舰产品,两款模型均支持文本和多模态任务处理。

从技术架构看,Qwen3.5系列实现了底层模型的全面革新。

Qwen3.5-397B-A17B采用了创新的混合架构设计,将线性注意力机制与稀疏混合专家模型相结合。

这一设计的核心优势在于参数效率的大幅提升:模型总参数量达到3970亿,但每次前向传播仅需激活170亿参数,这意味着在保持模型能力的同时,显著降低了计算成本和部署难度。

相比之下,Qwen3.5-Plus版本的部署显存占用降低了60%,推理效率大幅提升,最大推理吞吐量可提升至19倍,这一性能指标已经超越了参数量超过万亿的前代旗舰模型Qwen3-Max。

在能力维度上,Qwen3.5系列进行了多方面的增强。

模型在更大规模的视觉-文本语料基础上进行训练,并重点加强了中英文、多语言、STEM领域和推理能力的数据积累,采用了更严格的数据过滤标准。

根据官方介绍,Qwen3.5-397B-A17B的综合表现已与参数量超过1万亿的Qwen3-Max-Base相当,这充分说明了混合架构在参数效率方面的优势。

在具体应用场景中,该模型在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异。

效率提升是Qwen3.5系列的另一大亮点。

基于改进的Qwen3-Next架构,新模型采用了更高稀疏度的混合专家设计,结合Gated DeltaNet与Gated Attention混合注意力机制,并进行了稳定性优化和多token预测增强。

在实际应用中,Qwen3.5-397B-A17B在32k和256k上下文长度下的解码吞吐量分别是Qwen3-Max的8.6倍和19倍,性能表现相当。

与同系列的235B-A22B模型相比,新模型的解码吞吐量分别提升了3.5倍和7.2倍,充分体现了架构优化的成效。

在通用性方面,Qwen3.5系列通过早期的文本-视觉融合和扩展的视觉、STEM、视频数据实现了原生多模态能力,在相近规模下优于前代的Qwen3-VL模型。

值得注意的是,模型的多语言覆盖范围从119种扩展至201种语言和方言,词表规模从15万扩展至25万,这一扩展在多数语言上带来了约10至60%的编码和解码效率提升,为全球用户提供了更广泛的可用性和更完善的本地化支持。

从产业影响看,Qwen3.5系列的推出反映了大语言模型发展的新方向。

高效的混合架构与原生多模态推理能力为通用数字智能体的构建奠定了坚实基础。

阿里云方面表示,下一阶段的重点将从单纯的模型规模扩展转向系统整合,包括构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制等,目标是实现能够长期自主运行、逻辑一致的系统,将当前以任务为边界的助手升级为可持续、可信任的伙伴。

大模型发展正从“能力展示”走向“工程落地”,从“单点突破”走向“系统能力”。

此次Qwen3.5系列以架构创新强化效率与通用性,体现出产业界对成本、性能与可用性的再平衡。

面向未来,真正决定技术价值的,不仅是模型指标的刷新,更是能否在合规、安全与可靠的前提下,把智能能力嵌入真实业务流程,形成可持续的生产力增量。