好消息,中国又有一款 AI 模型登顶国际竞技场了!这次是阿里通义千问 3.5-Max-Preview,把 LMSYS 组织的 LM Arena 平台的综合得分刷新到 1464 分,直接拿下冠军!在全球大模型评测榜单中,它不仅稳住了中国大模型的第一名,而且在全球总排名中也排到了第五名。数学能力和专家级文本处理能力也很厉害,分别位列全球第五和第十。另外,Qwen3.5-Max-Preview 的纯性能比拼也非常出色。 自从农历除夕开始,通义千问已经密集开源了 Qwen3.5 系列的多款模型,提供从 0.8B 到 397B 不同尺寸的参数规模。其中 Qwen3.5-Plus 是这个系列中的佼佼者,采用了 MoE 架构,实现了低功耗和高性能的平衡。这次推出的 Max-Preview 版本是为了收集反馈意见,为后续正式版的迭代做准备。 LMSYS 组织的 LM Arena 平台非常严格和权威,因为是匿名对战和全球开发者投票机制所以很难刷榜。这次通义千问能拿到第一梯队的成绩,说明国产大模型在通用能力、逻辑推理和多语言理解方面已经进入了国际前列。目前 Qwen3.5 系列已经在阿里云百炼平台及开源社区上线了,大家可以在这些平台上体验和使用它们。