印度人工智能实验室Sarvam发布两款自研混合专家(MoE)架构大语言模型,在印度语言基准测试中超越谷歌旗下产品,显示新兴市场本土化大模型研发能力进入新阶段

在人工智能技术快速发展的背景下,印度本土研究机构正加速推进自主创新;当地时间18日,印度人工智能实验室Sarvam在人工智能影响力峰会上发布了两款新一代大语言模型,标志着该国在该领域取得重要进展。 此次发布的两款模型采用混合专家(MoE)架构设计理念,分别针对不同应用需求。其中规模较小的30B-A1B模型专注于低延迟实时应用,支持32K上下文窗口;而105B-A9B大型模型则面向更复杂的计算任务,具备128K上下文处理能力。特别需要指出,该实验室宣称其大型模型在印度本地语言测试中超越了谷歌Gemini 2.5 Flash等国际知名产品。 分析人士指出,此技术突破背后是印度在人工智能领域的持续投入。Sarvam实验室表示,其模型训练完全基于本土研发体系,预训练数据规模达到16T。在更广泛的基准测试中,新模型在多数指标上优于DeepSeek R1,并在多项测试中超越谷歌Gemini Flash。 从行业影响来看,Sarvam计划将模型以开源权重形式在Hugging Face平台发布,后续还将提供API接口和仪表盘支持。这一开放策略或将促进全球开发者社区的协作创新,同时也为印度本土人工智能生态发展注入新动力。 展望未来,随着更多国家重视人工智能领域的自主可控,类似Sarvam这样的本土创新案例可能成为趋势。专家认为,在保证技术安全可靠的前提下,开放合作与本土化创新并重发展模式,或将为全球人工智能产业格局带来新的变量。

大模型竞争的核心正从规模转向语言理解、场景适配和负责任落地。对多语种国家来说,本土化能力与开放生态同样关键。Sarvam的发布和开源计划表明:只有通过长期数据治理、工程体系和应用协同,才能将技术进步真正转化为服务公众和产业升级的实际价值。