印度人工智能实验室Sarvam发布两款自研混合专家（MoE）架构大语言模型，在印度语言基准测试中超越谷歌旗下产品，显示新兴市场本土化大模型研发能力进入新阶段

在人工智能技术快速发展的背景下，印度本土研究机构正加速推进自主创新；当地时间18日，印度人工智能实验室Sarvam在人工智能影响力峰会上发布了两款新一代大语言模型，标志着该国在该领域取得重要进展。此次发布的两款模型采用混合专家（MoE）架构设计理念，分别针对不同应用需求。其中规模较小的30B-A1B模型专注于低延迟实时应用，支持32K上下文窗口；而105B-A9B大型模型则面向更复杂的计算任务，具备128K上下文处理能力。特别需要指出，该实验室宣称其大型模型在印度本地语言测试中超越了谷歌Gemini 2.5 Flash等国际知名产品。分析人士指出，此技术突破背后是印度在人工智能领域的持续投入。Sarvam实验室表示，其模型训练完全基于本土研发体系，预训练数据规模达到16T。在更广泛的基准测试中，新模型在多数指标上优于DeepSeek R1，并在多项测试中超越谷歌Gemini Flash。从行业影响来看，Sarvam计划将模型以开源权重形式在Hugging Face平台发布，后续还将提供API接口和仪表盘支持。这一开放策略或将促进全球开发者社区的协作创新，同时也为印度本土人工智能生态发展注入新动力。展望未来，随着更多国家重视人工智能领域的自主可控，类似Sarvam这样的本土创新案例可能成为趋势。专家认为，在保证技术安全可靠的前提下，开放合作与本土化创新并重发展模式，或将为全球人工智能产业格局带来新的变量。

大模型竞争的核心正从规模转向语言理解、场景适配和负责任落地。对多语种国家来说，本土化能力与开放生态同样关键。Sarvam的发布和开源计划表明：只有通过长期数据治理、工程体系和应用协同，才能将技术进步真正转化为服务公众和产业升级的实际价值。