上海人工智能实验室发布万亿参数科学多模态模型 开源共享推动科研创新突破

问题——科研智能化需要兼具通用能力和专业深度的基础模型。当前科研数据类型丰富,涵盖文本、图像、时序信号和多源观测数据;科研任务链条涉及检索、假设生成、计算推演、实验设计与结果复核等多个环节。通用模型知识覆盖面广,但数理推理、跨学科建模以及科研工具调用与任务编排上能力不足;单一领域模型则受限于泛化能力,难以支撑跨学科协同和从数据到发现的完整流程。原因——突破点在于架构创新与工程能力的结合。上海人工智能实验室开源的Intern-S1-Pro,核心是"通专融合"的SAGE技术架构:让通用能力与科学能力协同发展,避免顾此失彼;同时针对科学数据特点改造底层结构。实验室介绍,模型在基础层引入傅里叶位置编码并重构时序编码器,增强对不同尺度信号的统一表征能力,使其能在微观生命信号与宏观天文波动等跨尺度任务中建立稳定的"物理直觉"。针对万亿参数混合专家模型训练中的稳定性与算力效率问题,模型采用高效路由机制,通过可控的专家激活策略降低训练与推理成本,提高大规模训练的工程可行性。影响——开源大模型有望加速科研范式变革。Intern-S1-Pro采用混合专家架构,包含512个专家,总参数规模达1万亿,每次调用激活8个专家、约220亿参数,在能力与成本间找到平衡点。实验室披露,该模型在高难度综合学科评测中处于国际领先水平,复杂数理逻辑推理能力可对标高水平竞赛表现,在面向真实科研流程的智能体能力上达到开源模型领先水平。业内人士认为,这类模型的开源发布,一方面能缩短科研机构与企业科学计算、数据分析、实验设计等环节的工具搭建周期,提升研究效率;另一上将推动"模型—工具—数据—算力"的协同创新,促进跨机构、跨学科的开放合作,扩大科研创新的可复制性和可扩展性。对策——以开放共享与规范治理并重,推动"用得好、用得稳"。面向未来发展,对应的专家建议:持续完善开源社区协作机制,鼓励围绕科学评测体系、工具链集成、数据合规使用等形成共建共享格局;强化面向科研场景的可验证性与可追溯性建设,提升推理过程透明度与结果可复核能力,降低"黑箱式"使用风险;结合行业需求推进算力适配与工程化优化,形成从基础模型到科研应用的标准化流程;坚持安全与伦理底线,建立覆盖数据来源、使用边界与风险评估的治理框架,推动技术创新与规范管理同步推进。前景——从"单点能力突破"走向"科学发现基础设施"。随着科学数据规模增长与交叉学科融合加速,科研对通用推理、专业建模与多模态理解的统一需求日益突出。Intern-S1-Pro原创架构探索、超大规模训练工程化以及算力底座适配诸上的进展,展示了从关键技术到产业化落地的完整路径。可以预期,随着更多科研机构、企业与开发者基于开源模型进行二次开发与场景化验证,面向材料、生命科学、气象海洋、天文物理等领域的科研智能化应用将加速落地,推动形成可持续演进的开放科学智能生态。

在全球科技竞争格局深刻调整的今天,Intern-S1-Pro的发布不仅展现了我国在前沿技术领域的创新能力,更构建了开放共享的科研生态基础。此进展预示着人工智能技术与基础科学研究的深度融合将进入新阶段,为破解重大科学难题提供新的方法论支撑。