本科生团队攻克航天战略博弈难题 获全国科技创新大赛特等奖

问题—— 航天重大任务决策往往处于信息不完备、对手意图不明、资源受限且时间紧迫的环境中,如何在有限线索下快速形成稳健策略,是工程管理与智能决策领域的共性难题。

此次擂台赛的需求由中国航天研究院提出,核心目标是研发可在仿真对抗平台上运行的智能体算法:在未知对方身份与决策逻辑的情况下,合理配置资源、应对随机事件,实现收益最大化。

对以大数据管理与应用专业学生为主的本科生团队而言,需求初期表述较为宽泛、规则和平台发布滞后,如何将“工程难题”转译为“可计算、可验证”的模型与算法,是首先要跨过的门槛。

原因—— 一是任务本身具有典型的不完全信息博弈特征。

平台以卡牌式对抗为载体,身份类别多、事件阶段多,信息呈现不对称且存在随机扰动,传统依赖充分信息的决策规则难以直接适配。

二是研发条件约束强。

比赛规则明确要求算法本地部署、禁止联网,这意味着依赖在线知识或外部数据的路径难以奏效,算法必须在离线环境内完成推理与决策,并兼顾速度与稳定性。

三是平台与规则迭代带来不确定性。

竞赛过程中出现身份映射错误修复等问题,前期基于旧映射形成的数据与策略需要推倒重来,对任何团队都是“成本再投入”的考验。

多重因素叠加,使得该项目不仅比拼算法性能,更比拼工程化能力与快速迭代能力。

影响—— 从竞赛维度看,赛制采用初赛“击败基础智能体”与决赛循环对战的方式,每两队完成大量对局,算法的长期稳定性、对噪声与偶发事件的鲁棒性,被放在与单场胜负同等重要的位置。

湖北工业大学团队在决赛中表现突出,既保持较高胜率,又在响应时间上达到0.02秒量级,体现了在“受限算力与受限时间”条件下的系统优化能力。

从人才培养维度看,本科生团队在真实需求牵引下完成从“概念理解”到“工程落地”的跨越,折射出“揭榜挂帅”机制对青年学生科研训练的推动作用:问题来自一线,指标可量化,结果可复现,能有效促成跨方向协作与快速成长。

从应用外溢看,不完全信息环境下的资源分配与策略选择,广泛存在于应急响应、金融投资、城市治理等领域。

此次形成的建模思路与轻量化策略框架,为相关行业在“信息不充分但必须决策”的场景提供了可借鉴的技术路线。

对策—— 针对需求不清与规则滞后,团队采取“先抽象、后对齐”的方法:先围绕博弈结构搭建可扩展模型框架,待平台细则明确后再把身份、事件、资源约束逐一映射到模型参数中,减少返工范围。

针对“离线部署、禁止联网”的限制,团队调整路线,减少对复杂深度学习框架的依赖,转向可解释、可控、易部署的轻量化算法组合,并通过大量模拟对战数据进行迭代筛选。

在工程组织上,团队建立高频调度机制,拆分多个研究方向并行推进:有的负责博弈建模与场景枚举,有的检索并改造成熟算法框架,有的专攻性能优化与部署适配,同时保持与需求方技术人员沟通,确保理解一致、优化不偏航。

面对平台修复导致的策略失效,团队快速重建身份与策略对应关系,并同步调整代码结构,强调可复用与可替换模块,提升整体抗变更能力。

前景—— 随着航天工程、重大基础设施与公共安全领域对智能决策的需求提升,“可在离线环境运行、可快速响应、可解释并易于工程集成”的智能体算法将更受关注。

下一步,若能在更大规模、更复杂规则与更贴近真实约束的场景中验证,并在数据合规与安全边界内引入持续学习与风险控制机制,有望把竞赛成果推进到示范应用层面。

同时,高校与科研院所可进一步完善从需求提出、平台测试到成果转化的闭环机制,让“揭榜挂帅”不仅产出名次,更产出可落地的技术与可持续的人才梯队。

这支本科生团队的成功,反映了当代青年学生在面对国家重大技术需求时的担当精神和创新能力。

他们从"看不懂"到"啃下来"的五个月历程,充分诠释了什么是真正的科技创新:既需要敢于挑战的勇气,也需要脚踏实地的执行力;既需要个人的专业素养,也需要团队的协作精神。

这次获奖不仅是对团队努力的认可,更为高校培养适应国家战略需求的创新人才树立了典范。

面向未来,越来越多的本科学生参与到国家科技攻关中,用青春力量推动技术进步,这正是中国科技自立自强的重要支撑。