deeponet:给网络加点神经元能增强学习能力,但加太多就会过拟合的

最近有个科研团队搞了个挺牛的活儿,他们把深度算子网络(DeepONet)这技术给搞活了,专门用来解电磁轨道发射里的那个“速度趋肤效应”难题。这玩意儿啊,算是颠覆传统火炮的新武器,靠着1到3公里每秒的超高初速度,在军事装备领域看着就很有戏。它的工作原理就是在两根平行导轨间通大电流,利用反向磁场跟电枢的相互作用,把电能变成弹丸的动能。虽然核心部件导轨、脉冲电源、电枢还有弹丸都挺关键,但最让人头疼的还是电流和磁场的分布特性。尤其是那个速度趋肤效应,老是把电磁场弄得乱七八糟,长期以来都卡在这儿出不去。 以前研究这方面都靠有限元法这种数值算法去算磁场分布,不过这方法有个大毛病:你只要稍微改改发射速度或者电流大小,就得重新搭个计算模型。这么搞下来参数优化的效率可太低了。现在搞实时模拟和数字孪生这些新兴场景呢?传统方法根本跟不上毫秒级的响应需求,成了技术发展的大拦路虎。 为了破局,这个团队弄出了个三步走的策略。第一步先用有限元法生成各种速度和电流组合的磁场数据集,拿来给模型训练当标准。第二步设计了一种非堆叠型的网络架构,分支网络负责编码发射参数,主干网络处理时空坐标。这么一来就把参数和计算域给解耦了。最后一对比验证发现,新方法在训练区间内的相对L2误差只有0.43%,泛化预测误差也压到了0.74%以内。单次预测的时间更是从原来的好几百秒一下子缩短到了865秒。 针对那些特别需要动态过程模拟的暂态磁场计算问题,他们还在分支网络里加了个时间变量。结果发现就算在动态变化的时候,模型的预测误差也才0.724%,响应速度保持在87秒。敏感分析还说明白了一个事儿:给网络加点神经元能增强学习能力,但加太多就会过拟合。主干和分支的神经元数量最好有个最优比例,这对后面自动优化超参数很有帮助。 现在他们正琢磨着用自动机器学习来搞定网络结构的智能调优。这次发表在《电工技术学报》的成果彻底甩掉了对具体发射条件的依赖,成了电磁轨道发射实时仿真的高效工具。这种毫秒级的响应能力给数字孪生建模打下了基础。这个项目是国家自然科学基金等好几个项目一起资助的,标志着咱们国家在电磁发射基础理论这块儿取得了重要进展。