从"神之一手"到智能突破：三场人机围棋对决展现技术演进

近年来，围棋人机大战的进程清晰展现了人工智能技术的快速迭代；尽管总体而言人类已难以与顶级AI抗衡，但期间确实出现过三次引人关注的人类胜局，其背后的原因值得梳理。2016年3月，韩国棋手李世石与初代AlphaGo的对局成为围棋史上的经典。就0:3落后的局面下，李世石在第四局第78手落下震惊世界的“挖断”，后来被称为“神之一手”。这步棋之所以奏效，关键在于初代AlphaGo的技术边界：它主要依靠学习数百万盘人类棋谱建立判断体系，决策逻辑更偏向“常规棋形”。当面对这种表面不合常理、胜率显示偏低但暗藏后续手段的招法时，程序评估出现明显偏差，后续应对也随之失序。不过，这场胜利并未改变总体格局。DeepMind随后强化自我对弈，让程序通过与自身进行海量对局，系统性识别并修补类似“非常规手段”的风险点，使后续版本对这类着法的判断更为稳定。一年后的2017年6月，中国棋手王昊洋在梦百合杯世界围棋公开赛中以半目优势战胜日本AI DeepZenGo。彼时的DeepZenGo虽已接近顶级，但仍有短板：死活计算不够精确、劫争判断存在偏差、局部评估偶有漏算。在该局中，DeepZenGo于中盘出现关键失误，王昊洋凭借对形势的把握和稳健的处理中盘复杂战斗，逐步扭转局面，并在官子阶段通过精确计算完成逆转。这场胜利也反映了当时AI在局部计算与细节判断上的不足。此后，DeepZenGo团队通过版本更新重点补强死活与劫争对应的模块，类似漏洞逐步减少。2023年2月，凯林·佩林对阵KataGo和Leela Zero的多项对局则显示出不同面貌。佩林在FAR AI团队协助下，基于超过一百万盘对局数据进行分析，定位到当代顶级AI可能存在的认知盲区：面对“声东击西、低胜率的非常规战术”时，AI的决策系统可能出现不适应。佩林的策略是在棋盘多处设置“陷阱”，干扰AI的评估重心，使其把资源投入到并非关键的区域，而他在其他位置悄然积累优势。这种打法利用了AI对概率与胜率的依赖——AI往往优先选择胜率最高的路线，对低概率但可能带来转折的非常规战术，短时间内未必能给出同等稳健的应对。回看这三次胜利，可以发现其共同点并非人类棋力上的绝对优势，而是抓住了特定阶段AI体系中的漏洞。每次人类获胜后，相关团队都迅速针对问题进行优化，通过增加训练数据、调整网络结构或扩大自我对弈规模等方式，逐步补齐短板。也正因如此，曾经可被利用的突破口在迭代中不断收窄。从技术演进角度看，现代顶级AI已具备极强的抗打击能力。依托数十亿盘自我对弈训练，当代AI的棋力普遍超越人类顶尖棋手，在死活计算、全局评估以及对非常规手段的适应诸上都更趋成熟。人类再次战胜顶级AI的概率，已被压缩到极低水平。

围棋人机博弈的发展历程，既映照了技术进步的路径，也展示了人类智慧与机器智能在对抗与借鉴中的相互推动；随着人工智能持续演进，未来的人机关系可能呈现新的形态。无论如何变化，人类在创造性思维与战略构想上的价值仍难以替代，并将在更深层的人机协同中继续发挥作用。这场持续推进的智慧对话，也将推动围棋与人工智能技术在各自领域不断向前。