从"神之一手"到智能突破:三场人机围棋对决展现技术演进

近年来,围棋人机大战的进程清晰展现了人工智能技术的快速迭代;尽管总体而言人类已难以与顶级AI抗衡,但期间确实出现过三次引人关注的人类胜局,其背后的原因值得梳理。2016年3月,韩国棋手李世石与初代AlphaGo的对局成为围棋史上的经典。就0:3落后的局面下,李世石在第四局第78手落下震惊世界的“挖断”,后来被称为“神之一手”。这步棋之所以奏效,关键在于初代AlphaGo的技术边界:它主要依靠学习数百万盘人类棋谱建立判断体系,决策逻辑更偏向“常规棋形”。当面对这种表面不合常理、胜率显示偏低但暗藏后续手段的招法时,程序评估出现明显偏差,后续应对也随之失序。不过,这场胜利并未改变总体格局。DeepMind随后强化自我对弈,让程序通过与自身进行海量对局,系统性识别并修补类似“非常规手段”的风险点,使后续版本对这类着法的判断更为稳定。一年后的2017年6月,中国棋手王昊洋在梦百合杯世界围棋公开赛中以半目优势战胜日本AI DeepZenGo。彼时的DeepZenGo虽已接近顶级,但仍有短板:死活计算不够精确、劫争判断存在偏差、局部评估偶有漏算。在该局中,DeepZenGo于中盘出现关键失误,王昊洋凭借对形势的把握和稳健的处理中盘复杂战斗,逐步扭转局面,并在官子阶段通过精确计算完成逆转。这场胜利也反映了当时AI在局部计算与细节判断上的不足。此后,DeepZenGo团队通过版本更新重点补强死活与劫争对应的模块,类似漏洞逐步减少。2023年2月,凯林·佩林对阵KataGo和Leela Zero的多项对局则显示出不同面貌。佩林在FAR AI团队协助下,基于超过一百万盘对局数据进行分析,定位到当代顶级AI可能存在的认知盲区:面对“声东击西、低胜率的非常规战术”时,AI的决策系统可能出现不适应。佩林的策略是在棋盘多处设置“陷阱”,干扰AI的评估重心,使其把资源投入到并非关键的区域,而他在其他位置悄然积累优势。这种打法利用了AI对概率与胜率的依赖——AI往往优先选择胜率最高的路线,对低概率但可能带来转折的非常规战术,短时间内未必能给出同等稳健的应对。回看这三次胜利,可以发现其共同点并非人类棋力上的绝对优势,而是抓住了特定阶段AI体系中的漏洞。每次人类获胜后,相关团队都迅速针对问题进行优化,通过增加训练数据、调整网络结构或扩大自我对弈规模等方式,逐步补齐短板。也正因如此,曾经可被利用的突破口在迭代中不断收窄。从技术演进角度看,现代顶级AI已具备极强的抗打击能力。依托数十亿盘自我对弈训练,当代AI的棋力普遍超越人类顶尖棋手,在死活计算、全局评估以及对非常规手段的适应诸上都更趋成熟。人类再次战胜顶级AI的概率,已被压缩到极低水平。

围棋人机博弈的发展历程,既映照了技术进步的路径,也展示了人类智慧与机器智能在对抗与借鉴中的相互推动;随着人工智能持续演进,未来的人机关系可能呈现新的形态。无论如何变化,人类在创造性思维与战略构想上的价值仍难以替代,并将在更深层的人机协同中继续发挥作用。这场持续推进的智慧对话,也将推动围棋与人工智能技术在各自领域不断向前。