十年前,AlphaGo的辉煌一刻几乎让所有围棋界的专家陷入沉默,而现在,DeepMind的创始人Demis Hassabis回顾那一历史时刻时表示,他清楚地意识到科技已经准备好迎接更为复杂的挑战。AlphaGo所引领的技术进步正在重新定义科学的研究方向,从蛋白质折叠到数学的奥林匹克金牌,这条路径的影响深远。
在2016年的三月,一个令人难忘的夜晚,世界围棋冠军李世石的对手竟是一台计算机程序。在第二局的比赛中,AlphaGo下出的第37手让所有人都惊愕不已,这一手出乎所有棋手的意料,甚至许多人误以为是操作失误。然而,经过漫长的对局,AlphaGo最终赢得了比赛。当晚,座无虚席的观众们沉默着,思考着这一刻的意义。
Hassabis在事后感慨,正是那一棋步,让他确信人工智能的力量已经崭露头角,不仅能征服围棋,更能够解决更具挑战性的科学难题。
围棋的复杂性可谓无与伦比,局面数量多达10的170次方,远远超过宇宙中的原子总数。传统的穷举与剪枝方法在这种复杂的对局前几乎毫无用武之地。而AlphaGo巧妙地结合了深度神经网络、强化学习和蒙特卡洛树搜索的方法,通过学习大量的人类棋谱,构建了初步直觉模型,然后通过自我对弈不断完善策略。关键在于,这种方法用学习代替了既定规则,利用经验生成超越人类的智慧。
在AlphaGo的基础上,DeepMind不断探索更深层次的AI应用。AlphaGo Zero完全摆脱了人类棋谱的束缚,从随机决策起步,迅速学习并最终成为无可争议的最强棋手。而AlphaZero则是另一种进化,几小时内便掌握了国际象棋,甚至击败了当时顶尖的象棋引擎Stockfish,展现出前所未有的创造性策略。
Hassabis总结道,这一系列的成就印证了方法论的有效性,显然是时候将这些技术应用于真实的世界中了。
随着AlphaGo的成功,AI的学习与搜索方法迅速迁移到了科学的各个领域。蛋白质折叠这一直困扰科学家半个多世纪的难题也在2020年被AlphaFold 2所解决,其后DeepMind将超过两亿种已知蛋白质的结构预测结果整理成一个开源数据库,供全球科学家免费使用,助力研究进展。
不仅如此,AlphaGo的成就还延伸至数学推理领域。AlphaProof结合了语言模型与强化学习,学习形式化的数学证明,其核心框架与AlphaGo相似,仅仅是将搜索空间从围棋转变为数学命题。2025年,它与AlphaGeometry 2联合,在国际数学奥林匹克中获得了银牌,随后Gemini Deep Think更是获得了金牌,显示了这一AI发展的巨大潜力。
在算法发现领域,AlphaEvolve担当了重要角色,旨在寻找更高效的算法,甚至在矩阵乘法的基础操作上取得了新突破,推动了现代神经网络的发展。Hassabis形容这是AlphaEvolve的“第37手时刻”,如今这一发现正在服务于数据中心的优化与量子计算的研究。
AI协作科学家系统则改进了科研流程,引入了“辩论式搜索”的概念,让多个智能体共同探讨科学假设,以筛选出最具价值的研究方向。在尽职尽责的研究中,该系统成功复现了研究人员多年精力所致的抗菌素耐药性假设。可见,AI的协作能力在科学研究中已经显示出巨大的潜能。
如今,AlphaGo所展现的技术正通过Gemini继续演化。最新的Gemini模型将AlphaGo和AlphaZero开创的搜索与规划技术融入其推理机制,并且以多模态为基础,直接建立对世界的理解。Hassabis认为,实现真正的通用人工智能(AGI)需要三个要素同时成立:世界模型、AlphaGo式的搜索规划能力以及合作调用专用工具的能力。
Hassabis在反思未来时指出,真正的AGI不仅能在围棋中开辟新的策略,更能创造出值得人类研究数百年的新游戏。这一理想与现实之间的距离,展现了从寻找答案到提出问题的巨大跨度。
当今的AI在寻求答案的道路上已走得相当远,但对于提出问题的探索仍在继续。李世石这位曾遭遇AlphaGo的棋手,如今身为学者,回忆起那场比赛时表示,让人清尊的,是AI时代的来临。十年过去了,许多早已成为现实的未来图景,DeepMind如同先行者一般不断向前。
我们不禁要问,未来又将出现怎样的“第37手”时刻?尽管Hassabis未能给出确定的答案,他坚信那些伟大的目标正在前方等候我们去追寻。
