2024-07-26发表2025-03-21更新 ByteAILab 12 分钟读完 (大约1741个字)

Google DeepMind 迈向解决顶级数学问题更近一步

尽管计算机被设计得比任何人都能更快地进行数学运算，但正式数学的最高水平仍然是人类的专属领域。

但谷歌DeepMind的研究人员取得了突破，使人工智能系统比以往更接近在数学领域击败最优秀的人类数学家。
一对名为AlphaProof和AlphaGeometry 2的新系统配合起来处理了来自国际数学奥林匹克竞赛的问题，这是一项自1959年以来就一直在全球举办的针对中学生的数学竞赛。奥林匹克竞赛每年有六道令人难以置信的难题，涵盖代数、几何和数论等领域。获得金牌将使您跻身于世界上最优秀的少数青年数学家之列。DeepMind的两个系统合作的效果不完全达到那个水平。在它们的答案由蒂莫西·高尔斯教授评分后，DeepMind团队获得了42分中的28分，足以获得银牌，但仍然差一分无法达到金牌水平。
不同于人类数学家，这些系统要么完美，要么无能为力。在它们解决的每个问题中，它们得分完美，但在六道题中，有两道题它们甚至无法开始着手解答。此外，DeepMind与人类竞争者不同，没有时间限制。学生们有九个小时来解决这些问题，而DeepMind系统花了三天昼夜不停地解决一个问题，尽管另一道问题它瞬间解答完成。
参与挑战的两个系统在工作方法上大相径庭。解决了三个问题的AlphaProof通过将一个大型语言模型（类似于用于消费者聊天机器人的模型）与专门的“强化学习”方法配对，就像DeepMind用于解决围棋问题一样。关键在于利用现有的“形式数学”方法，一个将数学证明编写成仅在其为真时才能运行的程序的规则集。“我们尝试做的是在这两个领域之间搭建一座桥梁，”AlphaProof的负责人托马斯·休伯特说，“这样我们就能利用形式数学带来的保证和非形式数学中提供的数据。”在接受大量英文数学问题培训后，AlphaProof利用自己的知识尝试用形式语言生成具体的证明。由于这些证明可以被验证为真或假，可以教导系统不断改进自己。这种方法可以解决困难问题，但不总是速度快：虽然它远远优于简单的反复尝试，但它花了三天来找到挑战中最难问题的正确形式模型。
另一个系统AlphaGeometry 2同样将语言模型与数学倾向更强的方法配对。但它在几何问题领域的成功令人震惊：它仅用16秒解决了其问题。高尔斯说，AlphaGeometry 2采取了一个令人惊讶的路径。“已经有一些测算的证明例子，长度比维基百科还长。但这不是那样的情况：我们谈论的是一个非常简短、人类风格的输出。”AlphaGeometry 2的负责人Thang Luong将其输出描述为类似于DeepMind在围棋历史性胜利中的“37步”，当时AI系统走了一步没有人类会想到的着法，最终获胜。AlphaGeometry 2的证明包括围绕另一点构造一个圆，然后利用该圆证明整个答案。“起初，我们的专家并没有完全理解它为什么要构造那个点，”Luong说。“但在看完解决方案后，他们认为这个解决方案真的把很多三角形连接在一起，认为这个解决方案真的相当优雅。”
AlphaGeometry 2的最简单问题 …
让ABC是一个三角形，AB < AC < BC。让AI和ω分别是三角形ABC的内心和内切圆。让X是BC线上与C不同的点，使得通过X且平行于AC的线是内切圆ω。类似地，让Y是BC线上与B不同的点，使通过Y且平行于AB的线是内切圆ω。让AI再次与三角形ABC的圆周相交于P，P≠A。让K和L分别是AC和AB的中点。
证明∠KIL + ∠YPX = 180°。
在19秒内解决。
跳过电子报推广注册TechScape免费每周简报
Alex Hern每周深入探讨技术如何塑造我们的生活
输入您的电子邮件地址注册隐私通知：简报可能包含有关慈善机构、在线广告和由外部方资助的内容的信息。有关更多信息，请参阅我们的隐私政策。我们使用Google reCaptcha来保护我们的网站，适用Google隐私政策和服务条款。电子报推广之后…
…以及AlphaProof的最难问题
Turbo蜗牛在一个有2024行和2023列的棋盘上玩游戏。在2022个细胞中有隐藏的怪兽。最初，Turbo不知道怪物在哪个细胞，但他知道除了第一行和最后一行外，每行都有一个怪物，每列最多只有一个怪物。
Turbo进行了一系列尝试，试图从第一行移到最后一行。在每次尝试中，他选择从第一行的任何一个细胞起步，然后重复移动到共享公共边的相邻细胞。（他可以返回到先前访问过的细胞。）如果他到达一个有怪物的细胞，他的尝试结束，他被传送回第一行重新开始新的尝试。怪物不会移动，Turbo会记住每个他访问过的细胞中是否有怪物。如果他到达最后一行的任何一个细胞，他的尝试结束，游戏结束。
确定最小值n: Turbo有一个保证在第n次尝试或更早到达最后一行的策略，不管怪物的位置。
未解决。了解更多关于这些话题的信息：人工智能（AI）、DeepMind、数学、谷歌、技术行业、Alphabet、计算机、新闻。分享。重复使用此内容。

感谢阅读！如果您对AI的更多资讯感兴趣，可以查看更多AI文章：GPTNB。

ByteAILab

2024-07-26

2025-03-21