Google DeepMind 迈向解决顶级数学问题更近一步

尽管计算机被设计得比任何人都能更快地进行数学运算,但正式数学的最高水平仍然是人类的专属领域。


但谷歌DeepMind的研究人员取得了突破,使人工智能系统比以往更接近在数学领域击败最优秀的人类数学家。
一对名为AlphaProof和AlphaGeometry 2的新系统配合起来处理了来自国际数学奥林匹克竞赛的问题,这是一项自1959年以来就一直在全球举办的针对中学生的数学竞赛。奥林匹克竞赛每年有六道令人难以置信的难题,涵盖代数、几何和数论等领域。获得金牌将使您跻身于世界上最优秀的少数青年数学家之列。DeepMind的两个系统合作的效果不完全达到那个水平。在它们的答案由蒂莫西·高尔斯教授评分后,DeepMind团队获得了42分中的28分,足以获得银牌,但仍然差一分无法达到金牌水平。
不同于人类数学家,这些系统要么完美,要么无能为力。在它们解决的每个问题中,它们得分完美,但在六道题中,有两道题它们甚至无法开始着手解答。此外,DeepMind与人类竞争者不同,没有时间限制。学生们有九个小时来解决这些问题,而DeepMind系统花了三天昼夜不停地解决一个问题,尽管另一道问题它瞬间解答完成。
参与挑战的两个系统在工作方法上大相径庭。解决了三个问题的AlphaProof通过将一个大型语言模型(类似于用于消费者聊天机器人的模型)与专门的“强化学习”方法配对,就像DeepMind用于解决围棋问题一样。关键在于利用现有的“形式数学”方法,一个将数学证明编写成仅在其为真时才能运行的程序的规则集。“我们尝试做的是在这两个领域之间搭建一座桥梁,”AlphaProof的负责人托马斯·休伯特说,“这样我们就能利用形式数学带来的保证和非形式数学中提供的数据。”在接受大量英文数学问题培训后,AlphaProof利用自己的知识尝试用形式语言生成具体的证明。由于这些证明可以被验证为真或假,可以教导系统不断改进自己。这种方法可以解决困难问题,但不总是速度快:虽然它远远优于简单的反复尝试,但它花了三天来找到挑战中最难问题的正确形式模型。
另一个系统AlphaGeometry 2同样将语言模型与数学倾向更强的方法配对。但它在几何问题领域的成功令人震惊:它仅用16秒解决了其问题。高尔斯说,AlphaGeometry 2采取了一个令人惊讶的路径。“已经有一些测算的证明例子,长度比维基百科还长。但这不是那样的情况:我们谈论的是一个非常简短、人类风格的输出。”AlphaGeometry 2的负责人Thang Luong将其输出描述为类似于DeepMind在围棋历史性胜利中的“37步”,当时AI系统走了一步没有人类会想到的着法,最终获胜。AlphaGeometry 2的证明包括围绕另一点构造一个圆,然后利用该圆证明整个答案。“起初,我们的专家并没有完全理解它为什么要构造那个点,”Luong说。“但在看完解决方案后,他们认为这个解决方案真的把很多三角形连接在一起,认为这个解决方案真的相当优雅。”
AlphaGeometry 2的最简单问题 …
让ABC是一个三角形,AB < AC < BC。让AI和ω分别是三角形ABC的内心和内切圆。让X是BC线上与C不同的点,使得通过X且平行于AC的线是内切圆ω。类似地,让Y是BC线上与B不同的点,使通过Y且平行于AB的线是内切圆ω。让AI再次与三角形ABC的圆周相交于P,P≠A。让K和L分别是AC和AB的中点。
证明∠KIL + ∠YPX = 180°。
在19秒内解决。
跳过电子报推广注册TechScape免费每周简报
Alex Hern每周深入探讨技术如何塑造我们的生活
输入您的电子邮件地址 注册隐私通知:简报可能包含有关慈善机构、在线广告和由外部方资助的内容的信息。有关更多信息,请参阅我们的隐私政策。我们使用Google reCaptcha来保护我们的网站,适用Google隐私政策和服务条款。电子报推广之后…
…以及AlphaProof的最难问题
Turbo蜗牛在一个有2024行和2023列的棋盘上玩游戏。在2022个细胞中有隐藏的怪兽。最初,Turbo不知道怪物在哪个细胞,但他知道除了第一行和最后一行外,每行都有一个怪物,每列最多只有一个怪物。
Turbo进行了一系列尝试,试图从第一行移到最后一行。在每次尝试中,他选择从第一行的任何一个细胞起步,然后重复移动到共享公共边的相邻细胞。(他可以返回到先前访问过的细胞。)如果他到达一个有怪物的细胞,他的尝试结束,他被传送回第一行重新开始新的尝试。怪物不会移动,Turbo会记住每个他访问过的细胞中是否有怪物。如果他到达最后一行的任何一个细胞,他的尝试结束,游戏结束。
确定最小值n: Turbo有一个保证在第n次尝试或更早到达最后一行的策略,不管怪物的位置。
未解决。了解更多关于这些话题的信息:人工智能(AI)、DeepMind、数学、谷歌、技术行业、Alphabet、计算机、新闻。分享。重复使用此内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Google DeepMind 迈向解决顶级数学问题更近一步

https://www.gptnb.com/2024/07/26/2024-07-25-auto1-8q8Nyr/

作者

ByteAILab

发布于

2024-07-26

更新于

2025-03-21

许可协议