概要:2024年1月17 日Google DeepMind最近推出了一款名为AlphaGeometry的人工智能系统,该系统能够解决复杂的几何问题。其表现已可与最聪明的高中数学家相媲美,并远超之前的最先进系统。专家表示,这是朝着拥有更类似人类推理能力的机器迈出的重要一步。
几何与数学的挑战
几何和更广泛的数学领域一直是人工智能研究者的挑战。与基于文本的AI模型相比,数学的训练数据要少得多,因为它是符号驱动和领域特定的。解决数学问题需要逻辑推理,这是当前大多数AI模型所不擅长的。因此,数学成为衡量AI智能进步的重要基准。
AlphaGeometry:结合语言模型与符号引擎
DeepMind的程序AlphaGeometry结合了语言模型与一种称为符号引擎的AI。语言模型擅长识别模式和预测过程中的后续步骤,但其推理缺乏数学问题解决所需的严谨性。而符号引擎则完全基于形式逻辑和严格规则,可以引导语言模型做出理性决策。这两种方法分别负责创造性思维和逻辑推理,共同解决困难的数学问题,这与人类解决几何问题的方式非常相似。
令人印象深刻的测试结果
DeepMind表示,他们在与国际数学奥林匹克竞赛同等难度的30个几何问题上测试了AlphaGeometry。该系统在规定时间内完成了25个问题,远超1978年中国数学家吴文俊开发的先前最先进系统(仅完成10个问题)。“这是一个非常令人印象深刻的结果,”波恩大学数学教授Floris van Doorn表示,“我原本以为这还需要多年的时间。”
AI的推理能力与新的数学发现
DeepMind称,该系统展示了AI的推理能力和发现新数学知识的能力。当面对一个几何问题时,AlphaGeometry首先尝试使用其符号引擎生成证明。如果仅使用符号引擎无法解决问题,语言模型会在图表中添加一个新的点或线,从而为符号引擎开辟更多的可能性以继续寻找证明。这个过程会持续进行,直到找到可验证的解决方案。
未来的应用与改进空间
尽管AlphaGeometry已经展示了令人瞩目的能力,但仍有改进的空间。目前,它能够解决“初等”数学中的问题,但还无法应对大学阶段的高级、抽象问题。研究者表示,他们的目标是将类似的方法应用到更广泛的数学领域中。“几何只是我们用来证明AI能够进行深度推理的一个例子,”Wang说道。
此外,该系统在数学之外的领域也具有潜在影响,如计算机视觉、建筑甚至理论物理等依赖几何问题解决的领域。这一重要进展再次证明了AI在推动科学进步和帮助我们理解世界运作方式方面的巨大潜力。
资讯、工具、教程、IT服务!
扫描以下二维码加群
告诉管理员您遇到的问题
我们会第一时间为您挑选优质教程和帮您解决问题