首页 > 手机资讯 > 手机资讯 > 谷歌推出两大数学模型,19秒解开IMO2024几何问题

谷歌推出两大数学模型,19秒解开IMO2024几何问题

发布时间:2024-07-26 22:54:23来源: 15210273549

六道题每题可得7分,总分最高42分。谷歌DeepMind的人工智能系统在今年国际数学奥林匹克竞赛中最终得分28分。今年金牌的门槛是29分,在正式比赛的609名选手中,58名达到了这一门槛。

DeepMind人工智能系统在IMO 2024上相对于人类竞争者的表现。在42分的总分中,人工智能系统获得了28分。

谷歌DeepMind的AI模型解决了今年国际数学奥林匹克竞赛(IMO)六个问题中的四个问题,人工智能首次达到了银牌标准。

当地时间7月25日,谷歌DeepMind公布专用于数学推理的模型AlphaProof,以及专注于几何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解决了数学中的高级推理问题,具有先进数学推理能力的通用人工智能或开启科学和技术的新领域。

IMO是历史最悠久、规模最大、最负盛名的青年数学家竞赛,自1959年以来每年举办一次。选手要解决代数、组合学、几何和数论方面六个异常困难的问题。菲尔兹奖是数学家的最高荣誉之一,菲尔兹奖获得者也会代表他们的国家参加IMO。

近年来,IMO竞赛被认为是机器学习领域的重大挑战,也是衡量人工智能系统高级数学推理能力的理想基准。

谷歌DeepMind表示,IMO的数学问题被人工翻译成数学语言,供系统理解。在正式比赛中,学生们分两次提交答案,每次4.5小时。而人工智能系统在几分钟内解决了一个问题,花了三天时间来解决其他问题。基于强化学习的推理系统AlphaProof解决了两个代数问题和一个数论问题并被证明答案正确,这些问题包括今年IMO比赛中只有5名选手解决的最难的问题。AlphaGeometry 2证明了几何问题,但两个组合问题仍未解决。

六道题每题可得7分,总分最高可达42分。DeepMind的人工智能系统最终得分28分。DeepMind表示,今年金牌的门槛从29分开始,在正式比赛的609名选手中,有58名达到了这个门槛。

“事实上,这个程序能想出这样一个不明显的结构是非常令人印象深刻的,远远超出了我认为的最先进的水平。”IMO金牌得主和菲尔兹奖牌得主蒂莫西·高尔斯(Timothy Gowers)表示。

在大量书面文本上训练的人工智能模型历来在数学推理方面很困难,往往倾向于语言智能而非数学智能,解决数学问题需要更复杂的推理技能。AlphaProof将预先训练好的语言模型与AlphaZero强化学习算法结合在一起,AlphaZero此前自学了如何掌握国际象棋、将棋和围棋。

大语言模型容易产生幻觉,或以令人信服的方式传递错误信息。DeepMind表示,尽管基于自然语言的方法可以访问更多数据,但会产生看似合理但不正确的中间推理步骤和解决方案。而形式语言提供了一个重要优势,即涉及数学推理的证明可以被形式化地验证其正确性。“我们通过微调Gemini模型,在这两个互补的领域之间建立了一座桥梁,自动将自然语言问题语句转换为形式语句,创建了一个不同难度的庞大形式问题库。”

当遇到一个数学问题时,AlphaProof会生成候选解决方案,然后搜索可能的证明步骤来证明或反驳它们。每一个被发现和验证的证明都被用来强化AlphaProof的语言模型,增强其解决后续更具挑战性问题的能力。

手机资讯更多>>

2.0T+8AT,性能不输BBA!长近4.8米,关键是大轿跑,13万定价 全新奥迪Q5来了,外观,内饰,动力全部大幅升级! 或10万级起,高阶智驾+激光雷达,碳化硅平台大轿跑 比亚迪真正“最美旗舰”要来了,这才是重磅升级! 缤果SUV五座版正式上市,7.58万起,真切中了国人用车需求? 月销超1.6万,中型SUV,还是7座!奇瑞新车仅7万级 5系悬架,E级内饰,超优雅大轿跑!实力超小米SU7,仅十几万 试驾五菱星光S,动力在线、空间大,家用SUV选它很划算 21.99万起,阿维塔07这个价格能不能打? 让AMG GT和帕美成为冤种,腾势靠Z9GT立威? 合资车企也是“中国制造”,改革震荡不该成为唱衰之机 为什么说全新智己LS6,25万以下能打,25万以上未必? 瑞虎9要做“公路之王”,天时地利人和都具备了吗? 马自达欧洲团队调校出来的EZ-6,该值多少钱? L7入局家旅系列,捷途山海能否复制“捷途速度”? 上市半年即换新,25款星途瑶光C-DM有些什么变化? 试驾了捷途山海T1,它会让猛龙和大狗很难受 纯视觉居然唱了主角,激光雷达要被抛弃了吗? 入门纯电家用SUV,10万以内能不能拿下AION Y? 不到13万买RAV4荣放?但同价位国产SUV更好玩 最高优惠6万元,合资SUV十一“放价”,20万以内这几款值得买! 惊艳老外的中国车,零跑C10挑战海外市场,底气来自哪里? 升级大屏和智驾,全新迈腾真实行情如何? 1.5T+8AT,靠谱好开的国产燃油SUV,长安CS75 PLUS值得入手吗? 比亚迪两台重磅产品,广丰再推全新“智驾车”,盘点近期申报新车 重返价格战,30万以内落地,宝马3系优惠力度已放开 选C级车还是A级车?15万左右落地,零跑C01对比小鹏MONA M03 不到15万落地,天籁如今和思域一个档次了? 新款奇瑞瑞虎7 PLUS亮相,换装新前脸,外观很霸气,搭载1.6T动力 新款上汽大通G10正式上市,前置后驱,侧滑门,售价10.8万元起