ChatGPT能获得菲尔兹奖吗? - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
观点 人工智能

ChatGPT能获得菲尔兹奖吗?

安贾娜•阿胡贾:多款新的AI模型在面对新的数学难题时的表现超出世界顶尖数学家的预期,让人担忧这会对人类的数学事业产生何种影响。
00:00

{"text":[[{"start":8.17,"text":"本文作者是科学评论员"}],[{"start":11.14,"text":"何杨辉是伦敦数学科学研究所(London Institute for Mathematical Sciences)的研究员,同时也是牛津大学(Oxford)讲师,专攻代数几何和弦理论。上个月,他收到邀请前往美国加州伯克利(Berkeley)度过一个周末,费用全部由邀请方承担——这是不需要犹豫就能答应的事。这次旅行将让他有机会作为“圈内人”,见证一个对其学科而言可能具有历史意义的时刻。"}],[{"start":35.05,"text":"更何况,活动介绍听起来很有趣:与其他顶尖数学家合作,测试最先进的人工智能模型在面对全新问题时,能否达到甚至超过人类中头脑最优秀的一群人集体的推理能力。结果呢?机器的表现超出了预期。“我不是说我们感到了生存威胁,但现场大家普遍感觉到敬畏。”何杨辉对我说。他还带回了1500美元奖金——那是他想出一道难倒了人工智能的题目所获得的奖赏。"}],[{"start":66.44,"text":"用人工智能破解数学难题并不是什么新鲜事。早在2024年初,谷歌DeepMind就推出了一项技术,能够在高中生数学竞赛中表现得有模有样。但与上个月最新AI模型的互动则更像是“在面对一个非常非常优秀的研究生”。"}],[{"start":85.39,"text":"这一时刻有可能改变整个数学领域的生态。虽然机器距离获得菲尔兹奖(Fields Medal,该奖被公认为数学界的诺贝尔奖)仍然遥远,这样的距离让人安心,但下面这种令人不安的未来并非不可想象:数学方面的研究生项目被大幅削减,大学数学系纷纷关闭,毕达哥拉斯(Pythagoras)和欧几里得(Euclid)传下的火炬,被最终交到一个没有面孔的硅基传人手中。"}],[{"start":110.03,"text":"五月中旬的那个周末活动由总部位于美国的非营利组织Epoch AI组织。该组织致力于评估人工智能的能力。在去年秋季发起的一项名为“FrontierMath(数学前沿)”的倡议中,Epoch出资聘请职业数学家提交新的数学问题,并附上相应的解答、证明和推导过程,用来考AI模型。"}],[{"start":133.12,"text":"这些经过精心设计的难题根据难度分为三个等级(包括本科和研究级别的问题),出题者可获得最高1000美元的报酬。Epoch通过加密通讯应用Signal收集这些问题,以避免它们被不小心收录进从互联网上抓取的AI训练数据中。据《科学美国人》(Scientific American)今年四月的报道,OpenAI的一款模型表现超乎预期,解出了大约五分之一题目。"}],[{"start":159.98000000000002,"text":"于是,是时候迎接第四级难题的挑战了:这些问题极其棘手,即便是一群顶尖学者协作,可能也需要数周甚至数月才能解出——而且它们的设计初衷就是要防止AI凭借猜测或蛮力计算破解。包括何杨辉在内的30位学术专家聚集在Epoch位于伯克利的办公室,面对面“头脑风暴”构思新题。保密措施依旧严格:午餐和晚餐从外面送进来;与会者需签署保密协议,何杨辉回忆说,连上厕所都需要刷安保卡。"}],[{"start":193.29000000000002,"text":"AI模型在50道难度级别第四级的题目上的具体表现尚未全部公开。但让何杨辉刮目相看的是,AI技术较2022年实现了多大提升——“那时候ChatGPT连7除以13的小数点后第十位都算不出来……现在它的表现更智能了。”"}],[{"start":212.56000000000003,"text":"他解释称,这款名为o4-mini的AI能够在数分钟内解出部分题目,它会写数学符号,还能调用外部专业软件。他说,最令人印象深刻的是其详尽的文献检索能力,能够找到一些冷门却关键的论文以及编码快捷键。另一位与会者、弗吉尼亚大学(University of Virginia)数学家兼Epoch自由顾问小野健则称测试的结果“令人害怕”。"}],[{"start":238.07000000000002,"text":"这一项目并非没有争议:今年一月,Epoch曾为最初未披露OpenAI对FrontierMath项目的资助而道歉,这一疏漏引发了外界的质疑——人们认为OpenAI旗下的AI模型,包括o4-mini,可能更有条件接触到部分用于基准测试的未公开数学题目。"}],[{"start":255.17000000000002,"text":"目前,AI模型仍无法攻克最艰深的数学题。尽管如此,人们不难想象,下一代AI或将使下一代人类数学家的队伍愈发稀薄。这可能会缩小未来菲尔兹奖得主的候选池,也可能让像黎曼猜想(Riemann Hypothesis)这类著名的未解难题(是六道悬赏100万美元的难题之一)面临更少挑战者。"}],[{"start":278.12,"text":"虽然质数在加密中的应用展示了数学的实际功用,但生活在一个充满了零、无穷与虚数等复杂概念的宇宙中,本身就具有某种深刻的意义。也许,人们对于AI的加入是否会削弱这项人类事业的担忧,终究并非毫无道理。"}],[{"start":295.66,"text":"译者/何黎"}]],"url":"https://audio.ftmailbox.cn/album/a_1750412178_6989.mp3"}

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

玛格丽特•米切尔:通用人工智能不过是“氛围和蛇油”

人工智能伦理领域的先驱之一解释了为何人类需求应成为科技发展的核心驱动力。

谁能在伊朗问题上影响特朗普?

从JD•万斯到“猩猩”,MAGA忠诚支持者和军方领导人正争夺在椭圆形办公室的影响力。

为什么华尔街害怕一个33岁的政治局外人

进步派候选人佐赫兰•马姆达尼搅动了纽约市长选举,城市精英们想要阻止他。

以色列空袭伊朗伊斯法罕核设施,特朗普权衡是否介入战争

美国总统认为欧洲领导的停火谈判无效。

扎克伯格如何释放他内心的角斗士

Meta老板的转变震惊了公司内部的自由主义者,但他最亲密的盟友说,这就是他一直以来的样子。

一周新闻小测:2025年6月21日

您对本周的全球重大新闻了解如何?来做个小测试吧!
设置字号×
最小
较小
默认
较大
最大
分享×