ChatGPT能获得菲尔兹奖吗？

00:00

{"text":[[{"start":8.17,"text":"本文作者是科学评论员"}],[{"start":11.14,"text":"何杨辉是伦敦数学科学研究所(London Institute for Mathematical Sciences)的研究员，同时也是牛津大学(Oxford)讲师，专攻代数几何和弦理论。上个月，他收到邀请前往美国加州伯克利(Berkeley)度过一个周末，费用全部由邀请方承担——这是不需要犹豫就能答应的事。这次旅行将让他有机会作为“圈内人”，见证一个对其学科而言可能具有历史意义的时刻。"}],[{"start":35.05,"text":"更何况，活动介绍听起来很有趣：与其他顶尖数学家合作，测试最先进的人工智能模型在面对全新问题时，能否达到甚至超过人类中头脑最优秀的一群人集体的推理能力。结果呢？机器的表现超出了预期。“我不是说我们感到了生存威胁，但现场大家普遍感觉到敬畏。”何杨辉对我说。他还带回了1500美元奖金——那是他想出一道难倒了人工智能的题目所获得的奖赏。"}],[{"start":66.44,"text":"用人工智能破解数学难题并不是什么新鲜事。早在2024年初，谷歌DeepMind就推出了一项技术，能够在高中生数学竞赛中表现得有模有样。但与上个月最新AI模型的互动则更像是“在面对一个非常非常优秀的研究生”。"}],[{"start":85.39,"text":"这一时刻有可能改变整个数学领域的生态。虽然机器距离获得菲尔兹奖（Fields Medal，该奖被公认为数学界的诺贝尔奖）仍然遥远，这样的距离让人安心，但下面这种令人不安的未来并非不可想象：数学方面的研究生项目被大幅削减，大学数学系纷纷关闭，毕达哥拉斯(Pythagoras)和欧几里得(Euclid)传下的火炬，被最终交到一个没有面孔的硅基传人手中。"}],[{"start":110.03,"text":"五月中旬的那个周末活动由总部位于美国的非营利组织Epoch AI组织。该组织致力于评估人工智能的能力。在去年秋季发起的一项名为“FrontierMath（数学前沿）”的倡议中，Epoch出资聘请职业数学家提交新的数学问题，并附上相应的解答、证明和推导过程，用来考AI模型。"}],[{"start":133.12,"text":"这些经过精心设计的难题根据难度分为三个等级（包括本科和研究级别的问题），出题者可获得最高1000美元的报酬。Epoch通过加密通讯应用Signal收集这些问题，以避免它们被不小心收录进从互联网上抓取的AI训练数据中。据《科学美国人》(Scientific American)今年四月的报道，OpenAI的一款模型表现超乎预期，解出了大约五分之一题目。"}],[{"start":159.98000000000002,"text":"于是，是时候迎接第四级难题的挑战了：这些问题极其棘手，即便是一群顶尖学者协作，可能也需要数周甚至数月才能解出——而且它们的设计初衷就是要防止AI凭借猜测或蛮力计算破解。包括何杨辉在内的30位学术专家聚集在Epoch位于伯克利的办公室，面对面“头脑风暴”构思新题。保密措施依旧严格：午餐和晚餐从外面送进来；与会者需签署保密协议，何杨辉回忆说，连上厕所都需要刷安保卡。"}],[{"start":193.29000000000002,"text":"AI模型在50道难度级别第四级的题目上的具体表现尚未全部公开。但让何杨辉刮目相看的是，AI技术较2022年实现了多大提升——“那时候ChatGPT连7除以13的小数点后第十位都算不出来……现在它的表现更智能了。”"}],[{"start":212.56000000000003,"text":"他解释称，这款名为o4-mini的AI能够在数分钟内解出部分题目，它会写数学符号，还能调用外部专业软件。他说，最令人印象深刻的是其详尽的文献检索能力，能够找到一些冷门却关键的论文以及编码快捷键。另一位与会者、弗吉尼亚大学(University of Virginia)数学家兼Epoch自由顾问小野健则称测试的结果“令人害怕”。"}],[{"start":238.07000000000002,"text":"这一项目并非没有争议：今年一月，Epoch曾为最初未披露OpenAI对FrontierMath项目的资助而道歉，这一疏漏引发了外界的质疑——人们认为OpenAI旗下的AI模型，包括o4-mini，可能更有条件接触到部分用于基准测试的未公开数学题目。"}],[{"start":255.17000000000002,"text":"目前，AI模型仍无法攻克最艰深的数学题。尽管如此，人们不难想象，下一代AI或将使下一代人类数学家的队伍愈发稀薄。这可能会缩小未来菲尔兹奖得主的候选池，也可能让像黎曼猜想(Riemann Hypothesis)这类著名的未解难题（是六道悬赏100万美元的难题之一）面临更少挑战者。"}],[{"start":278.12,"text":"虽然质数在加密中的应用展示了数学的实际功用，但生活在一个充满了零、无穷与虚数等复杂概念的宇宙中，本身就具有某种深刻的意义。也许，人们对于AI的加入是否会削弱这项人类事业的担忧，终究并非毫无道理。"}],[{"start":295.66,"text":"译者/何黎"}]],"url":"https://audio.ftmailbox.cn/album/a_1750412178_6989.mp3"}

尊敬的用户您好，这是来自FT中文网的温馨提示：如您对更多FT中文网的内容感兴趣，请在苹果应用商店或谷歌应用市场搜索“FT中文网”，下载FT中文网的官方应用。

ChatGPT能获得菲尔兹奖吗？

热门文章

相关话题

法律AI初创公司为律师开辟的另类职业路径

苹果、伯克希尔与耐心的美德

沃什应该倾听美联储的反对声音

Lex专栏：诺和诺德再迎问鼎减重药霸主地位的机会

FT社评：美国欠欧洲盟友一份防务路线图

欧洲能否开发出欧洲版的“战斧”？