{"text":[[{"start":7.17,"text":"本文作者是剑桥大学(University of Cambridge)理论宇宙学家、印孚瑟斯-剑桥人工智能中心(Infosys-Cambridge AI Centre)主任"}],[{"start":14.33,"text":"数学曾经被认为相对安全,不会受到即将到来的人工智能(AI)自动化洪流的冲击。聊天机器人或许能够按照要求生成文本、代码和图像,但数学所需的深度推理应该超出其能力。因此,OpenAI和DeepMind最近在国际数学奥林匹克竞赛(IMO)上获得的金牌,让像我这样的数学教授突然感到不那么安全了。"}],[{"start":37.7,"text":"AI会像已经在编写代码一样进行数学证明吗?毕竟,两者有明显的相似之处:两者都是高度结构化的“语言”,具有明确的约定和有限的“词典”。两者都有巨大的例题库,可以利用这些例题的已知解法训练AI。"}],[{"start":55.400000000000006,"text":"然而,尽管尖端AI数学模型生成的结果令人印象深刻,但生成式AI仍难以解答另一类数学问题:简单计算。问“5.11减5.9等于多少?”,得到的答案各不相同。今天早上,OpenAI最新的GPT5模型给出了-0.79的正确答案。但是把这个问题作为一项计算的一部分表述,你可能会得到一个不同的答案。"}],[{"start":81.4,"text":"我们应该如何看待这样的AI模型,它可以超越高中阶段奥林匹克竞赛对手,却不能总是做对小学水平的加减法?为了理解这一点,思考一下擅长数学意味着什么是有帮助的。"}],[{"start":94.96000000000001,"text":"数学的教学方式是向学生展示一道题,演示解题所需的方法,然后布置例题。能力较弱的学生需要大量例题,有时最后只记住了方法但不理解它。能力最强的学生只需要一两个例题就能掌握概念并将其应用于解答新题。"}],[{"start":113.15,"text":"最优秀的数学家的特点是具有概念化和一般化的能力。优秀的数学家解答难题;伟大的数学家能够找到使难题变简单的方法。"}],[{"start":123.21000000000001,"text":"AI模型的优势在于它们的速度和以极高的数量进行“练习”的能力。这意味着它们可以解答非常难但与它们之前见过的题有一些相似之处的题,但在面对新题时可能会犯难。这对理论数学来说尤其是个问题。当你解答更深奥的题时,可用于训练的例题数量大幅减少。"}],[{"start":144.9,"text":"这些都是神经网络领域众所周知的问题。它们擅长插值法(生成“介于”它们以前见过的情形之间的答案),不擅长外推法(生成超出它们训练集的答案)。"}],[{"start":157.16,"text":"在数学中,听起来相似的题使这变得格外难。例如:“你能够在一个体积为64的立方体中最多放下多少个体积为1的立方体?”和“你能够在一个体积为64的球体中最多放下多少个体积为1的球体?”它们听起来很相似,但其中一个很容易解答(立方体可以在一个4x4x4的方块内严丝合缝地堆叠在一起),另一个则很棘手(球体无法恰到好处地堆叠)。"}],[{"start":186.62,"text":"这意味着AI在应用数学和宇宙学中的使用仍然受限。我们可以把我们已经知道如何做的事情用AI来实现自动化。但到目前为止,计算方面几乎没有进展。"}],[{"start":199.38,"text":"然而,有可能更多的训练将解决这个问题,而不再需要外推法。如果可以喂给AI模型足够多的复杂计算,它们或许可以在不需要任何人类水平的灵感的情况下解答迄今难住我们的题。"}],[{"start":213.54,"text":"在我的专业被问的一个问题是:“一个速度极快、训练极好但无思考能力的数学家有多强大?”我们正在找寻答案。"}],[{"start":222.56,"text":"译者/何黎"}]],"url":"https://audio.ftmailbox.cn/album/a_1755773134_7663.mp3"}