【新智元导读】近期,关于Grok 3成功证明黎曼猜想的消息引起了广泛关注。尽管这看起来像是一个玩笑,但让我们仔细分析下,AI距离解决千禧年数学难题还有多远。
黎曼猜想,被Grok 3“证明”了? xAI暂停了Grok 3的训练以验证其证明,若结果正确,将完全终止模型的训练。xAI工程师Hieu Pham在社交媒体上的“爆料”成为了AI圈最热门的话题。
要知道,黎曼猜想是千禧年七大数学难题之一,被誉为“猜想界的皇冠”。这一消息让网友们直接懵了,真假难辨……
几个小时后,Pham的另一个帖子证明这只是一个调侃。恶搞的起因是一位网友Andrew Curran最先“爆料”,称Grok3在训练时发生了灾难性事件。
明眼的网友很快便质疑道:LLM训练怎么会出现灾难性事件?即便是出现loss激增,也只需回到上一个Checkpoint,调整一下,就可以继续训练。除非是服务器全烧了,数据全都不剩了……
眼瞧着消息越传越广,xAI联创Greg Yang坐不住了。他用讽刺的语气调侃道:“对对对,Grok 3训着训着突然开始攻击办公室的保安了。”
另一位研究人员Heinrich Kuttler也接梗道:“对对对,情况非常糟糕!我们后来用nan(Not a Number,非数)把所有坏的权重都替换了一遍,才恢复。”
网友见状,也跟着玩起了梗。
要攻克黎曼猜想,还差些什么? 言归正传,让我们来仔细看一下,目前人类离攻克黎曼猜想还有多远。
如今,“黎曼猜想”就像是一座巍峨的高峰,165年来从未有人成功攀上。它就像大海中的灯塔,为数学领域的发展指明方向:很多数论和复变函数领域的工作都基于黎曼猜想为真这个前提,因此一旦证明了黎曼猜想,许多其他工作也会得到完整的证明。
黎曼猜想起源于德国数学家高斯,他给出了一个公式,能够近似地预测出任意数字的素数个数。在1859年,德国数学家波恩哈德·黎曼改进了高斯的公式,用涉及复变量函数演算的方法,得出一个原创公式。这就是赫赫有名的“黎曼猜想”。
根据公式,能够画出无穷多个点。黎曼猜测,这些点有一定的排列规律,一部分在一条横线上,另一部分则在一条竖线上,所有点都在两条直线上排列,无一例外。理论上,无法证明是否所有的点都在这两条线上,但是,只要有一个点不在,就能推翻黎曼猜想!
现在,数学家们已经用计算机验证了最初的15亿个点,全部符合黎曼猜想。2022年,张益唐发表111页论文,宣布本质上已证明朗道-西格尔零点问题——广义黎曼猜想的一种特殊且弱得多的形式。
用他的话说就是,关于零点猜想问题,“大海里的针我没捞到, 但海底地貌我探得差不多了”。
当然,尽管我们离完全解决这一猜想还很遥远。
AI的数学能力,到底什么水平? 这么说起来,目前的AI是否真的有证明黎曼猜想的能力呢?
我们可以来看看,爆火全网的AI证明工具AlphaProof,是如何做出IMO 2024的三道题的。从某种角度来说,IMO数学竞赛题跟“猜想界的皇冠”黎曼猜想距离有多远,那离AI证明黎曼猜想也就有多远。
谷歌DeepMind研究人员,AlphaProof负责人Rishi Mehta最新博客中,介绍了AlphaProof在IMO中的最新表现。4个月前,谷歌DeepMind团队发布了两个数学推理新模型AlphaProof和AlphaGeometry 2。前者在破解IMO 2024六道竞赛试题中,做对了其中4道,而且每道题拿下了满分,相当于银牌选手水平(28分)。
在最新进展文章中,Mehta揭示了AlphaProof在IMO 2024解题中最酷的想法。在证明过程中,AlphaProof会使用到Lean生成证明,并且每个Lean证明由一系列策略组成。
因此,Mehta将挑选出对应于这些想法的策略,针对AlphaProof解决的第 1、2和6题进行分析。
AI距离千禧年难题,还有多远? 关于AI究竟能做什么程度的数学题,网友们也就此展开了讨论。
有人认为,数学将是AI最先突破的领域之一,因为存在一个可用的既便宜又快速的反馈循环。数学具有这样的特性:你可以以很少的成本,100%去验证你所做的事是否正确。
而相对于Lean之类的数学证明工具来说,AI验证实验的成本(时间、精力、金钱、安全)都要高出许多数量级。
有网友脑洞大开预测道:数学前沿运动的加速,值得人类建更多发电站!
不过,有一名数学家却在评论区现身说法,认为并不值得用AI这么做。在他看来,计算时间/成本与问题复杂性之间的权衡,值得严肃考虑。
理论上讲,用形式语言找到证明是一件很轻松的事,因为只需一直搜索可能的证明,直到找到所需陈述结尾的证明就可以了。计算的并行化程度如何,硬件能力有多大,AI工具对于数学问题的优化程度如何,都会决定AI用多长时间把证明做出来。
但要说专门建数据中心和发电站,把大量能源用于做数学题,他觉得没有必要——因为这并不是为了数学界的利益,而是硅谷大厂们自己的愿景。
不过如果进一步设想,现在的Alphaproof如果变成具有天文数字计算资源的定理证明器,我们或许有一天就可以证明“P/NP问题”。因为,任何可证明的定理,都可以通过耐心地使用穷举法,列举所有可能的证明来找到。
如果存在一个有限的、格式良好的公式,该公式具有该定理作为结果,那么该定理就可以根据定义证明。
而如果说LLM有什么用处,那就是寻找出令人惊讶的联系,以人类搜索之外的方式,应用现有工具。
AI通过帮助人类解决引理、检查错误、形式化证明,来加速数学研究,在肉眼可见的未来几年内,即将成为现实。
而在去年,微软亚洲研究院、北大、北航等机构的研究人员,就已经通过97个回合的“苏格拉底式”严格推理,成功让GPT-4得出了“P≠NP”的结论。
而这97轮对话,可以说构建出了一个极难的NP完全问题,其中一些实例在时间复杂度低于O(2^n)(即穷举搜索)的情况下是不可解的,也就是说,证明结论为P≠NP。
当然,这个证明过程并不严谨,作者用一个假设(假定任意CSP问题的精确算法都有一个等价的分治算法),绕过了P≠NP问题的难点。
其实,像Christian Szegedy这样的AI专家已经做过此类预测:到2026年底,AI将成为“超人数学家”,解决出黎曼猜想等问题。
离AI解决P/NP问题、黎曼猜想这样的千禧年难题,还会有多远呢?马斯克曾许诺,用10万块H100训练的Grok 3将在年底发布,应该会令人惊叹。如今,这个规模已经扩展到了20万台,再给一点时间,说不定Grok 3真能出奇迹。