AI证明了80年未解的数学猜想,但比这更值得关注的是另一件事

这周AI圈出了两件大事,一件让人兴奋到头皮发麻,另一件荒诞到让人笑出声。

先说大的。

OpenAI的一个内部推理模型,独立证明了离散几何中悬而未决80年的Erdős平面单位距离猜想。

这可不是”AI辅助人类写论文”那种——模型自己提出了构造、完成了证明、经过了外部数学家验证。Tim Gowers(菲尔兹奖得主)的原话是:”如果这是人类写的论文投到Annals of Mathematics,让我给快速审稿意见,我会毫不犹豫地建议接受。”

Noga Alon(普林斯顿)更直接:”模型的证明用了代数数论中相当复杂的工具,方法优雅且巧妙。”

先搞懂这个猜想到底说了什么

Erdős在1946年问了一个看起来很简单的问题:

平面上放n个点,最多能有多少对点之间的距离恰好等于1?

比如把点摆成方格子,能得出大约 n^(1 + C/log log n) 对单位距离。半个多世纪以来,数学家普遍认为方格子基本就是最优方案了,也就是说单位距离对的数量不可能突破 n^(1+o(1)) 这个天花板。

OpenAI的模型证明了,这个天花板不存在。

模型构造了一种全新的点阵排布,利用代数数论里的类域塔(class field tower)和Golod-Shafarevich理论,找到了比方格子多得多的单位距离对。Princeton的Will Sawin随后把这个下界的指数优化到了 δ = 0.014。

说白了,模型做了一件极其反直觉的事:把代数数论里那些高深的抽象工具,用到了一个纯几何问题上,而且用对了。连数学家看了都直呼”想不到还能这么干”。

从这个角度看,这次突破的意义不亚于AlphaFold在蛋白质折叠上的成就——只不过这次AI攻克的是纯数学,而不是应用科学。

同一天发生的事,画风反差巨大

就在OpenAI发论文的同一天,Anthropic向投资者披露了财务数据:

Q2 2026预计营收109亿美元,运营利润约5.59亿美元——这是Anthropic第一次靠自己赚钱。

109亿美金什么概念?Q1还只有48亿,一个季度翻了一倍多。Claude Code半年就跑出了10亿美元的年化收入,这个增速在开发者工具领域前所未有。

而另一边的Google AI搜索在同一天翻了个让人哭笑不得的车——用户搜”disregard”(忽略)这个词,AI直接回复”收到,指令已忽略”。一个普通英文单词被当成系统指令执行了,Google的AI搜索入口就这么被一个词干趴下了。

三件事挤在同一天,恰好勾勒出了AI行业2026年5月的全景:天花板在突破、商业在起飞、底层逻辑依然脆弱。

为什么数学证明这件事与众不同

AI写诗、画画、写代码,大家都见怪不怪了。但证明一个数学家80年没搞定的猜想,性质完全不同

原因在于:数学证明是结构化的、可验证的、有明确真值的。AI要么做对了,要么做错了,没有中间态。当AI产出了一个经过人类数学家同行评审的证明时,这意味着它具备了以下能力:

  1. 极长的逻辑链:证明涉及多个数学分支,需要几十步甚至上百步的连贯推理,中间断一环就全废。
  2. 跨领域连接:模型把代数数论的工具用到了离散几何上——这种”远距离联想”是高水平数学研究的核心能力。
  3. 独立探索:OpenAI说模型不是针对这个特定问题训练的,而是在一个Erdős问题集上做的通用测试。模型自己决定去构造反例,而不是去证上界。

Tim Gowers说了一句让人印象很深的话:”AI正在开始扮演研究中的创造性角色,尤其是在AI研究本身。”

这对做技术的人意味着什么

当AI能独立做数学研究,技术栈的底层逻辑正在被重写。

以前说”AI替代重复性劳动”,现在AI开始触碰”创造性劳动”的天花板了。如果AI能在纯数学里找到人类80年没找到的构造,那它在算法设计、系统架构、协议优化这些有明确目标的工程问题上,能做的事可能远超我们现在的预期。

当然,数学家们也在泼冷水——这个证明解决的只是猜想的否定(证明原猜想的下界太低),并没有给出最终的上界答案。Thomas Bloom(Erdős问题网站维护者)强调:”知识的前沿是非常’尖刺状’的,AI帮我们更完整地探索了已经建好的数学大教堂,但大教堂本身还有很多未完工的侧厅。”

不过话说回来,一个能帮你探索未知侧厅的AI,已经足够让每个做技术的人坐不住了。

尾巴

5月25日还有一则不太起眼但值得留意的消息:面壁智能联合清华开源了基于昇腾训练的1.58-bit端侧大模型BitCPM-CANN,推理阶段节约约6倍显存。大模型竞赛已经卷到端侧1.58比特了,这赛道是真的一点喘息机会都不给。

一周之内,AI在纯数学里破了80年未解之谜,在商业上跑到了百亿美金营收,在搜索里被一个英文单词干翻。天花板在突破,泡沫在消退,脆弱性依然存在。

做AI这行的,确实没有无聊的一天。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注