这要求写作者具备较强的用户视角。
他们的这种随意实验背景,与60年专业努力形成了鲜明对比。
最近数学圈流传一个故事:一个23岁的业余爱好者,只用一条提示词,就让GPT-5.4 Pro在约80分钟内输出了一份针对Erdős问题1196的论证草稿。这份原始输出引入了人类长期忽略的路径,却结构松散、步骤跳跃,远非严谨证明。陶哲轩和Jared Lichtman随后介入筛选洞见、缩短论证,最终通过Lean形式化确认了结果。这件事比“AI直接解决难题”的标题复杂得多,核心在于人类专家如何处理AI的粗糙输出。
这一点目前行业内仍有不同声音。AI提示工程的成熟度将决定普通人贡献能否常态化,而如果验证机制滞后,则可能稀释社区信任。目前erdosproblems.com采取的透明披露AI使用并鼓励专家把关的做法,是一种积极探索,但能否在更大范围内推广,现在下结论为时尚早。这次事件比“AI又赢了”的简单叙事复杂得多,它正在悄然重塑数学研究的参与格局,却也留下了许多开放问题。
Scientific American等媒体突出“业余者单枪匹马靠AI破解难题”的戏剧性,许多网友最初将焦点放在AI如何绕过人类思维定势上。原始集问题由Erdős、Sárközy和Szemerédi在上世纪60年代提出,核心是对于足够大的整数支持的原始集,其特定加权和是否趋近于1。AI引入von Mangoldt函数与Markov链的结合,这种连接在文献中虽有痕迹,却未被此前研究者以类似方式应用于此类问题。
深入观察,“vibe math”的本质并非AI真正“理解”数学,而是它擅长在海量训练数据中捕捉“氛围”般的直觉连接。人类数学家常因路径依赖和心理障碍,在看似自然的分析序列上集体走偏——例如从概率解释直接跳入,却在第一步就遭遇技术难点。而AI没有这些预设,它用已有90年历史的von Mangoldt函数与Markov链进行全新组合,揭示了整数结构与概率过程间更紧密的联系。这种连接在先前文献中仅有零星暗示,却从未被明确建立。
围绕已解决问题的变体或延伸,往往是最佳练手目标。#1196解决后,其primitive set加权和的细化界限或推广到其他集合,仍留有空间。网站讨论线程显示,下界已较稳固,但定量估计仍有优化余地。输入“用概率方法或整数分解角度重新考察”,让模型生成多条证明路径,再用Lean草稿检查逻辑漏洞,收获显著。AI正帮我们清理这些低垂果实,让专业数学家专注更硬核的方向。
历史经验显示,意外工具常常打破学术僵局,比如望远镜让天文学家看到此前不可见的现象,这次AI扮演了类似“意外连接器”的角色。数据支持这一方向——过去几年AI已在Erdős问题网站上辅助解决数十个条目,但样本量仍有限,多数仍需人类验证。我的判断是,AI正成为强大数学导师,但成功关键始终在于人类的问题拆解与批判验证能力。没有好的问题意识,再强的模型也只是产出一堆待清理的草稿。
短期来看,此类事件很可能刺激更多数学爱好者和业余者涌入erdosproblems.com,使用AI工具尝试开放问题,社区验证流程或将逐步标准化以应对激增的AI辅助提交。长期而言,对专业研究者,AI可能从单纯检索工具升级为思路生成器;对普通从业者和学习者,提示工程能力与批判性验证技能将变得更为关键。
从历史视角看,过去AI在数学领域的许多成果更多是文献检索或已知技巧的重组,而非真正原创洞见。这次Erdős问题1196的解决虽引入了新连接,却仍需Tao和Lichtman等专家的介入才能提炼成可验证的形式。方向是对的——AI确实能提供人类因路径依赖而错过的思路。但现实更复杂:如果多数输出仍需“专家救场”,它就更多是强大生产力工具,而非独立颠覆者。70%和7%的剪刀差,在企业AI部署中早已显现,这次数学事件同样暴露了类似鸿沟。
深层观察,这次事件的关键不在于AI独自完成证明,而在于它以“vibe mathing”的方式生成新鲜思路。Liam Price的提示极为朴素,没有前期文献调研或复杂引导,模型却将数论中广为人知的工具首次有效应用于此具体问题。人类数学家多年来受思维定势影响,倾向于某种自然却遮蔽选项的框架;AI则不受这些先入之见束缚,保留纯分析路径并利用von Mangoldt权重化解难点。
失误分析的落地数据与行业预期之间仍存在明显剪刀差,值得每一位从业者持续复盘。