这一点,目前行业内仍有不同声音。
Hacker News深层辩论集中在AI是否展现了“真实智能”。部分评论认为这更接近“vibe-maths”式的直觉联想,而非严格原创证明;另一些人则看到潜力,AI能在高维搜索中发现人类因路径依赖而忽略的关联。Terence Tao指出,人类研究者集体在初始步骤上拐了一个小弯,导致长期受阻,而AI没有这些心理包袱,直接尝试了不同路径。
另一关键标准是可计算验证性。允许有限枚举或生成数据的题目,AI能通过迭代脚本快速检查猜想,而人类手动穷举往往力不从心。子集和相关变体就是典型:给定集合,子集和是否唯一或满足特定条件,网站上部分已有下界结果,OEIS提供序列支持。让模型编写动态规划代码,枚举n在10-20范围内的实例,再分析输出模式,常常能发现人类忽略的规律。这个过程不只推进问题,还能直观展示AI在离散优化上的效率。
事件迅速在社区发酵。Price将AI生成的LaTeX草稿发布到erdosproblems.com论坛后,斯坦福数学家Jared Duker Lichtman和菲尔兹奖得主Terence Tao介入讨论。主流报道多强调“业余者单枪匹马借助AI破解难题”,网友初步反应充满兴奋,认为AI成功绕过了人类常见的思维定势,用一种此前未被尝试的路径连接了不同数学领域。
长远来看,如果类似“vibe mathing”的提示技巧持续成熟,普通人的有效贡献或将成为数学进步的常规补充,Erdős问题的解决速度有望明显加快,社区也将迎来更多AI辅助尝试。不过,专家审查机制能否跟上海量生成内容,仍是一个开放变量。值得持续跟踪的是:当人机协作成为常态时,数学社区的验证流程和知识生产范式,会发生怎样的结构性调整?现在下结论或许为时尚早,但变化的迹象已然显现。
实际操作中,这种AI辅助内容创作的潜力远不止数学难题。你可以让AI针对一个Erdős相关或类似科技冷门话题,生成3-5个不同切入角度的大纲,包括历史背景、跨界类比和公式应用。然后自己补充专家观点、真实案例和对读者的意义,测试这些内容在搜索中的表现。经验显示,提示越带探索性,AI输出的新意就越多,但后续验证环节绝不能省略。值得持续跟踪,现在下结论为时尚早。
深入观察,这次证明的技术路径颇具启示。Price采用的“vibe mathing”本质上是凭直觉的提示工程,他没有遵循传统逐步推导,而是让模型自由探索。GPT-5.4 Pro意外避开了人类研究中常见的“第一步就走偏”陷阱,没有转向概率视角,而是坚持用von Mangoldt函数构建解析框架,巧妙利用其与对数和素因子分解的内在联系,绕过了此前所有尝试的分析障碍。
表面信息往往停留在“业余爱好者武装ChatGPT就能解决难题”的叙事上。Terence Tao在评论中指出,此前人类尝试几乎都在初始步骤上陷入固定思维模式,而这次AI生成的证明采用了一种非标准路径,绕过了常见盲区。不过,主流讨论容易忽略关键细节:这并非AI首次辅助Erdős问题,此前已有工具帮助文献挖掘或部分解法生成。
历史类比或许能说明当前转折。当年计算器普及后,它解放了人类的计算力,让研究者把精力转向更高层的策略与创意。今天AI正在类似地解放idea生成环节。过去小团队或业余创作者面对复杂科技话题时,常因知识门槛而浅尝辄止;如今他们可以快速让AI生成多个大纲、不同角度的公式应用或跨界比喻,然后手动验证、补充独特观点,形成具备搜索意图的深度内容。
陶哲轩和Lichtman的精炼工作体现了人机协作的核心:他们缩短证明长度,清理冗余步骤,并将核心想法表述得更透明连贯。原始版本要求专家仔细sift through才能理解其真正意图,精炼后则清晰展现为一种典范权重下的 hitting-probability论证。Lean形式化过程进一步确认正确性,如今erdosproblems.com已将问题标记为已解决,并附上专家讨论记录。
对普通人而言,Liam Price的故事打开了一种新可能性。前沿数学不再是博士和顶尖专家的封闭领地。借助GPT-5.4 Pro级别的模型,任何人只要愿意尝试“vibe mathing”——简单、直觉地提问——都可能贡献意外视角。当然,AI输出需要人类仔细打磨和验证,它更像是提供不同“第一步”的催化剂,而非完整答案。
提炼精华的真实表现,将决定行业下一阶段的竞争格局。