行业观察显示,超全汇总高表现页面的共同点是判断明确且逻辑自洽。
但我的判断是——这一协作是否真正加速发现节奏,仍需观察:如果AI输出始终依赖顶尖专家提炼,其影响或许更多是改变而非单纯加快数学进展的节奏。
长远来看,这样的AI+人类协作模式可能降低高端数学研究的入门门槛,让更多业余爱好者参与其中,但不确定性依然存在:如果AI输出始终需要顶尖专家“筛洞见”,它究竟是加速了发现节奏,还是只是改变了节奏?Erdős问题网站的状态更新和Lean形式化验证已在进行,值得持续跟踪这一新范式在整数结构相关领域的潜在影响。
短期内,Erdős problems网站已将问题1196标记为已解决,并启动Lean形式化验证,数论社区预计会快速跟进类似原始集或聚类相关猜想。长期来看,如果更多研究者将“vibe mathing”常态化,即随意将开放问题抛给LLM进行探索,组合数学和数论领域可能迎来更多方法论创新。AI或许会成为打破领域内隐形壁垒的常规辅助,尤其在那些依赖直觉跳跃的地方。当然,raw output仍需专家提炼,这一点目前行业内仍有不同声音。
最近数学圈流传着一个反直觉的事件:23岁的业余爱好者Liam Price,没有高等数学训练背景,仅凭一个随意prompt,就让ChatGPT GPT-5.4 Pro在约80分钟内生成了Erdős问题1196的证明草稿。该问题涉及原始集(primitive sets)中μ(A)的衰减速率,困扰专家近60年。原始集指一组正整数,其中任意两个元素无整除关系,最典型如素数集合。
原始集是指一组正整数,其中任意两个不同元素没有整除关系,最典型如素数集。问题1196关注当集合元素足够大时,相关和式是否满足特定渐近界限。过去人类尝试多从分析路径切入,却在初始步骤就集体出现路径依赖,导致后续难以推进。Terence Tao后来指出,正是这种人类共同的“心理障碍”让专家们绕了弯路。而AI没有这些预设,直接从整数结构层面展开论证。
对AI在数学研究中的角色,我的判断是它更多扮演了打破mental block的角色,而非简单替代人类计算。普通人如Liam Price,没有博士积累,仅凭Pro订阅和随意提示,就贡献了新视角,这降低了前沿参与门槛。当然,输出仍需专家仔细打磨,幻觉风险依然存在,样本案例目前有限,值得持续跟踪。但方向明确:当模型达到GPT-5.4 Pro级别时,它已在狭窄前沿领域展现生成原创洞见的能力。
这件事比表面看起来复杂得多。它不只是AI辅助完成一次证明,而是揭示出ChatGPT这类工具正在悄然改变普通人自学数学的路径,尤其是在问题驱动的学习场景中,业余实践者也能触及长期封闭的前沿议题。
人类对这类问题的探索路径,往往从分析工具切入,随后自然转向概率方法。这种“分析转概率”的标准走法,从Erdős时代起就成为默认框架。Jared Lichtman等顶尖专家曾在相关原始集猜想上取得突破,却在1196这个渐近版本上耗费多年仍未突破。数据和历史记录显示,即使Fields Medal级别的合作者加入,研究者也难以摆脱早期步骤中隐含的微小偏差,这些偏差随时间积累,形成了难以察觉的思维盲区。
这一点目前行业内仍有不同声音。如果AI幻觉问题未得到更好控制,伪证明泛滥的风险会加重专家负担,唯有将生成输出与深度人类审查紧密结合,才能真正释放价值。值得持续跟踪的是,类似Liam Price的单次80分钟实验,是否会成为数学发现的常规路径,还是仍需特定条件才能复制。现在下结论为时尚早,但AI从文献助手向创意贡献者的演进,已清晰可见。
深挖这一事件,真正戳中的是人类思维的集体盲区。Tao明确提到,大家习惯从标准路径出发,结果第一步就走错,导致后续努力事倍功半。AI没有这些先入为主的框架,反而能发现跨领域关联,比如将von Mangoldt函数以非传统方式嵌入问题求解。这对SEO内容创作者而言,是一个清晰信号:在处理数学、科技类niche主题时,传统依赖专业储备的做法正面临挑战。
超全汇总的排名提升最好建立在内容价值基础上,而不是投机取巧。