• OpenAI 副总裁凯文·韦尔在一条已删除的推文中错误地声称 GPT-5 解决了“之前未解决的”埃尔德什数学问题

  • 数学家托马斯·布卢姆透露,GPT-5 仅在文献中找到了现有解决方案,而没有发现新的发现

  • 这一事件突显了行业内关于 AI 能力声明和科学准确性的持续紧张局势。

OpenAI 在高管们错误地声称 GPT-5 解决了之前未解决的数学问题后,遭到了全行业的嘲讽。争议爆发于副总裁 Kevin Weil 现在已被删除的推文,其中声称取得了突破性发现,但被揭露为对“未解决”问题构成的基本误解,引发了竞争对手和数学家们的严厉批评。

OpenAI 刚刚给了其竞争对手完美的弹药。这家公司的最新尴尬始于副总裁 Kevin Weil 在社交媒体上发布了他认为是一场胜利的庆祝,声称 GPT-5“找到了 10 个(!)之前未解决的 Erdős 问题的解决方案,并在其他 11 个问题上取得了进展。”

该帖子,Weil 后来已将其删除,在 AI 社区引起了波澜——但并非 OpenAI 所期望的那种。Meta 的首席 AI 科学家 Yann LeCun 迅速作出反应,将情况描述为“自食其果”,而 Google DeepMind 首席执行官 Demis Hassabis 则简单地称之为“尴尬”。

现实中的这些说法远不如革命性那么引人注目。维护权威的埃尔德什问题网站的数学家托马斯·布卢姆解释说,这些问题实际上并不是在传统意义上的“未解决”。当布卢姆在他的网站上列出一个问题为“开放”时,这仅仅意味着“我个人不知道有解决这个问题的论文”——并不是数学界认为它是活跃的研究前沿。 布卢姆澄清说:“GPT-5 找到了一些参考文献,这些参考文献解决了这些问题,而我个人并不知道。”这实际上是对 OpenAI 的叙述的一个毁灭性的纠正。换句话说,AI 并没有破解任何数学之谜——它只是进行了一些文献搜索,发现了布卢姆尚未编目的一些论文。

“GPT-5 找到了一些参考文献,这些参考文献解决了这些问题,而我个人并不知道,”布卢姆澄清道,这实际上是对 OpenAI 的叙述的一个毁灭性的纠正。换句话说,AI 并没有破解任何数学之谜——它只是进行了一些文献搜索,发现了布卢姆尚未编目的一些论文。

情况变得更加尴尬,当 OpenAI 的研究员 Sebastien Bubeck 试图挽救这些说法时。在承认“只找到了文献中的解决方案”后,他试图将这一点说成仍然值得关注,辩称“我知道查阅文献有多难。”这种辩护在批评者面前显得苍白无力,他们指出,复杂的文献搜索远非 OpenAI 承诺其下一代模型将拥有的突破性能力。

这一事件反映了人工智能行业中的一个更广泛模式,即公司竞相宣布听起来比实际更令人印象深刻的性能。以多产数学家保罗·埃尔德什命名的埃尔德什问题代表了真正的数学挑战——这使得虚假主张对 OpenAI 的科学可信度造成了特别损害。

竞争动态不容忽视。MetaGoogle 一直与 OpenAI 陷入一场人工智能军备竞赛,两家公司的领导人抓住这次失误来强调其竞争对手的信誉差距。LeCun 尖锐的“GPTards”评论代表了来自一位主要人工智能研究者的关于 OpenAI 营销方法的最为严厉的公开批评。

对于 OpenAI 来说,时机再糟糕不过了。该公司一直将 GPT-5 定位为推理能力的一大飞跃,尤其是在数学和科学领域。这些虚假的突破性声明现在对公司所宣传的其他性能指标和能力产生了怀疑。

数学界的反应迅速而严厉。当维护权威问题数据库的研究人员公开纠正你的说法时,这清楚地表明你宣布背后的科学严谨性值得怀疑。

这使得损害尤其严重的是这些主张的验证如此容易。与人工智能创造力和推理的主观评估不同,数学问题解决有明确的基准和既定的文献。OpenAI 高管在公开之前没有将这些主张与这些标准进行验证的事实表明,他们的验证过程中存在令人担忧的差距。

这一数学错误揭示了人工智能发展中责任和科学严谨性的更深层次问题。当行业领导者提出容易证伪的突破性能力主张时,这破坏了对合法人工智能进步的信任,并为质疑整个领域可信度的批评者提供了弹药。对于 OpenAI 来说,教训是明显的:在一个建立在技术精确性之上的行业中,营销精确性同样重要。