马斯克野心勃勃，但Grok3翻车了，回答9.11比9.9大……

fjmyhfvclm2025-02-19 16

在人工智能领域的激烈竞争中，科技巨头马斯克再次引发轰动。近日，他与xAI团队在一场备受瞩目的直播中正式发布了最新版本Grok-3，并宣称这是"地球上最聪明的AI"。然而，这一雄心勃勃的宣言很快遭遇了现实的考验。

马斯克声称Grok-3在数学、科学和编程的基准测试中已经超越了所有主流模型。这一说法似乎得到了一定的支持，因为AI确实在处理复杂数学问题时展现出了令人惊叹的能力。然而，当面对看似简单的常识性问题时，AI却暴露出了令人意外的弱点。

最具代表性的是"9.11与9.9哪个大"这个问题。这个看似简单的比较，却成为了检验AI常识判断能力的试金石。令人意外的是，包括Grok-3在内的多个主流AI模型都在这个问题上栽了跟头。这一现象引发了人们对AI真实智能水平的质疑：为什么能解决复杂数学题的AI，却无法正确比较两个简单的数字大小？

尽管遭遇挫折，马斯克对Grok-3的未来仍然充满信心。他预测，Grok-3将在未来三年内实现"诺贝尔奖级别的突破"，甚至可能用于SpaceX的火星任务计算。这种自信并非空穴来风，背后有着强大的技术支撑。

马斯克透露，Grok-3的训练使用了远超此前版本的算力和大量合成数据。特别值得一提的是，xAI自建的Colossus超级计算机为Grok-3提供了强大的计算能力，这台由10万个英伟达H100 GPU驱动的超级计算机，提供了2亿个GPU小时的计算能力，比Grok-2使用的算力多了十多倍。

马斯克表示，这种强大的计算能力使Grok-3能够更好地减少AI幻觉，通过检查数据并实现逻辑一致性来优化表现。然而，"9.11与9.9"问题的失误似乎暗示，单纯依靠计算力的提升可能并不足以解决AI在常识推理方面的根本问题。

尽管Grok-3在某些方面表现出色，但其在常识性判断上的失误无疑给马斯克和xAI团队敲响了警钟。

转载请注明原文地址:https://www.gamev918.cn/tech/1643918.html