专家:为什么世界上最聪明的人工智能,仍在努力解决三年级的数学问题! 在现代人工智能的高风险世界中,系统现在可以起草法律简报、调试软件,并以惊人的流畅性模拟复杂的人类推理。 然而,尽管这些模型在数字方面很复杂,但它们经常会遇到一个教给每个八岁孩子的任务:四位数乘法。这是数字时代的一个奇怪的悖论,一个“锯齿状的边界”,机器可以解释量子物理学,但无法计算4321美元乘以1234美元。这个谜团促使来自芝加哥大学、麻省理工学院、哈佛大学、谷歌DeepMind和其他机构的一组研究人员深入人工智能的“黑匣子”,以了解为什么最简单的数学仍然如此困难。 当人类将大量数字相乘时,我们不仅仅是在脑海中看到答案。我们遵循一种生理和心理仪式:我们乘数字对,我们“携带”一个,我们小心地持有部分乘积,直到将它们加在一起。在计算机科学领域,这些步骤被称为远程依赖。他们需要一个系统来存储一条信息,并在稍后的过程中检索它。 大多数大型语言模型通过识别海量数据集中的模式来学习。为了改进它们,工程师通常会使用标准的微调,这涉及添加更多数据或增加模型的层数(内部处理单元)。然而,当研究小组测试了从2层到12层的模型时,结果令人沮丧。每个模型在四位数问题上的准确率都不到1%。这些模型正在达到局部最优值。他们在训练数据中找到了看起来最好的解决方案,但他们缺乏管理数学所需的内部“文件柜”。由于没有存储和检索中间信息的方法,这些模型有效地试图在一次盲目的跳跃中解决整个问题,而不是一系列有组织的步骤。无论研究人员将模型放大多少,这堵墙仍然存在。这就是为什么世界上最聪明的人工智能,仍在努力解决三年级的数学问题!ai人工之智能 人工智能标准
