纵观 AI 研究 70 年的历程,我们可以得出一个重要启示:基于计算的通用方法最终显示出了巨大的优越性。这一趋势的背后是符合摩尔定律预测的计算成本指数级下降。许多 AI 领域的研究基于了计算资源不变的假设,强调利用人类知识来提升智能体的性能,但从长期来看,计算资源的增长是非常显著的。研究人员为了追求短期成果,常常依赖于对特定领域的深入理解,但从长远来看,如何高效利用计算资源才是关键。虽然理论上这两种方法可以并行不悖,但实际上它们往往存在冲突。专注于一种方法往往意味着忽视另一种。此外,基于人类知识的方法可能会使算法过于复杂,进而影响其适应通用计算方法的能力。许多 AI 研究人员在研究后期才意识到这一点。通过回顾历史上里程碑式的一些案例,我们可以从中获得宝贵的启示。
在计算机国际象棋领域,1997 年的一场比赛标志着一个转折点,当时世界冠军卡斯帕罗夫被一个基于深度搜索算法的程序击败。此前,许多研究者专注于开发反映人类对棋局结构理解的象棋程序,因此对这一意外结果感到失望。面对一个简单的搜索算法与专用软硬件结合所展现出的惊人效率,那些依赖人类知识的研究者难以接受这一失败。他们认为,这种“暴力”搜索方法虽然在这场比赛中取得了胜利,但它并不是一个普遍适用的策略,且与人类下棋的方式大相径庭。这些研究者寄希望于基于人类策略的程序能够胜出,但最终未能如愿。
在围棋领域,研究者大约在 20 年后也经历了类似的情形。最初,研究人员投入大量精力,试图通过利用人类知识或围棋的特殊特征来减少对搜索的依赖。然而,随着高效的大规模搜索算法的引入,这些初步尝试逐渐显得尤为次要,在某些情况下甚至成为了阻碍。此外,自我对弈技术在训练价值评估函数方面起到了关键作用(这种技术在许多其他游戏中,包括象棋,均有类似应用,尽管 1997 年首次击败世界冠军的程序并未依赖此类学习技术)。自我对弈学习以及广义上的学习与搜索类似,都能充分利用大规模的计算资源。在 AI 的发展中,搜索和学习是两种能够充分利用这些资源的关键技术。在计算机围棋的发展过程中,研究者最初侧重于模仿人类的认知理解以减少搜索需求,但最终,采用搜索和学习技术所带来的成功远超预期。
早在 20 世纪 70 年代,美国国防高级研究计划局(DARPA)赞助了一场重要的语音识别竞赛。当时,许多参赛团队采用了依赖于人类知识的处理方法,例如分析单词、音位和人类发声机制。与此同时,另一组参赛者采用了基于统计学的新兴方法,主要依赖隐马尔可夫模型(HMM)进行计算。最终,统计方法再次胜过了基于人类知识的方法。这场胜利对自然语言处理(NLP)领域产生了深远的影响,随着时间的推移,统计和计算方法逐渐成为主流。近年来,深度学习在语音识别领域的应用正是这一趋势的延续,它减少了对人类知识的依赖,利用强大的计算能力和庞大的数据集,显著提高了语音识别的准确性。与棋类游戏领域类似的是,研究人员曾尝试构建反映人类思维方式的系统,并将这些算法集成到计算系统中。然而,随着摩尔定律推动的计算资源的激增,这些努力并未取得预期的成效,这些尝试被证明是徒劳的。
在计算机视觉的早期研究中,常见的方法包括边缘检测、圆柱体识别以及利用 SIFT 等特征处理技术。但随着技术的发展,这些传统方法已被逐渐被淘汰。如今,现代深度学习神经网络主要依赖于卷积操作和特定类型的不变性原理,从而在性能上实现了显著提升。
这是一个深刻的教训,在 AI 领域,我们至今尚未完全吸取这一教训,仍在重复类似的错误。为了理解这一现象并有效抵制这些错误的诱惑,我们必须认识到这些错误背后的症结。我们需要认识到一个苦涩的教训:从长远来看,试图将人类的思维方式直接嵌入到 AI 系统中是行不通的。这一教训源于以下历史经验:
- AI 研究者常倾向于将知识直接嵌入智能体中;
- 这种做法在短期内确实能带来帮助,因为这会令研究者感到自我满足;
- 但从长远来看,这种方式迟早会导致进展停滞,甚至抑制进一步发展;
- 最终的突破往往通过另一种相反的路径实现,即通过搜索和学习来拓展计算能力。
这样的成功虽然引人瞩目,但伴随着一丝苦涩,因为它挑战了以人类知识为核心的方法,这常常难以被广泛接受。
从这苦涩的教训中,我们应该认识到通用方法所具有的强大优势,这些方法能够随着计算资源的持续增加而不断扩展。目前,能够在这种情况下实现无限扩展的两大核心技术是搜索与学习。
从这一苦涩的教训中,我们得出的第二个重要结论是,人类的心智内容极为复杂且这种复杂性是不可避免的。因此,我们应摒弃用简单的方法来理解心智内容,例如试图简化空间、物体、多主体或对称性的概念。这些认知元素反映了外部世界的复杂性,是无穷无尽的,不能简单地通过预设程序来处理。相反,我们应该在 AI 系统中植入能够识别并处理这些复杂性的元方法。这些方法的核心优势在于它们能够寻找到有效的近似解决方案,而这一过程应该由系统通过内在的方法自主完成,而不是由我们直接预设。我们期望的是 AI 系统能够像人类一样自主地探索世界,而不仅仅是复制我们已发现的知识。直接将现有知识嵌入系统,反而可能会阻碍我们对知识发现过程的理解。

WF Research 是以第一性原理为基础的专业顾问服务机构,欢迎关注和留言!
微信:Alexqjl