Back to Headlines

“世界模型”重返舞台:人工智能迎来概念复兴

4 天前

“世界模型”——这一曾沉寂多年的AI构想,正迎来复兴。在追求“人工通用智能”(AGI)的前沿实验室中,世界模型被视为关键路径:它是一种AI在内部构建的环境简化版“计算雪球”,使系统能在真实行动前模拟预测与决策,提升智能、安全与适应性。Meta的Yann LeCun、DeepMind的Demis Hassabis以及蒙特利尔AI研究所的Yoshua Bengio等AI领军人物均认为,真正的智能必须依赖世界模型。 这一理念并非新创。早在1943年,苏格兰心理学家肯尼思·克雷克就提出,生物体若在大脑中构建外部现实的“小规模模型”,便能预演多种可能,从而更安全、更高效地应对现实。这一思想预示了认知科学的革命,并将思维与计算紧密联系。20世纪60年代,AI系统SHRDLU曾用“积木世界”回答常识问题,但受限于人工设计,难以扩展。到了80年代,机器人先驱罗德尼·布鲁克斯提出“世界即自身最佳模型”,认为显式表征反而阻碍智能,世界模型一度被冷落。 直到深度学习兴起,世界模型才重获生机。神经网络通过海量数据训练,能自发构建对环境的近似表征,用于完成如虚拟赛车等特定任务。近年来,ChatGPT等大语言模型展现出“涌现能力”——如从表情包推断电影名、下国际象棋,这被许多专家视为世界模型存在的迹象。然而,现实远未如此理想。 当前的生成式AI更像“一堆启发式规则的集合”:它们能高效应对特定场景,却缺乏统一、一致的内部世界表征。研究人员试图从大模型中提取如国际象棋棋盘的完整结构时,往往只找到“蛇的片段”“树的残片”和“绳子的碎屑”——彼此割裂,甚至矛盾。这正如“盲人摸象”的寓言:每个部分都正确,却无法拼出整体。 尽管如此,这些“启发式”仍具价值。它们通过海量参数堆叠,实现了惊人性能,例如让语言模型精准生成曼哈顿任意两点间的路线,却无需真正“理解”城市地图。但一旦遇到小变动——如1%街道被封锁——系统性能便急剧下滑。若拥有一个连贯的地图模型,它就能灵活应对。 正因世界模型能提升鲁棒性、减少幻觉、增强可解释性,各大AI实验室纷纷投入研发。Google DeepMind与OpenAI希望借助多模态数据(视频、3D模拟等)让模型“自然生成”世界模型;Meta的LeCun则主张需设计全新的非生成式架构。尽管路径未明,但世界模型的潜力,或许正是通往AGI的可行阶梯。

Related Links