生成式AI第二幕:测试时间缩放驱动认知工程
Shijie Xia, Yiwei Qin, Xuefeng Li, Yan Ma, Run-Ze Fan, Steffi Chern, Haoyang Zou, Fan Zhou, Xiangkun Hu, Jiahe Jin, Yanheng He, Yixin Ye, Yixiu Liu, Pengfei Liu
发布日期: 4/23/2025
摘要
第一代大型语言模型——可以称为生成式人工智能的“第一幕”(2020-2023年)——通过大量参数和数据的扩展取得了显著的成功,然而在知识延迟、浅层推理和受限的认知过程方面表现出根本性的局限性。在这个时期,提示工程(prompt engineering)作为我们与人工智能交互的主要界面出现,通过自然语言实现了对话级别的沟通。我们现在见证了“第二幕”(2024年至今)的出现,在这一阶段,模型正从知识检索系统(在潜在空间内)转变为通过测试时扩展技术(test-time scaling)构建思维的引擎。这一新范式通过基于语言的思维建立了与人工智能的精神层面连接。本文将阐明认知工程的概念基础,并解释为什么这一时刻对于其发展至关重要。我们将系统地通过详尽的教程和优化的实现方法来分解这些高级方法,从而普及认知工程的访问,并使每位从业者都能参与到人工智能的第二幕中来。我们在GitHub仓库中提供了定期更新的关于测试时扩展技术的研究论文集合:https://github.com/GAIR-NLP/cognition-engineering 注:原文中的“test-time scaling”是一个不常见的术语,在此翻译为“测试时扩展技术”,并在括号中标注原文以确保信息完整。