AI Agent 论文系列:从 ReAct 到 AgentBench
2026年6月1日...大约 2 分钟
AI Agent 论文系列(11 篇)
系统学习 11 篇 AI Agent 领域核心论文,从基础范式到评测基准,构建完整的知识体系。
📚 论文列表(按学习顺序)
| # | 论文 | 核心概念 | 难度 | 链接 |
|---|---|---|---|---|
| 1 | ReAct | 推理 + 行动循环 | ⭐⭐ | 详情 |
| 2 | Chain of Thought | 思维链 | ⭐⭐ | 详情 |
| 3 | Toolformer | 自监督学工具 | ⭐⭐⭐ | 详情 |
| 4 | MetaGPT | 角色化流水线 | ⭐⭐⭐ | 详情 |
| 5 | AgentVerse | 分层协作 | ⭐⭐⭐ | 详情 |
| 6 | Voyager | 终身学习三层架构 | ⭐⭐⭐⭐ | 详情 |
| 7 | MemGPT | 分层存储(向量 + 持久) | ⭐⭐⭐⭐ | 详情 |
| 8 | Computer Use | 多模态操作鼠标键盘 | ⭐⭐⭐ | 详情 |
| 9 | Agentic RAG | RAG + 迭代检索 | ⭐⭐⭐ | 详情 |
| 10 | Self-Discovering | 原子推理模块自由组合 | ⭐⭐⭐⭐ | 详情 |
| 11 | AgentBench | 多维度 Agent 评测基准 | ⭐⭐⭐ | 详情 |
🧠 架构演进理解
ReAct → MetaGPT → AgentVerse → Voyager
↓
复杂度递进本质:任务越开放、horizon 越长
→ 需要越强的"记忆 + 学习 + 复用"能力| 阶段 | 核心抽象 | 解决的核心问题 |
|---|---|---|
| 基础范式 | ReAct、COT、Toolformer | 推理 + 行动 + 工具 |
| 协作模式 | MetaGPT、AgentVerse | 多 Agent 分工 |
| 持续学习 | Voyager、MemGPT | 经验积累 + 记忆系统 |
| 能力扩展 | Computer Use、Agentic RAG | 多模态 + 知识增强 |
| 自我进化 | Self-Discovering | 自主发现推理模式 |
| 评测体系 | AgentBench | 标准化基准 |
💡 关键洞察
- 记忆系统是分水岭 - Voyager 和 MemGPT 解决了"长 horizon 任务"
- 工具调用是基础设施 - ReAct 和 Toolformer 是后续所有论文的基石
- 评测标准化是行业成熟的标志 - AgentBench 让"哪个 Agent 更好"可量化
🎯 适用读者
- 准备 AI Agent 方向面试的同学
- 想系统性了解 Agent 演进的工程师
- 关注最新 AI 进展的产品经理/架构师
最后更新:2026-06-01