Agentic AICon 2026 Day1 笔记:从 ADPS 到 4 极飞轮,中国 Agent 工程师的 8 点启示
Agentic AICon 2026 Day1 笔记:从 ADPS 到 4 极飞轮,中国 Agent 工程师的 8 点启示
会议:Agentic AICon 2026 智能体应用与架构工程大会
日期:2026.06.05(Day 1)
地点:上海明捷万丽酒店
记录人:Mr.Sun(11年华为测试架构师 / AI Agent 方向)
本文:记录 Day 1 上午主会场 + 分会场的核心演讲,沉淀 8 点对 Agent 工程师的启示
📌 写在前面
今天听了两位讲者的完整分享,主题都围绕"中国 Agent 工程师的工程方法论"——一位是 黄佳(新加坡 A*STAR),一位是 陈嘉(阿里 Qoder IDE 负责人)。两位视角不同,但都指向同一个核心问题:
中国 Agent 工程师需要建立自己的方法论体系。
本文按"方法论 → 架构 → 知识 → 安全 → 组织"5 个维度,整理出 8 点关键启示。
一、方法论层:ADPS 与中国工程师的 Agent 设计模式
🎤 黄佳《Designing AI Agents》核心观点
"行业都是研究怎么用,很少有人讨论怎么设计"
"模型是花钱,Harness 在管理钱"
"Agent 架构是在不确定性之下设计有界资源的分配"
"中国需要自己的 Agent 设计方法论"
"设计模式是工程师的共同语言,给团队评审用,给后来者传承"
1.1 重新定义 Harness
黄佳给出了一个精准的资源观:
传统认知:Harness = LLM 的"包装"
黄佳定义:Harness = 资源管理(管"钱")
核心金句:模型负责可能性,Harness 负责可行性这个定义的价值——把 Agent 系统的讨论从"模型能力"拉回到"资源调度"。
1.2 启动 ADPS 项目
ADPS(Agent Design Patterns)项目今天正式宣布启动。
设计模式的价值 4 层:
- 共同语言——不同团队用同一套术语
- 团队评审——code review 的标尺
- 知识传承——新人快速理解系统
- 行业共建——避免被国外方法论牵着走
1.3 我的反思:14 篇论文 = 一份 ADPS 候选清单
我精读过 14 篇 Agent 论文,整理一下发现——这些论文其实就对应了 6 个 Agent 设计模式:
| 经典 GOF 模式 | Agent 时代演进 | 对应我精读的论文 |
|---|---|---|
| Mediator 模式 | Mediator Agent | AgentScope / AgentVerse |
| Memento 模式 | Self-Reflection Agent | Reflexion |
| Strategy 模式 | ReAct Reasoning | ReAct / Toolformer |
| Template Method | SOP Orchestration | MetaGPT |
| Chain of Responsibility | Role-Based Agent | ChatDev / Generative Agents |
| Builder + Memento | Curriculum Learning | Voyager / MemGPT |
启示 1:每个中国 Agent 工程师都应该有自己的 ADPS 候选清单——不是看论文,而是从论文里"提模式"。
二、架构层:SWE Agent 的 3 种模式与 Qoder 实践
🎤 陈嘉《新一代 SWE Agents + Qoder 实践》核心观点
"从 in the loop 到 on the loop,个人的效率提升明显,但是很少有团队提升 2~5 倍"
2.1 三种 SWE Agent 架构对比
| 模式 | 核心特征 | 优劣 | Qoder 的态度 |
|---|---|---|---|
| 主子模式 | 主 Agent 调度,子 Agent 执行 | 中心化风险 | ✅ 可用 |
| 协同模式 | Agent 平等协作,无主从 | 鲁棒性 ↑ 但通信开销 ↑ | ⭐ 推荐 |
| 动态工作流 | 工作流在运行时生成 | 灵活但不可控 | ✅ 可用 |
2.2 落地 7 大问题
Qoder 团队踩过的 7 个真实问题:
| # | 问题 | 性质 | 对应论文/方案 |
|---|---|---|---|
| 1 | 上下文过载 | 技术 | MemGPT(层级记忆) |
| 2 | Token 贵 | 成本 | Self-Discovering(少 prompt) |
| 3 | 盲目自信 | 质量 | Reflexion(反思验证) |
| 4 | 执行太慢 | 性能 | ReAct(边想边做) |
| 5 | 角色混乱 | 协作 | MetaGPT / ChatDev |
| 6 | 越做越偏 | 目标 | AgentBench(评测体系) |
| 7 | 做过就忘 | 记忆 | Reflexion(短期+长期) |
启示 2:这 7 个问题,14 篇论文里 6 篇能直接对应解法——这就是"工程师共同语言"的价值。
2.3 Qoder Experts Mode 详解
Qoder 自己的实现是同模型 + 星型架构:
Leader(主 Agent)
├─ 生成任务 list
├─ 派发给子 Agent
└─ 读取子 Agent 结果 → 派发新任务
子 Agent 1、2、3
├─ 同模型
├─ 不同角色
└─ ✗ 子 Agent 之间不能直接对话五大特征:
- 所有 Agent 共享同一个 LLM
- 用同一套 Agent Runtime
- 角色可扩展(不改代码)
- 任务列表驱动
- 星型架构(子 Agent 不能 peer-to-peer)
启示 3:Qoder 自己用了"主子模式",但推荐的是"协同模式"——意味着 Experts Mode 是"简单版",协同模式是"复杂版"。
三、知识工程层:护城河不在模型,在知识
🎤 Qoder《RepoWiki 知识工程引擎》
"知识引擎可以提升 11% 的准确率提升"
"超一半任务被知识强化"
3.1 RepoWiki 四大能力
| 能力 | 价值 |
|---|---|
| RepoWiki(内部) | 仓库级知识图谱(代码/文档/结构) |
| 外部知识扩展 | 接入 API、规范、文档 |
| 工程知识图谱 | 把所有知识组织成图 |
| 协作 | 团队共建图谱 |
3.2 关键数字解读
传统 Agent 流程:
任务 → LLM(凭模型内化知识)→ 答案
准确率:70%
Qoder 流程:
任务 → RepoWiki 检索 → LLM(带领域知识)→ 答案
准确率:70% + 11% = 81%+11% × >50% 任务 = 巨大的整体收益——这是 基础能力 而非局部优化。
启示 4:LLM 时代的护城河不在模型,在知识工程。Harness 决定成本,知识图谱决定质量。
四、端到端验证层:Token 换 One Shot
🎤 Qoder 端到端验证实践
4.1 三大验证技术
| 技术 | 能力 |
|---|---|
| Browser Use | Agent 操作浏览器(点击/填表/截图) |
| Computer Use | Agent 操作操作系统 |
| 内置 MCP 工具集 | 标准化协议调用工具 |
4.2 颠覆性洞察:Token 换 One Shot
"用更多 token 换取一次性做对"
传统认知:少 token = 省成本
Qoder 认知:多 token 一次做对 = 反而省(少试错、少返工)这打破了一个直觉:token 少 ≠ 成本低。
4.3 AI 自己维护测试集
传统:开发写测试 → 人工维护 → 越来越落后
Qoder:Agent 跑任务 → 失败时自动加测试 → 持续进化启示 5:AI 自维护测试集 = 测试 Agent 化——这是我做的 AI 测试助手的直接升级方向。
五、安全层:沙箱三重防护
🎤 Qoder 沙箱机制
5.1 三重防护体系
| 层级 | 防护 | 粒度 | 优缺点 |
|---|---|---|---|
| 第 1 重 | 黑名单 | 粗 | 快但误杀率高 |
| 第 2 重 | 沙箱防护 | 中 | 稳但性能开销 |
| 第 3 重 | LLM 风险判断 | 细 | 智能但慢+贵 |
| 兜底 | 人判断 | — | 尽量少介入 |
顺序执行:黑名单 → 沙箱 → LLM → 人,逐级升级。
启示 6:测试架构师天然理解沙箱设计——11 年测试经验积累的"分层防御"思维,和 Qoder 的三重防护异曲同工。这是我的差异化竞争优势。
六、组织层:4 极飞轮 + 20 人特战小队
🎤 Qoder《未来组织变革》
6.1 研发流程新范式
☀️ 白天:开发者 = 指挥者
├─ 高价值决策
├─ 验收 Agent 成果
├─ 5-7 人特战小队
└─ 一个功能一个人(SDD 模式)
🌙 晚上:Agent 接管
├─ 异步工作区
└─ 第二天早上出结果6.2 案例:VSCode 减重
| 指标 | 数值 | 解读 |
|---|---|---|
| 代码量 | 400 万行 → 50 万行 | 减重 87.5% |
| 团队规模 | 20 人 | 极小 |
| 时间 | 3 周 | 极快 |
| 发版频率 | 2 天一个版本 | 持续交付 |
6.3 组织 4 极飞轮
| 极 | 含义 |
|---|---|
| 极短决策路径 | 决策到执行 = 1 步 |
| 人才密度极高 | 5-7 个顶级工程师 = 1 个 50 人团队 |
| 协同开销极低 | 1 个功能 1 个人 |
| 决策洞察极强 | 顶级人才 + AI 增强 |
这 4 个"极"是相互强化的飞轮。
6.4 开发者角色转变
"开发者马上就要从执行者转变成指挥者"
"尽量减少手工编程"
执行者(现在):写代码 → 改 bug → 调架构
指挥者(未来):设计系统 → 规划任务 → 监督 AI启示 7:我做的 PlantGame 28 小时用 Claude Code 独立完成,正是从"执行者"到"指挥者"的早期转型实践。
启示 8:我 2026.04 晋升团队负责人,正在从"老组织"(多层决策、信息衰减)向"新组织"(4 极)转型——AI Coding 推广 + 14 篇论文 + 58 篇博客 = 我的转型准备。
七、参会总结:8 点核心启示
| # | 启示 | 价值 |
|---|---|---|
| 1 | 14 篇论文 = 6 个 Agent 设计模式 | 沉淀中国工程师的 ADPS 候选清单 |
| 2 | 7 大落地问题 = 14 篇论文的实战价值 | 论文不是看的是用的 |
| 3 | Qoder 推荐协同模式,但自己用主子模式 | 模式选择要看场景 |
| 4 | 护城河在知识工程,不在模型 | 私有知识图谱 = 壁垒 |
| 5 | Token 换 One Shot | 打破少 token = 省成本 |
| 6 | 测试架构师天然理解沙箱 | 差异化竞争优势 |
| 7 | PlantGame 是"执行者到指挥者"的早期实践 | 转型已在路上 |
| 8 | 4 极飞轮 = 未来组织方向 | 团队负责人角色重塑 |
八、行业预言
"未来 5 年,组织规模砍到 1/4、代码量砍到 1/8、研发流程砍到 1/3,但每个开发者的价值 ×5"
附录:参会资料
| 资源 | 链接 |
|---|---|
| 黄佳《大模型应用开发:动手做 AI Agent》 | 清华大学出版社 |
| Qoder 官方 | qoder.ai |
| ADPS 项目 | (后续补充) |
| 我的 14 篇论文精读 | sunrong1.github.io |
欢迎交流讨论,我的 blog:sunrong.site
相关阅读: