平安人寿:微流程 SOP + Agentic 金融快捷服务(13 个金句 + 完整框架)
平安人寿:微流程 SOP + Agentic 金融快捷服务(13 个金句 + 完整框架)
6-6 下午 14:00 听了平安人寿"微流程 SOP 和 Agentic 金融快捷服务"。 这是金融业的工程化实战,6 大工程原则 + 13 个金句,对我部门硬件测试 Agent 化是"工程化"维度的最强补完。
📌 这篇博客的特殊性
| 项 | 内容 |
|---|---|
| 讲者 | 平安人寿 |
| 会议 | 2026 开发者大会 |
| 时间 | 2026-06-06 14:00-14:30 |
| 主题 | 微流程 SOP + Agentic 金融快捷服务 |
| 特殊性 | 金融业实战 + 工程化深度 |
| 价值 | 给"理论层 talk"补"工程化" |
关键洞察:今天上午听了 5 场"理论 + 战略"talk(张刚/复旦/黄佳/曹阳/云兔),下午平安给了"工程化落地"维度。
一、3 层架构:SOP 顶层 + Agentic 中间
┌────────────────────────┐
│ 微流程 SOP(顶层) │ 交互层
├────────────────────────┤
│ Agentic(中间层) │ 智能层
├────────────────────────┤
│ (底层 = 工具/数据) │ 资源层
└────────────────────────┘平安架构的反直觉设计:SOP 在顶层(不是底层)。
| 平安层 | 含义 | 你硬件测试对应 |
|---|---|---|
| 微流程 SOP(顶层) | 用户/操作者先看 SOP | 测试流程模板 + 边界护栏 |
| Agentic(中间) | 智能化执行 | 测试 Agent 决策层 |
| (底层) | 工具 + 数据 | 测试 MCP + 数据 + 仪器 |
对你部门启示:
"测试流程先给 TSE/TE 看 SOP 模板(顶层),Agent 在背后自动调用(中间)——SOP 是门面,Agent 是大脑。"
二、微流程 SOP 的核心定义
1. SOP = Agent 的工具集合
"微流程 SOP:Agent 的工具集合,规则内发挥智能"
这是平安的核心定义:
- SOP 不是"流程文档",是 Agent 可调用的 tool
- "规则内发挥智能" = 在 SOP 边界内,Agent 自主决策
2. 脚本即流程 ⭐⭐⭐⭐
"脚本即流程:具备可测试、可版本管理、可复用的工程化特征"
3 大工程化特征:
| 特征 | 含义 | 你部门对应 |
|---|---|---|
| 可测试 | SOP 本身有单元测试 | SKILL 有评测集 |
| 可版本管理 | SOP 可回滚 | SKILL 库版本控制 |
| 可复用 | 跨项目通用 | 4 个 SKILL 跨项目复用 |
这与你变革一·"SKILL 沉淀" = 100% 对位!
3. 刚性约束 + 弹性决策 ⭐⭐⭐⭐⭐
"刚性约束 + 弹性决策,合规和智能并行"
| 维度 | 平安金融 | 你硬件测试 |
|---|---|---|
| 刚性 | 金融合规 | 测试边界护栏 |
| 弹性 | Agent 决策 | 测试用例生成 |
| 并行 | 合规 + 智能 | 治理 + 自动化 |
两位讲者独立得出"刚柔并济":
- 曹阳 09:18:"人定边界,agent 定路径"
- 平安 14:00:"刚性约束 + 弹性决策"
两位讲者用不同的话讲同一件事。
三、4 大交互能力
"微流程交互能力设计:追问、任务清单(实时可视化)、一句话交办、智能填充"
| # | 能力 | 含义 | 你部门对应 |
|---|---|---|---|
| 1 | 追问 | Agent 主动反问澄清 | 测试 Agent 不确定时反问 TSE |
| 2 | 任务清单 | 实时可视化进度 | 测试进度仪表盘 |
| 3 | 一句话交办 | 自然语言派活 | TSE 说"测一下 X 模块" |
| 4 | 智能填充 | 自动填参数 | 测试用例参数自动补全 |
"一句话交办" 对硬件测试的价值 ⭐⭐⭐⭐
| 现状 | 未来 |
|---|---|
| TSE 写 Excel/Word 任务 | TSE 说一句话 |
| TE 接收邮件/会议 | Agent 自动接单 |
这是你变革三·"TSE → AI 架构师"的具体工作模式。
四、预填智能体 ⭐⭐⭐⭐
"预填智能体:把 SOP、上下文、工具等自动填充;需要给大模型更多的信息做决策。"
这是与"让 Agent 自己探索"反方向的智慧。
| 元素 | 平安预填 | 你部门预填 |
|---|---|---|
| SOP | 流程模板 | 测试流程模板 |
| 上下文 | 客户信息 | 项目背景 + 模块信息 |
| 工具 | 业务系统 | 测试 MCP + 仪器 |
| 预填智能体 | 上线前"喂饱" | 测试 Agent 启动前喂饱 |
3 大价值
| 价值 | 含义 |
|---|---|
| 决策更准 | LLM 信息越多,幻觉越少 |
| 启动更快 | Agent 不必从 0 探索 |
| 可解释性 | 预填了什么 = 决策依据(曹阳"四性"之一) |
五、20 步骤 → 3 步骤 ⭐⭐⭐⭐⭐
"场景:从之前的 20 步骤减少到 3 步"
这是 AI 化最硬的数字证据:
| 维度 | 前 | 后 | 提升 |
|---|---|---|---|
| 步骤数 | 20 | 3 | 85% 减少 |
| 人工介入 | 20 次 | 3 次 | 85% 减少 |
| 效率倍数 | 1x | 6-7x | ⭐⭐⭐⭐⭐ |
对你硬件测试:
- 当前一个测试用例执行 = 20 步(启动 + 配置 + 多个步骤 + 收尾)
- AI 化后 = 3 步("启动 + 监控 + 收尾")
- 效率 = 6-7 倍
对你 PPT 升级:
"AI 化收益:执行步骤减少 85%(20 步 → 3 步),效率提升 6-7 倍。"
六、Agent 中断 + 重续 ⭐⭐⭐⭐
"Agent 执行流程怎么中断、怎么重续"
这是工程化核心难题。
| 问题 | 解法 | 对应 |
|---|---|---|
| 中断 | 状态持久化 | 曹阳 6 大组成 #1 |
| 重续 | 恢复上下文 + 跳过已完成 | 状态持久化 + Memory |
| 中断点定位 | Checkpoints | 评测集 + 日志 |
七、5 大工程原则 ⭐⭐⭐⭐⭐
"实践经验:"5 大工程原则
1. 确定性和概率性解耦 ⭐⭐⭐⭐⭐
┌────────────────────┐
│ 确定性层(护栏) │ ← SOP、规则、护栏
├────────────────────┤
│ 概率性层(智能) │ ← Agent 决策
└────────────────────┘这是企业级 AI 工程化最关键的架构选择。
对你 PPT "治理"段升级:
"确定性和概率性解耦:
- 确定性:测试边界、SOP、护栏(不变)
- 概率性:用例生成、缺陷定位、报告生成(Agent 决策)
- 解耦后:可以独立优化,互不干扰"
2. 流程约束优化模型自由
"流程约束优化模型自由"
含义:
- 有约束 = Agent 更自由
- 没有约束 = Agent 反而不知所措
- 这与"完全自由"反方向
3. 交互层和智能层分离
"交互层和智能层分离"
对位 14:00 提的 3 层架构——SOP 顶层、Agentic 中间。
4. 给 AI 足够信息做决策
"给 AI 足够信息做决策" = 14:11 提的"预填智能体"
5. 可观测性是基础 ⭐⭐⭐⭐
"可观测性是一起的基础"
含义:
- 没有可观测性 = 没法调优 = 没法上线
- 这是 production-ready 思维
对你部门价值:
"测试 Agent 上线前,先建可观测性(dashboard + 日志 + 评测)。没有可观测性,AI 化就是黑盒。"
八、知识库:本体论 + 知识图谱 ⭐⭐⭐⭐
"知识库:需要拆分到本体论上,做上知识图谱"
对你部门价值:
- 测试知识 = 按"本体"分(项目/模块/缺陷/用例/工具)
- 用 Neo4j / FalkorDB 建图谱
- 不是 Word 文档,是图数据库
九、知识运维成本很高 ⭐⭐⭐⭐⭐
"知识的运维成本很高"
这是 99% 的人不会讲的金句——他们只讲"沉淀",不讲"运维"。
对部门汇报价值:
"我们 4 个 SKILL 沉淀后,每年运维成本 = 0.5 人(定期 review + 迭代 + 清理)。领导要算这个数。"
这让你部门汇报更扎实**——不是"做完了就完事",是"做完了还要养"。**
十、4 级记忆划分 ⭐⭐⭐⭐
"记忆可以划分:场景、流程、基础知识、session 级别"
| 级别 | 含义 | 你部门对应 |
|---|---|---|
| 场景 | 特定项目/模块上下文 | 当前项目测试背景 |
| 流程 | 测试方法论 | 4 个 SKILL |
| 基础知识 | 测试领域常识 | 行业标准 + 协议 |
| Session | 当前测试会话状态 | 当前用例执行进度 |
对你 PPT 升级:
"测试 Agent 记忆分层:
- 场景层:当前项目/模块
- 流程层:测试 SOP + SKILL
- 基础层:领域知识 + 行业标准
- Session 层:当前测试状态(中断/重续)"
十一、13 个金句汇总
| # | 金句 | 价值 |
|---|---|---|
| 1 | SOP = Agent 的工具集合 | ⭐⭐⭐⭐ |
| 2 | 规则内发挥智能 | ⭐⭐⭐⭐ |
| 3 | 脚本即流程 | ⭐⭐⭐⭐ |
| 4 | ⭐⭐⭐⭐⭐ 刚性约束 + 弹性决策 | ⭐⭐⭐⭐⭐ |
| 5 | SOP 顶层 + Agentic 中间 | ⭐⭐⭐⭐ |
| 6 | 预填智能体 | ⭐⭐⭐⭐ |
| 7 | 4 大交互能力 | ⭐⭐⭐⭐ |
| 8 | ⭐⭐⭐⭐⭐ 20 步 → 3 步 | ⭐⭐⭐⭐⭐ |
| 9 | 中断 + 重续 | ⭐⭐⭐⭐ |
| 10 | ⭐⭐⭐⭐⭐ 确定性和概率性解耦 | ⭐⭐⭐⭐⭐ |
| 11 | 流程约束优化模型自由 | ⭐⭐⭐⭐ |
| 12 | 可观测性是基础 | ⭐⭐⭐⭐ |
| 13 | ⭐⭐⭐⭐⭐ 知识运维成本很高 | ⭐⭐⭐⭐⭐ |
🔗 这一场与之前 9 场 talk 的"知识网络"
| 讲者 | 核心金句 | 与平安的关系 |
|---|---|---|
| 张刚 09:00 | 问题定义 > 方案设计 > 构建 | 平安 #4 刚性约束 = 边界 |
| 复旦 09:45 | AI 擅长构建,难点 = 分析设计 | 平安 #10 解耦 = 分工 |
| 黄佳 09:52 | 模型花钱,Harness 管钱 | 平安 #5 三层架构 = 钱花在哪 |
| 曹阳 09:18 | 人定边界,agent 定路径 | 平安 #4 刚柔并济 = 同一件事 |
| 复杂系统 09:35 | 3-5 周效率下降(J 型曲线) | 平安 #8 85% 减少 = J 型曲线终点 |
| 云兔 10:18 | 旧资产 → AI 理解 → AI-native | 平安 #3 脚本即流程 = 旧资产 |
| Zooclaw 10:35 | Agent = 一等居民 | 平安 #3 预填 = 给 Agent 身份 |
| 平安 14:00 | 解耦 + 20→3 + 知识运维 | 工程化补完 |
| 黄佳私下 14:00 | 模糊/封闭领域 = 护城河 | SKILL 沉淀 = 护城河 |
10 场 talk = 一套完整的"AI 时代企业级落地认知模型":
- 理论层(张刚/复旦)
- 基础设施层(黄佳/曹阳)
- 流程层(云兔/Zooclaw)
- 工程化层(平安)⭐
- 战略层(黄佳私下)
附录:金句的"知识沉淀"价值
13 个金句的核心价值 = 把工程化方法论系统化沉淀,
可在团队内部培训 / 技术博客 / 行业分享中复用。
自我介绍 V5 改造
"我理解企业级 AI 化的工程化核心是'确定性和概率性解耦'(平安人寿 2026 大会提出)。硬件测试领域,确定性 = 边界护栏 + SOP;概率性 = Agent 自主决策。解耦后可以独立优化,执行效率提升 6-7 倍(20 步 → 3 步)。"
项目经验 V5 改造
"主导部门硬件测试 Agent 化:
- 微流程 SOP 顶层 + Agentic 中间 + 工具底层(3 层架构)
- 20 步 → 3 步:执行效率 6-7 倍提升
- 确定性和概率性解耦:治理与智能独立优化
- 知识图谱 + 4 级记忆:测试数据资产化"
🛠️ 我部门硬件测试 PPT 应该怎么改
平安这一场给 PPT 加了 6 个新模块:
| 加在哪里 | 加什么 |
|---|---|
| 整体框架 | 加"3 层架构"图 |
| 变革一·SKILL 沉淀 | 加"脚本即流程" + 4 级记忆 |
| 变革一·可信环境 | 加"确定性和概率性解耦" |
| 变革二·AI Native 架构 | 加"20 步 → 3 步"硬数字 |
| 变革二·可观测性 | 加"可观测性是基础" |
| 新增"知识运维" | 加 0.5 人/年运维成本 |
| 变革三·TSE 工作模式 | 加"一句话交办" |
改完后,我的 PPT 变成"曹阳 + 平安双背书版" = 部长看到 = 跨行业论证。
💎 平安 talk 的"特殊价值"
今天上午 + 下午 6 场 talk,平安这一场是唯一的"工程化实战"维度的补完:
| 维度 | 上午 talk | 平安 talk |
|---|---|---|
| 理论 | ✅ 张刚/复旦/黄佳/曹阳 | - |
| 战略 | ✅ 曹阳/黄佳私下 | - |
| 流程 | ✅ 复杂系统/Zooclaw | - |
| 工程化 | ❌ | ⭐⭐⭐⭐⭐ |
| 数字证据 | ❌ | ⭐⭐⭐⭐⭐(20→3) |
没有平安这场,今天的金句就停在"战略层"。平安补了"工程化落地"。
📚 推荐书 / 工具
| 资源 | 价值 |
|---|---|
| TypeScript | 实现微流程 SOP 的工程化语言 |
| Neo4j / FalkorDB | 知识图谱实现 |
| DDD(领域驱动设计) | 拆分到本体论 |
| 《持续交付》 | 可观测性实践 |
📋 会议信息
| 项目 | 内容 |
|---|---|
| 讲者 | 平安人寿 |
| 会议 | 2026 开发者大会 |
| 时间 | 2026-06-06 14:00-14:30 |
| 主题 | 微流程 SOP + Agentic 金融快捷服务 |
| 关联博客 | 曹阳 talk / 复旦 talk / 黄佳 talk |
| 关联 PPT | 硬件测试范式重构(可引用本文) |
🌿 理论的尽头是工程。没有 20 步 → 3 步这种硬数字,所有 AI 化都是 PPT 画饼。