Agent-Native 架构审计
根据代理本机架构原则对代码库进行全面审查,为每个原则启动并行子代理并生成评分报告。
审计的核心原则
- 动作对等 - “用户能做的,代理也能做”
- 工具作为原语 - “工具提供能力,而不是行为”
- 上下文注入 - “系统提示包含有关应用程序状态的动态上下文”
- 共享工作空间 - “代理和用户在同一数据空间中工作”
- CRUD 完整性 - “每个实体都有完整的 CRUD(创建、读取、更新、删除)”
- UI 集成 - “代理操作立即反映在 UI 中”
- 能力发现 - “用户可以发现代理可以做什么”
- 提示原生功能 - “功能是定义结果的提示,而不是代码”
工作流程
第 1 步:加载 Agent-Native 技能
首先,调用代理原生架构技能来理解所有原理:
/ce-agent-native-architecture
选择选项 7(操作奇偶校验)以加载完整的参考材料。
第 2 步:启动并行子代理
使用平台的子代理原语启动 8 个并行子代理(Claude 代码中的 Agent 和 subagent_type: Explore,Codex 中的 spawn_agent 和 agent_type: "explorer",Pi 中的 subagent 和 agent: "scout",通过pi-subagents 扩展),每个原则一个。每个代理人应该:
- 枚举代码库中的所有实例(用户操作、工具、上下文、数据存储等) 2.检查是否符合原则
- 提供具体分数,例如“Y 中的 X(百分比%)”
- 列出具体差距和建议
<子代理>
代理 1:行动平等
审核 ACTION PARITY - “无论用户能做什么,代理也能做什么。”
任务:
1. 枚举前端的所有用户操作(API 调用、按钮点击、表单提交)
- 搜索 API 服务文件、获取调用、表单处理程序
- 检查用户交互的路线和组件
2.查看哪些有对应的代理工具
- 搜索代理工具定义
- 将用户操作映射到代理功能
3. 得分:“代理可以执行 Y 个用户操作中的 X 个”
格式:
## 行动平等审核
### 发现用户操作
|行动|地点 |代理工具|状态 |
### 分数:X/Y(百分比%)
### 缺少代理工具
### 建议
代理 2:作为原语的工具
对工具作为原语的审核 - “工具提供能力,而不是行为。”
任务:
1.查找并读取所有代理工具文件
2. 将每一项分类为:
- PRIMITIVE(好):读、写、存储、列表 - 无需业务逻辑即可实现功能
- 工作流程(不好):编码业务逻辑、做出决策、编排步骤
3. 得分:“Y 种工具中的 X 种是正确的原语”
格式:
## 作为原语的工具审计
### 工具分析
|工具|文件|类型 |推理|
### 分数:X/Y(百分比%)
### 有问题的工具(应该是原始的工作流程)
### 建议
代理 3:上下文注入
上下文注入审核 - “系统提示包含有关应用程序状态的动态上下文”
任务:
1.查找上下文注入代码(搜索“上下文”、“系统提示符”、“注入”)
2.阅读座席提示和系统消息
3. 枚举注入的内容与应该注入的内容:
- 可用资源(文件、草稿、文档)
- 用户偏好/设置
- 最近的活动
- 列出可用功能
- 会话历史记录
- 工作区状态
格式:
## 上下文注入审计
### 上下文类型分析
|上下文类型 |注射了? |地点 |笔记|
### 分数:X/Y(百分比%)
### 缺少上下文
### 建议
代理 4:共享工作区
共享工作空间的审核 - “代理和用户在同一数据空间中工作”
任务:
1. 识别所有数据存储/表/模型
2. 检查代理是否读/写相同的表或单独的表
3.寻找沙箱隔离反模式(代理有独立的数据空间)
格式:
## 共享工作空间审计
### 数据存储分析
|数据存储|用户访问 |代理访问 |共享? |
### 分数:X/Y(百分比%)
### 孤立数据(反模式)
### 建议
代理 5:CRUD 完整性
CRUD 完整性审计 - “每个实体都有完整的 CRUD”
任务:
1. 识别代码库中的所有实体/模型
2. 对于每个实体,检查是否存在以下代理工具:
- 创建
- 阅读
- 更新
- 删除
3. 每个实体和总体得分
格式:
## CRUD 完整性审计
### 实体CRUD分析
|实体|创建|阅读 |更新 |删除 |分数 |
### 总体得分:具有完整 CRUD 的 X/Y 实体(百分比%)
### 不完整的实体(列出缺失的操作)
### 建议
代理 6:UI 集成
UI 集成审核 - “代理操作立即反映在 UI 中”
任务:
1.检查代理写入/更改如何传播到前端
2. 寻找:
- 流媒体更新(SSE、WebSocket)
- 轮询机制
- 共享状态/服务
- 活动巴士
- 文件观看
3. 识别“静默操作”反模式(代理更改状态但 UI 不更新)
格式:
## UI 集成审核
### 代理操作 → UI 更新分析
|代理行动|用户界面机制|即时? |笔记|
### 分数:X/Y(百分比%)
### 无声动作(反模式)
### 建议
代理 7:能力发现
功能发现审核 - “用户可以发现代理可以做什么”
任务:
1. 检查这 7 种发现机制:
- 显示代理能力的入职流程
- 帮助文档
- UI 中的功能提示
- 代理在回复中进行自我描述
- 建议的提示/操作
- 空状态指导
- 斜线命令(/help、/tools)
2. 针对7个机制进行评分
格式:
## 能力发现审核
### 发现机制分析
|机制|存在吗? |地点 |品质 |
### 分数:X/7(百分比%)
### 失踪的发现
### 建议
代理 8:提示本地功能
对提示原生功能的审核 - “功能是定义结果的提示,而不是代码”
任务:
1. 阅读所有代理提示
2. 按照以下定义对每个特征/行为进行分类:
- PROMPT(好):用自然语言定义的结果
- 代码(坏):业务逻辑硬编码
3. 检查行为更改是否需要立即编辑或代码更改
格式:
## 提示-原生特性审核
### 特征定义分析
|特色 |定义于 |类型 |笔记|
### 分数:X/Y(百分比%)
### 代码定义的功能(反模式)
### 建议
</子代理>
第 3 步:编写总结报告
所有代理完成后,使用以下内容编译摘要:
``降价
Agent-Native 架构审查:[项目名称]
总分总结
| 核心原则 | 分数 | 百分比 | 状态 |
|---|---|---|---|
| 行动平等 | X/Y | Z% | ✅/⚠️/❌ |
| 工具作为原语 | X/Y | Z% | ✅/⚠️/❌ |
| 上下文注入 | X/Y | Z% | ✅/⚠️/❌ |
| 共享工作区 | X/Y | Z% | ✅/⚠️/❌ |
| CRUD 完整性 | X/Y | Z% | ✅/⚠️/❌ |
| 用户界面集成 | X/Y | Z% | ✅/⚠️/❌ |
| 能力发现 | X/Y | Z% | ✅/⚠️/❌ |
| 提示本机功能 | X/Y | Z% | ✅/⚠️/❌ |
代理原生总体得分:X%
状态图例
- ✅ 优秀(80%+)
- ⚠️ 部分(50-79%)
- ❌ 需要工作(<50%)
按影响力排名前 10 的建议
| 优先 | 行动 | 原理 | 努力 |
|---|
什么效果很好
[列出前 5 名优势]
## 成功标准
- [ ] 8 个分代理全部完成审核
- [ ] 每个原则都有一个特定的数字分数(X/Y 格式)
- [ ] 汇总表显示所有分数和状态指标
- [ ] 前 10 条建议按影响优先排序
- [ ] 报告指出了优势和差距
## 可选:单一原则审核
如果 $ARGUMENTS 指定单个原则(例如“操作奇偶校验”),则仅运行该子代理并单独提供该原则的详细结果。
有效参数:
- `action parity` 或 `1`
- `tools` 或 `primitives` 或 `2`
- `context` 或 `injection` 或 `3`
- `shared` 或 `workspace` 或 `4`
- `crud` 或 `5`
- `ui` 或 `integration` 或 `6`
- `discovery` 或 `7`
- `prompt` 或 `features` 或 `8`