Agent-Native 架构审计

根据代理本机架构原则对代码库进行全面审查,为每个原则启动并行子代理并生成评分报告。

审计的核心原则

  1. 动作对等 - “用户能做的,代理也能做”
  2. 工具作为原语 - “工具提供能力,而不是行为”
  3. 上下文注入 - “系统提示包含有关应用程序状态的动态上下文”
  4. 共享工作空间 - “代理和用户在同一数据空间中工作”
  5. CRUD 完整性 - “每个实体都有完整的 CRUD(创建、读取、更新、删除)”
  6. UI 集成 - “代理操作立即反映在 UI 中”
  7. 能力发现 - “用户可以发现代理可以做什么”
  8. 提示原生功能 - “功能是定义结果的提示,而不是代码”

工作流程

第 1 步:加载 Agent-Native 技能

首先,调用代理原生架构技能来理解所有原理:

/ce-agent-native-architecture

选择选项 7(操作奇偶校验)以加载完整的参考材料。

第 2 步:启动并行子代理

使用平台的子代理原语启动 8 个并行子代理(Claude 代码中的 Agentsubagent_type: Explore,Codex 中的 spawn_agentagent_type: "explorer",Pi 中的 subagentagent: "scout",通过pi-subagents 扩展),每个原则一个。每个代理人应该:

  1. 枚举代码库中的所有实例(用户操作、工具、上下文、数据存储等) 2.检查是否符合原则
  2. 提供具体分数,例如“Y 中的 X(百分比%)”
  3. 列出具体差距和建议

<子代理>

代理 1:行动平等

审核 ACTION PARITY - “无论用户能做什么,代理也能做什么。”

任务:
1. 枚举前端的所有用户操作(API 调用、按钮点击、表单提交)
   - 搜索 API 服务文件、获取调用、表单处理程序
   - 检查用户交互的路线和组件
2.查看哪些有对应的代理工具
   - 搜索代理工具定义
   - 将用户操作映射到代理功能
3. 得分:“代理可以执行 Y 个用户操作中的 X 个”

格式:
## 行动平等审核
### 发现用户操作
|行动|地点 |代理工具|状态 |
### 分数:X/Y(百分比%)
### 缺少代理工具
### 建议

代理 2:作为原语的工具

对工具作为原语的审核 - “工具提供能力,而不是行为。”

任务:
1.查找并读取所有代理工具文件
2. 将每一项分类为:
   - PRIMITIVE(好):读、写、存储、列表 - 无需业务逻辑即可实现功能
   - 工作流程(不好):编码业务逻辑、做出决策、编排步骤
3. 得分:“Y 种工具中的 X 种是正确的原语”

格式:
## 作为原语的工具审计
### 工具分析
|工具|文件|类型 |推理|
### 分数:X/Y(百分比%)
### 有问题的工具(应该是原始的工作流程)
### 建议

代理 3:上下文注入

上下文注入审核 - “系统提示包含有关应用程序状态的动态上下文”

任务:
1.查找上下文注入代码(搜索“上下文”、“系统提示符”、“注入”)
2.阅读座席提示和系统消息
3. 枚举注入的内容与应该注入的内容:
   - 可用资源(文件、草稿、文档)
   - 用户偏好/设置
   - 最近的活动
   - 列出可用功能
   - 会话历史记录
   - 工作区状态

格式:
## 上下文注入审计
### 上下文类型分析
|上下文类型 |注射了? |地点 |笔记|
### 分数:X/Y(百分比%)
### 缺少上下文
### 建议

代理 4:共享工作区

共享工作空间的审核 - “代理和用户在同一数据空间中工作”

任务:
1. 识别所有数据存储/表/模型
2. 检查代理是否读/写相同的表或单独的表
3.寻找沙箱隔离反模式(代理有独立的数据空间)

格式:
## 共享工作空间审计
### 数据存储分析
|数据存储|用户访问 |代理访问 |共享? |
### 分数:X/Y(百分比%)
### 孤立数据(反模式)
### 建议

代理 5:CRUD 完整性

CRUD 完整性审计 - “每个实体都有完整的 CRUD”

任务:
1. 识别代码库中的所有实体/模型
2. 对于每个实体,检查是否存在以下代理工具:
   - 创建
   - 阅读
   - 更新
   - 删除
3. 每个实体和总体得分

格式:
## CRUD 完整性审计
### 实体CRUD分析
|实体|创建|阅读 |更新 |删除 |分数 |
### 总体得分:具有完整 CRUD 的 X/Y 实体(百分比%)
### 不完整的实体(列出缺失的操作)
### 建议

代理 6:UI 集成

UI 集成审核 - “代理操作立即反映在 UI 中”

任务:
1.检查代理写入/更改如何传播到前端
2. 寻找:
   - 流媒体更新(SSE、WebSocket)
   - 轮询机制
   - 共享状态/服务
   - 活动巴士
   - 文件观看
3. 识别“静默操作”反模式(代理更改状态但 UI 不更新)

格式:
## UI 集成审核
### 代理操作 → UI 更新分析
|代理行动|用户界面机制|即时? |笔记|
### 分数:X/Y(百分比%)
### 无声动作(反模式)
### 建议

代理 7:能力发现

功能发现审核 - “用户可以发现代理可以做什么”

任务:
1. 检查这 7 种发现机制:
   - 显示代理能力的入职流程
   - 帮助文档
   - UI 中的功能提示
   - 代理在回复中进行自我描述
   - 建议的提示/操作
   - 空状态指导
   - 斜线命令(/help、/tools)
2. 针对7个机制进行评分

格式:
## 能力发现审核
### 发现机制分析
|机制|存在吗? |地点 |品质 |
### 分数:X/7(百分比%)
### 失踪的发现
### 建议

代理 8:提示本地功能

对提示原生功能的审核 - “功能是定义结果的提示,而不是代码”

任务:
1. 阅读所有代理提示
2. 按照以下定义对每个特征/行为进行分类:
   - PROMPT(好):用自然语言定义的结果
   - 代码(坏):业务逻辑硬编码
3. 检查行为更改是否需要立即编辑或代码更改

格式:
## 提示-原生特性审核
### 特征定义分析
|特色 |定义于 |类型 |笔记|
### 分数:X/Y(百分比%)
### 代码定义的功能(反模式)
### 建议

</子代理>

第 3 步:编写总结报告

所有代理完成后,使用以下内容编译摘要:

``降价

Agent-Native 架构审查:[项目名称]

总分总结

核心原则 分数 百分比 状态
行动平等 X/Y Z% ✅/⚠️/❌
工具作为原语 X/Y Z% ✅/⚠️/❌
上下文注入 X/Y Z% ✅/⚠️/❌
共享工作区 X/Y Z% ✅/⚠️/❌
CRUD 完整性 X/Y Z% ✅/⚠️/❌
用户界面集成 X/Y Z% ✅/⚠️/❌
能力发现 X/Y Z% ✅/⚠️/❌
提示本机功能 X/Y Z% ✅/⚠️/❌

代理原生总体得分:X%

状态图例

  • ✅ 优秀(80%+)
  • ⚠️ 部分(50-79%)
  • ❌ 需要工作(<50%)

按影响力排名前 10 的建议

优先 行动 原理 努力

什么效果很好

[列出前 5 名优势]


## 成功标准

- [ ] 8 个分代理全部完成审核
- [ ] 每个原则都有一个特定的数字分数(X/Y 格式)
- [ ] 汇总表显示所有分数和状态指标
- [ ] 前 10 条建议按影响优先排序
- [ ] 报告指出了优势和差距

## 可选:单一原则审核

如果 $ARGUMENTS 指定单个原则(例如“操作奇偶校验”),则仅运行该子代理并单独提供该原则的详细结果。

有效参数:
- `action parity` 或 `1`
- `tools` 或 `primitives` 或 `2`
- `context` 或 `injection` 或 `3`
- `shared` 或 `workspace` 或 `4`
- `crud` 或 `5`
- `ui` 或 `integration` 或 `6`
- `discovery` 或 `7`
- `prompt` 或 `features` 或 `8`