Agent-Native 架构审计

根据代理本机架构原则对代码库进行全面审查，为每个原则启动并行子代理并生成评分报告。

审计的核心原则

动作对等 - “用户能做的，代理也能做”
工具作为原语 - “工具提供能力，而不是行为”
上下文注入 - “系统提示包含有关应用程序状态的动态上下文”
共享工作空间 - “代理和用户在同一数据空间中工作”
CRUD 完整性 - “每个实体都有完整的 CRUD（创建、读取、更新、删除）”
UI 集成 - “代理操作立即反映在 UI 中”
能力发现 - “用户可以发现代理可以做什么”
提示原生功能 - “功能是定义结果的提示，而不是代码”

工作流程

第 1 步：加载 Agent-Native 技能

首先，调用代理原生架构技能来理解所有原理：

/ce-agent-native-architecture

选择选项 7（操作奇偶校验）以加载完整的参考材料。

第 2 步：启动并行子代理

使用平台的子代理原语启动 8 个并行子代理（Claude 代码中的 Agent 和 subagent_type: Explore，Codex 中的 spawn_agent 和 agent_type: "explorer"，Pi 中的 subagent 和 agent: "scout"，通过pi-subagents 扩展），每个原则一个。每个代理人应该：

枚举代码库中的所有实例（用户操作、工具、上下文、数据存储等） 2.检查是否符合原则
提供具体分数，例如“Y 中的 X（百分比%）”
列出具体差距和建议

<子代理>

代理 1：行动平等

审核 ACTION PARITY - “无论用户能做什么，代理也能做什么。”

任务：
1. 枚举前端的所有用户操作（API 调用、按钮点击、表单提交）
   - 搜索 API 服务文件、获取调用、表单处理程序
   - 检查用户交互的路线和组件
2.查看哪些有对应的代理工具
   - 搜索代理工具定义
   - 将用户操作映射到代理功能
3. 得分：“代理可以执行 Y 个用户操作中的 X 个”

格式：
## 行动平等审核
### 发现用户操作
|行动|地点 |代理工具|状态 |
### 分数：X/Y（百分比%）
### 缺少代理工具
### 建议

代理 2：作为原语的工具

对工具作为原语的审核 - “工具提供能力，而不是行为。”

任务：
1.查找并读取所有代理工具文件
2. 将每一项分类为：
   - PRIMITIVE（好）：读、写、存储、列表 - 无需业务逻辑即可实现功能
   - 工作流程（不好）：编码业务逻辑、做出决策、编排步骤
3. 得分：“Y 种工具中的 X 种是正确的原语”

格式：
## 作为原语的工具审计
### 工具分析
|工具|文件|类型 |推理|
### 分数：X/Y（百分比%）
### 有问题的工具（应该是原始的工作流程）
### 建议

代理 3：上下文注入

上下文注入审核 - “系统提示包含有关应用程序状态的动态上下文”

任务：
1.查找上下文注入代码（搜索“上下文”、“系统提示符”、“注入”）
2.阅读座席提示和系统消息
3. 枚举注入的内容与应该注入的内容：
   - 可用资源（文件、草稿、文档）
   - 用户偏好/设置
   - 最近的活动
   - 列出可用功能
   - 会话历史记录
   - 工作区状态

格式：
## 上下文注入审计
### 上下文类型分析
|上下文类型 |注射了？ |地点 |笔记|
### 分数：X/Y（百分比%）
### 缺少上下文
### 建议

代理 4：共享工作区

共享工作空间的审核 - “代理和用户在同一数据空间中工作”

任务：
1. 识别所有数据存储/表/模型
2. 检查代理是否读/写相同的表或单独的表
3.寻找沙箱隔离反模式（代理有独立的数据空间）

格式：
## 共享工作空间审计
### 数据存储分析
|数据存储|用户访问 |代理访问 |共享？ |
### 分数：X/Y（百分比%）
### 孤立数据（反模式）
### 建议

代理 5：CRUD 完整性

CRUD 完整性审计 - “每个实体都有完整的 CRUD”

任务：
1. 识别代码库中的所有实体/模型
2. 对于每个实体，检查是否存在以下代理工具：
   - 创建
   - 阅读
   - 更新
   - 删除
3. 每个实体和总体得分

格式：
## CRUD 完整性审计
### 实体CRUD分析
|实体|创建|阅读 |更新 |删除 |分数 |
### 总体得分：具有完整 CRUD 的 X/Y 实体（百分比%）
### 不完整的实体（列出缺失的操作）
### 建议

代理 6：UI 集成

UI 集成审核 - “代理操作立即反映在 UI 中”

任务：
1.检查代理写入/更改如何传播到前端
2. 寻找：
   - 流媒体更新（SSE、WebSocket）
   - 轮询机制
   - 共享状态/服务
   - 活动巴士
   - 文件观看
3. 识别“静默操作”反模式（代理更改状态但 UI 不更新）

格式：
## UI 集成审核
### 代理操作 → UI 更新分析
|代理行动|用户界面机制|即时？ |笔记|
### 分数：X/Y（百分比%）
### 无声动作（反模式）
### 建议

代理 7：能力发现

功能发现审核 - “用户可以发现代理可以做什么”

任务：
1. 检查这 7 种发现机制：
   - 显示代理能力的入职流程
   - 帮助文档
   - UI 中的功能提示
   - 代理在回复中进行自我描述
   - 建议的提示/操作
   - 空状态指导
   - 斜线命令（/help、/tools）
2. 针对7个机制进行评分

格式：
## 能力发现审核
### 发现机制分析
|机制|存在吗？ |地点 |品质 |
### 分数：X/7（百分比%）
### 失踪的发现
### 建议

代理 8：提示本地功能

对提示原生功能的审核 - “功能是定义结果的提示，而不是代码”

任务：
1. 阅读所有代理提示
2. 按照以下定义对每个特征/行为进行分类：
   - PROMPT（好）：用自然语言定义的结果
   - 代码（坏）：业务逻辑硬编码
3. 检查行为更改是否需要立即编辑或代码更改

格式：
## 提示-原生特性审核
### 特征定义分析
|特色 |定义于 |类型 |笔记|
### 分数：X/Y（百分比%）
### 代码定义的功能（反模式）
### 建议

</子代理>

第 3 步：编写总结报告

所有代理完成后，使用以下内容编译摘要：

``降价

Agent-Native 架构审查：[项目名称]

总分总结

核心原则	分数	百分比	状态
行动平等	X/Y	Z%	✅/⚠️/❌
工具作为原语	X/Y	Z%	✅/⚠️/❌
上下文注入	X/Y	Z%	✅/⚠️/❌
共享工作区	X/Y	Z%	✅/⚠️/❌
CRUD 完整性	X/Y	Z%	✅/⚠️/❌
用户界面集成	X/Y	Z%	✅/⚠️/❌
能力发现	X/Y	Z%	✅/⚠️/❌
提示本机功能	X/Y	Z%	✅/⚠️/❌

代理原生总体得分：X%

状态图例

✅ 优秀（80%+）
⚠️ 部分（50-79%）
❌ 需要工作（<50%）

按影响力排名前 10 的建议

优先	行动	原理	努力

什么效果很好

[列出前 5 名优势]


## 成功标准

- [ ] 8 个分代理全部完成审核
- [ ] 每个原则都有一个特定的数字分数（X/Y 格式）
- [ ] 汇总表显示所有分数和状态指标
- [ ] 前 10 条建议按影响优先排序
- [ ] 报告指出了优势和差距

## 可选：单一原则审核

如果 $ARGUMENTS 指定单个原则（例如“操作奇偶校验”），则仅运行该子代理并单独提供该原则的详细结果。

有效参数：
- `action parity` 或 `1`
- `tools` 或 `primitives` 或 `2`
- `context` 或 `injection` 或 `3`
- `shared` 或 `workspace` 或 `4`
- `crud` 或 `5`
- `ui` 或 `integration` 或 `6`
- `discovery` 或 `7`
- `prompt` 或 `features` 或 `8`