06
Recover · workflow
progress-checkpoint-recovery
06-progress-checkpoint-recovery.md
◉
WHAT IS THIS
定位长任务中断后的断点恢复体检。目标是判断真实状态,而不是相信 plan 文档、TaskList 或最后一条 assistant 回复。
⚡
TRIGGERS
触发场景▸agent session 因 context limit、重启、网络、工具失败中断。
▸Plan 写 completed,但 commit、test、frontmatter 不一致。
▸多个 unit 并行推进,无法判断下一步。
▸用户回来问“现在做到哪了,接下来该干什么”。
↹
INPUT & OUTPUT
输入 / 产出↘ INPUT
- Plan 文档。
- TaskList 或 todo 状态。
- Git log、git diff、git status。
- 测试日志、build 日志。
- 最近 session skeleton,可选。
- PR 或 commit 列表,可选。
↗ OUTPUT
- 每个 unit 的真实状态。
- Limbo unit 列表。
- 恢复后的第一步建议。
- 需要补测、补文档、补 commit 的清单。
🪜
STEPS
编排步骤- 1读取声明状态从 plan、frontmatter、TaskList 抽取 unit 和 claimed status。
- 2读取 git 状态看哪些文件实际改了,哪些 commit 已落地,哪些改动仍未提交。
- 3读取验证状态找最近测试、build、lint、smoke 是否通过,是否覆盖对应 unit。
- 4Unit 对账每个 unit 标记为 done、implemented-not-tested、tested-not-documented、planned-only、limbo。
- 5找第一步下一步只选一个最小动作,优先处理会阻塞其它 unit 的 limbo。
- 6更新 checkpoint修正文档状态,补一个恢复 checkpoint,说明依据。
⚙
AGENT ROLES
Agent 分工⚙
Plan Reader
抽 unit 和 claimed status。
⚙
Git Auditor
核对 commit、diff、branch。
⚙
Test Auditor
核对验证证据。
⚙
Recovery Planner
输出下一步。
⚙
Document Agent
更新 checkpoint。
·
状态定义
状态定义- done:代码、测试、文档、commit 都支持完成。
- implemented-not-tested:代码已改,缺验证。
- tested-not-documented:测试过了,但 plan/frontmatter 未同步。
- documented-not-implemented:文档说完成,代码无证据。
- limbo:有改动但无法归属到 unit,或中断在工具执行中。
- blocked:缺外部权限、账号、用户决策。
✓
ACCEPTANCE GATE
验收 gate- ✓每个 unit 有证据链接或命令。
- ✓没有“看起来完成”但无测试证据的 P0 unit。
- ✓下一步是单一、可执行、低歧义动作。
- ✓
git status中每个文件都能归属到 unit 或标为 unrelated。 - ✓文档状态和 git 状态一致。
⊘
FAILURE HANDLING
失败处理如果测试日志缺失,不猜通过,标
implemented-not-tested。如果工作区有用户未提交改动,不回滚,标 owner unknown。
如果无法判断当前分支语义,先输出恢复报告,不继续实现。
⌘
TEMPLATE
恢复报告模板## Checkpoint Recovery
| Unit | Claimed status | Git evidence | Test evidence | Real status | Next action |
| --- | --- | --- | --- | --- | --- |
## First Step
- Action:
- Reason:
- Command: