06
Recover · workflow

progress-checkpoint-recovery

06-progress-checkpoint-recovery.md
📍
P0 source: claude-sessions created: 2026-06-13

WHAT IS THIS

定位

长任务中断后的断点恢复体检。目标是判断真实状态,而不是相信 plan 文档、TaskList 或最后一条 assistant 回复。

TRIGGERS

触发场景
agent session 因 context limit、重启、网络、工具失败中断。
Plan 写 completed,但 commit、test、frontmatter 不一致。
多个 unit 并行推进,无法判断下一步。
用户回来问“现在做到哪了,接下来该干什么”。

INPUT & OUTPUT

输入 / 产出
↘ INPUT
  • Plan 文档。
  • TaskList 或 todo 状态。
  • Git log、git diff、git status。
  • 测试日志、build 日志。
  • 最近 session skeleton,可选。
  • PR 或 commit 列表,可选。
↗ OUTPUT
  • 每个 unit 的真实状态。
  • Limbo unit 列表。
  • 恢复后的第一步建议。
  • 需要补测、补文档、补 commit 的清单。
🪜

STEPS

编排步骤
  1. 1
    读取声明状态
    从 plan、frontmatter、TaskList 抽取 unit 和 claimed status。
  2. 2
    读取 git 状态
    看哪些文件实际改了,哪些 commit 已落地,哪些改动仍未提交。
  3. 3
    读取验证状态
    找最近测试、build、lint、smoke 是否通过,是否覆盖对应 unit。
  4. 4
    Unit 对账
    每个 unit 标记为 done、implemented-not-tested、tested-not-documented、planned-only、limbo。
  5. 5
    找第一步
    下一步只选一个最小动作,优先处理会阻塞其它 unit 的 limbo。
  6. 6
    更新 checkpoint
    修正文档状态,补一个恢复 checkpoint,说明依据。

AGENT ROLES

Agent 分工
Plan Reader
抽 unit 和 claimed status。
Git Auditor
核对 commit、diff、branch。
Test Auditor
核对验证证据。
Recovery Planner
输出下一步。
Document Agent
更新 checkpoint。
·

状态定义

状态定义
  • done:代码、测试、文档、commit 都支持完成。
  • implemented-not-tested:代码已改,缺验证。
  • tested-not-documented:测试过了,但 plan/frontmatter 未同步。
  • documented-not-implemented:文档说完成,代码无证据。
  • limbo:有改动但无法归属到 unit,或中断在工具执行中。
  • blocked:缺外部权限、账号、用户决策。

ACCEPTANCE GATE

验收 gate

FAILURE HANDLING

失败处理
如果测试日志缺失,不猜通过,标 implemented-not-tested
如果工作区有用户未提交改动,不回滚,标 owner unknown。
如果无法判断当前分支语义,先输出恢复报告,不继续实现。

TEMPLATE

恢复报告模板
TEMPLATE
## Checkpoint Recovery

| Unit | Claimed status | Git evidence | Test evidence | Real status | Next action |
| --- | --- | --- | --- | --- | --- |

## First Step

- Action:
- Reason:
- Command: