【全景檢測:12-agent 並行掃描定位 4 大 bug 與 1 個 P0 連鎖回歸】 Bug 1(P0 silent failure)— governance_agent.check_trust_drift 原 `await db.commit()` 縮排錯在 async with 區塊外(8 空格 vs 12), session 已 auto-commit 關閉,二次 commit 拋 InvalidRequestError 被吞, governance_trust_drift_auto_deprecated log 從不出現。修:commit/log 移回 with 內。 附 AST regression guard test 擋退化。 Bug 2 — flywheel_stats_service / W-3 fresh deploy 假告警 Redis 空時 total_exec=0 → rate=0.0 → watchdog `< 0.30` 立即觸發 「飛輪成功率 0%」假告警。修:total_exec < FLYWHEEL_MIN_SAMPLE(10) 回 None, watchdog 判 None 跳過 W-3。Prometheus sentinel 用 NaN(非 -1.0) 避免觸發 ops/monitoring/alerts.yml:775 等 3 份 prom rule 的 `< 0.1` 條件造成 2h 後假告警連鎖。前端 type 同步 number | null。 Bug 3 — failover_alerter dedup key 原 key 只看 event_type 不看 payload,trust_drift 4→25 IDs 變動全被 1h dedup 吞掉。修:dedup key 加 sha256(impact subdict)[:8],event_type sanitize 防特殊字元污染 Redis key。 Bug 4 — ai_slo_watchdog_job W-4 evolver 全封存初始化誤報 原邏輯 approved==0 即告警,未排除「playbooks 表初始化中」場景。 修:_count_approved_playbooks 回 (approved, total),total==0 → skip。 【執行結果】 - 39 個相關 unit test 全過(test_failover_alerter / test_governance_agent / test_trust_drift_watchdog / test_check_trust_drift_commit_outside_context_poc) - 6 個關鍵路徑實測:NaN sentinel / float 渲染 / hash 區分性 / dedup 同 impact 相同 hash / datetime 容錯 / 4 檔 py_compile 全過 【調度教訓 — 留作未來改進】 - 12-agent 並行調度時,vuln-verifier 與 fullstack-engineer 競態 導致 vuln-verifier 讀到已修代碼誤判 NOT REPRODUCIBLE。 未來:vuln-verifier 應在 fullstack 之前執行,或用 git show HEAD~1 對比修復前。 - fullstack-engineer 引入 P0 regression(f-string 內嵌 ternary 非法 format spec), critic 抓到 + Prom sentinel 連鎖 — 證明 critic 審查必要不可省。 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>