diff --git a/docs/LOGBOOK.md b/docs/LOGBOOK.md index 10c9ba2d..ee0b07e2 100644 --- a/docs/LOGBOOK.md +++ b/docs/LOGBOOK.md @@ -6,7 +6,35 @@ --- -## 📍 當前狀態 (2026-04-10 ADR-068 飛輪冷啟動全閉環 ✅ 首席架構師審查 97/100) +## 📍 當前狀態 (2026-04-10 下午 飛輪 Telegram 回饋閉環 + 心跳告警排除 ✅) + +### 飛輪 Telegram 回饋閉環 + 心跳排除 + +| Commit | 內容 | +|--------|------| +| `7768924` | 自動修復後移除 Telegram 按鈕(`mark_auto_repaired()`)+ `NoAlertsReceived2Hours` 排除飛輪 | +| `e1dfbed` | `HostHighCpuLoad` `auto_repair: false → true`(Prometheus rules 部署) | + +**根本原因診斷**: +- `GUARDRAIL_BLOCKED` 原因:`alerts-unified.yml` 裡 `auto_repair: "false"` 標籤封鎖所有 HostHighCpuLoad +- Telegram 按鈕不消失:`_push_to_telegram_background` 和 `_try_auto_repair_background` 獨立背景任務,無協調 + +**修正架構**: +- `telegram_gateway.send_approval_card`: 存 `tg_approval:{id}` → Redis +- `telegram_gateway.mark_auto_repaired()`: 新方法 — 移除按鈕 + reply 結果 +- `constants.is_heartbeat_alertname()`: `NoAlertsReceived2Hours` / `Watchdog` 等排除飛輪 + +**E2E 驗收**(2026-04-10 13:36): +``` +ALERT_RECEIVED → AUTO_REPAIR_TRIGGERED ok=True → EXECUTION_COMPLETED ok=True +TELEGRAM_RESULT_SENT ok=True auto_repair_card_updated ✅ (按鈕已移除) +``` + +**CI B5 整合測試**: continue-on-error 暫設,docker cp 方案待驗證 + +--- + +## 📍 舊狀態 (2026-04-10 ADR-068 飛輪冷啟動全閉環 ✅ 首席架構師審查 97/100) ### ADR-068 飛輪冷啟動斷層修復 — 全閉環