docs(logbook): 飛輪 Telegram 回饋閉環 + 心跳排除記錄

This commit is contained in:
OG T
2026-04-10 15:56:58 +08:00
parent ff3be51e13
commit 8157d139a7

View File

@@ -6,7 +6,35 @@
---
## 📍 當前狀態 (2026-04-10 ADR-068 飛輪冷啟動全閉環 ✅ 首席架構師審查 97/100)
## 📍 當前狀態 (2026-04-10 下午 飛輪 Telegram 回饋閉環 + 心跳告警排除 ✅)
### 飛輪 Telegram 回饋閉環 + 心跳排除
| Commit | 內容 |
|--------|------|
| `7768924` | 自動修復後移除 Telegram 按鈕(`mark_auto_repaired()`+ `NoAlertsReceived2Hours` 排除飛輪 |
| `e1dfbed` | `HostHighCpuLoad` `auto_repair: false → true`Prometheus rules 部署) |
**根本原因診斷**:
- `GUARDRAIL_BLOCKED` 原因:`alerts-unified.yml``auto_repair: "false"` 標籤封鎖所有 HostHighCpuLoad
- Telegram 按鈕不消失:`_push_to_telegram_background``_try_auto_repair_background` 獨立背景任務,無協調
**修正架構**:
- `telegram_gateway.send_approval_card`: 存 `tg_approval:{id}` → Redis
- `telegram_gateway.mark_auto_repaired()`: 新方法 — 移除按鈕 + reply 結果
- `constants.is_heartbeat_alertname()`: `NoAlertsReceived2Hours` / `Watchdog` 等排除飛輪
**E2E 驗收**2026-04-10 13:36:
```
ALERT_RECEIVED → AUTO_REPAIR_TRIGGERED ok=True → EXECUTION_COMPLETED ok=True
TELEGRAM_RESULT_SENT ok=True auto_repair_card_updated ✅ (按鈕已移除)
```
**CI B5 整合測試**: continue-on-error 暫設docker cp 方案待驗證
---
## 📍 舊狀態 (2026-04-10 ADR-068 飛輪冷啟動全閉環 ✅ 首席架構師審查 97/100)
### ADR-068 飛輪冷啟動斷層修復 — 全閉環