docs: 更新 LOGBOOK - E2E Health Check 修復進度

- 記錄 8 項問題與修復
- HMAC Secret 注入 + rollout restart
- VIP 暫時繞過,待後續診斷

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
This commit is contained in:
OG T
2026-03-29 21:43:02 +08:00
parent 8cae26eaf3
commit 4c169c2f75

View File

@@ -5,11 +5,12 @@
---
## 📍 當前狀態 (2026-03-29 13:25 台北)
## 📍 當前狀態 (2026-03-29 23:45 台北)
| 項目 | 狀態 |
|------|------|
| **當前 Phase** | ✅ **NVIDIA RCA 模組化重構完成** |
| **當前 Phase** | ✅ **Telegram 訊息模板完整實作** |
| **Telegram 訊息** | ✅ **6 新訊息 + 14 測試** (4707102) |
| **NVIDIA RCA** | ✅ **模組化重構完成** (Commit 04bfff9) |
| **當前 Phase** | ✅ **Wave 1-3 + Phase 13.2 + P1 + Lint 全部完成** |
| **Wave 3 i18n** | ✅ **清零完成** (9747bd4, e9bed21) |
@@ -18,7 +19,7 @@
| **CI/CD 修復** | ✅ **雙跳過保護 + Force Deploy 獨立 Concurrency** |
| **Gitea Mirror** | ✅ **B2 備份策略 (192.168.0.110:3001)** |
| **3 Runners** | ✅ **awoooi-110, 110-2, 110-3 全部上線** 🆕 |
| **E2E Health** | 🔍 **診斷** (VIP reachable, NodePort 32334 不通) |
| **E2E Health** | 🔧 **修復** (HMAC + Rollout Restart + VIP 繞過) |
| **首席架構師審查** | ✅ **91/100 → P1 修復後 95/100** |
| **P1 修復** | ✅ **5/5 完成** (8724ed7) |
| **Day** | Day 12 |
@@ -42,6 +43,60 @@
| **Wave 2 Worker HPA** | ✅ **已部署** (min:1 max:3, CPU 70%) |
| **Wave C-D 監控** | ✅ **全部完成** (generate + discover + coverage_report) |
## 🔧 E2E Health Check 修復進行中 (2026-03-29 21:45 台北)
### 發現的問題與修復
| 問題 | 修復 | 狀態 |
|------|------|------|
| Health endpoint 路徑錯誤 | `/health``/api/v1/health` | ✅ |
| API URL 未傳遞給後續步驟 | 新增 `working_api_url` output | ✅ |
| HMAC Secret 未傳遞 | 新增 `WEBHOOK_HMAC_SECRET` env | ✅ |
| E2E 腳本缺少 HMAC 簽名 | 新增 `compute_hmac_signature` | ✅ |
| Header 名稱錯誤 | `X-Webhook-Signature``X-Signature-256` | ✅ |
| K8s Secret 未生效 | CD 新增 `rollout restart` | ✅ |
| VIP 192.168.0.125 不穩定 | 暫用 node 121 直連 | ✅ |
| **HMAC 驗證失敗** | **等待 CD 完成 + Pod 重啟** | 🔄 |
### 待修復
- VIP keepalived 需要獨立診斷
- E2E 應該能 100% 通過後再恢復 VIP
---
## ✅ Telegram 訊息模板完整實作 (2026-03-29 23:45 台北)
### 變更摘要
| 項目 | 內容 |
|------|------|
| **目的** | 實作 ADR-038 定義的 6 種新訊息模板 |
| **Commit** | `4707102` - feat(telegram): 實作 6 種新訊息模板 |
| **測試** | `test_telegram_message_templates.py` (14 案例) |
| **文檔** | `TELEGRAM_MESSAGE_TEMPLATES.md` v1.1 |
### 新增訊息類型
| 類型 | 用途 | 特性 |
|------|------|------|
| `SentryErrorMessage` | Sentry 錯誤通知 | Stack Trace + Keyboard |
| `ResourceWarnMessage` | 資源耗盡警告 | CPU/Memory/Disk 狀態燈 |
| `RepairReportMessage` | 自動修復報告 | Top 3 問題 + AI 成本 |
| `DailySummaryMessage` | 每日摘要 | 告警統計 + 預算餘額 |
| `DeploySuccessMessage` | 部署成功通知 | E2E 結果 + 版本 |
| `RateLimitMessage` | API 限額警告 | 用量比例 + 建議 |
### 設計模式 (符合 leWOOOgo)
```
@dataclass → format() → TelegramGateway.send_*()
Service 層 (不直接存取 Redis/DB)
```
---
## ✅ NVIDIA RCA 模組化重構完成 (2026-03-29 13:25 台北)
### 變更摘要