docs(web): record t104 homepage live data rollout [skip ci]

This commit is contained in:
Your Name
2026-05-20 14:13:15 +08:00
parent ed3a16468a
commit 076946412e
2 changed files with 75 additions and 0 deletions

View File

@@ -1,3 +1,70 @@
## 2026-05-20T104 Homepage live-data trust 與 Incident flow 對齊
**觸發**
- 統帥指出首頁許多數據與事件流程進度條沒有正常運作,尤其是看不出告警是否進入 AI 自動化、卡在哪個階段、是否需要人工介入。
- 追查確認首頁仍混用 hardcoded infra catalog / fallback CPU RAM / heuristic incident flow事件列表一次渲染 400+ active incidents但 status-chain 只預取前 25 筆,導致後段卡片必然 fallback。
- 自動處置率曾在 disposition API 無資料時 fallback 成 incident resolved ratio語意上會把「已解決」誤讀成「AI 自動修復」。
**修正**
- 首頁 active incidents 固定顯示前 25 筆,與 `GET /api/v1/platform/status-chain` 預取上限一致;超出的事件改用「查看全部告警」連到 Alerts避免 400+ 卡片造成視覺與證據鏈混亂。
- `IncidentCard` status-chain 來源在 production 已確認 25/25 都是 `truth-chain / ADR-100`,不再靠 heuristic 進度條回答主流程。
- 基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機與服務資料,移除硬編碼 `HOST_CATALOG`、靜態拓樸與 fallback CPU/RAM。
- 自動處置率只採用 `/api/v1/stats/disposition``auto_rate`;沒有 disposition 資料時顯示 `--`,不再用 resolved incident ratio 代替。
- 順手清除同檔案已無用的 import、static helpers、p0Count、TOOL_ICON 等髒資料。
**邊界**
- 本輪是首頁 read-only 呈現與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。
- 完整 400+ 事件仍由 Alerts / Work Items / AwoooP Runs 承接;首頁只放可追蹤、可讀的最新 25 筆。
**Local / production verification**
```text
node JSON parse zh-TW/en messages
-> i18n json ok
pnpm --dir apps/web exec tsc --noEmit --pretty false
-> pass
pnpm --dir apps/web exec next lint --file 'src/app/[locale]/page.tsx'
-> exit 0; existing any/literal-string warnings only
NEXT_PUBLIC_API_URL=https://awoooi.wooo.work pnpm --dir apps/web run build
-> compiled successfully, 90/90 static pages
Local Playwright http://localhost:3030/zh-TW
-> flowCount=25, statusChainOkCount=25, source=truth-chain, live host view has 192.168.0.112 Kali Security, no fake external topology
Production health
-> healthy, prod, mock_mode=false
Production /api/v1/dashboard/snapshot
-> host_count=5, hosts=110/112/120/121/188
Production /api/v1/platform/ai-route-status?workload_type=deep_rca
-> selected_provider=ollama_gcp_a; policy order GCP-A -> GCP-B -> local 111 -> Gemini
Production Playwright https://awoooi.wooo.work/zh-TW
-> flowCount=25, statusChainOkCount=25, snapshotOkCount=2, latest footer visible, hasKali=true, hasFake=false, pageErrors=0, consoleErrors=0
-> screenshot /tmp/awoooi-t104-home-production.png
```
**Gitea deploy / smoke**
```text
Code commit:
72af10b4 fix(web): align homepage evidence with live data
Deploy marker:
ed3a1646 chore(cd): deploy 72af10b [skip ci]
Gitea Actions:
1921 Code Review -> success in 14s
1920 CD -> success in 9m43s
```
**目前整體進度**
- 首頁資料可信度:約 99.9%。
- 前端 AI 自動化管理介面同步:約 99.8%。
- AwoooP 告警可觀測鏈:約 99.8%。
- 低風險自動修復閉環:約 95.2%。
- 完整 AI 自動化管理產品化:約 98.9%。
## 2026-05-20T103 Alert Chain smoke evidence 與 NoAlertsReceived2Hours 收斂
**觸發**

View File

@@ -2410,6 +2410,14 @@ Phase 6 完成後
- Production / CI`598f33ae fix(monitoring): clarify alert chain smoke evidence``4956fbb8 fix(monitoring): verify alert rule deploy content` 已推 Gitea maindeploy marker `1b525b7c chore(cd): deploy 598f33a [skip ci]`。Actions#1916 Code Review success 11s、#1917 Deploy Alert Rules success 22s、#1915 CD success 9m05s、#1918 Code Review success 11s、#1919 Deploy Alert Rules success 23s。
- 目前進度更新AwoooP 告警可觀測鏈約 99.8%Monitoring rule deploy proof 約 99.8%;低風險自動修復閉環約 95.2%;前端 AI 自動化管理介面同步約 99.6%;完整 AI 自動化管理產品化約 98.7%。
**T104 Homepage live-data trust 與 Incident flow 對齊2026-05-20 台北)**
- 觸發:首頁仍混用 hardcoded infra catalog、fallback CPU/RAM、heuristic incident flow 與 400+ active incidents 渲染Operator 從首頁很難判斷告警是否真的跑過 AI 自動化流程、卡在哪個階段、是否需要人工介入。
- 修正:首頁 active incidents 限制為前 25 筆,與 status-chain 預取上限一致;超出事件連到 Alerts。基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機資料,移除靜態 `HOST_CATALOG` / fake topology / fallback CPU RAM。自動處置率只採 `/api/v1/stats/disposition``auto_rate`,不再把 resolved ratio 當自動修復率。
- 驗證i18n JSON ok`tsc --noEmit` pass首頁目標 lint exit 0既有 any / literal-string warnings 保留production build 90/90 static pages。Local Playwright 與 Production Playwright 都確認 `flowCount=25``statusChainOkCount=25`、事件卡全為 `data-flow-source=truth-chain`、首頁 footer 顯示最新 25 筆、live host view 有 `192.168.0.112 Kali Security`、沒有 fake external topology、pageErrors=0 / consoleErrors=0。
- Production / CI`72af10b4 fix(web): align homepage evidence with live data` 已推 Gitea maindeploy marker `ed3a1646 chore(cd): deploy 72af10b [skip ci]`。Actions#1921 Code Review success 14s、#1920 CD success 9m43s。Production health healthy/prod/mock_mode=false`/api/v1/dashboard/snapshot` 回 5 hostsAI route status 確認 `ollama_gcp_a -> ollama_gcp_b -> ollama_local(111) -> gemini`
- 邊界T104 是 read-only 首頁產品化與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。完整事件處理仍由 Alerts / Work Items / AwoooP Runs 承接。
- 目前進度更新:首頁資料可信度約 99.9%;前端 AI 自動化管理介面同步約 99.8%AwoooP 告警可觀測鏈約 99.8%;低風險自動修復閉環約 95.2%;完整 AI 自動化管理產品化約 98.9%。
---
### 2026-04-20 晚 (台北) — C1-C4 全流程串接 — Playbook 鏈路保護commit de2d34d