docs(web): record t104 homepage live data rollout [skip ci]
This commit is contained in:
@@ -1,3 +1,70 @@
|
||||
## 2026-05-20|T104 Homepage live-data trust 與 Incident flow 對齊
|
||||
|
||||
**觸發**:
|
||||
|
||||
- 統帥指出首頁許多數據與事件流程進度條沒有正常運作,尤其是看不出告警是否進入 AI 自動化、卡在哪個階段、是否需要人工介入。
|
||||
- 追查確認首頁仍混用 hardcoded infra catalog / fallback CPU RAM / heuristic incident flow;事件列表一次渲染 400+ active incidents,但 status-chain 只預取前 25 筆,導致後段卡片必然 fallback。
|
||||
- 自動處置率曾在 disposition API 無資料時 fallback 成 incident resolved ratio,語意上會把「已解決」誤讀成「AI 自動修復」。
|
||||
|
||||
**修正**:
|
||||
|
||||
- 首頁 active incidents 固定顯示前 25 筆,與 `GET /api/v1/platform/status-chain` 預取上限一致;超出的事件改用「查看全部告警」連到 Alerts,避免 400+ 卡片造成視覺與證據鏈混亂。
|
||||
- `IncidentCard` status-chain 來源在 production 已確認 25/25 都是 `truth-chain / ADR-100`,不再靠 heuristic 進度條回答主流程。
|
||||
- 基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機與服務資料,移除硬編碼 `HOST_CATALOG`、靜態拓樸與 fallback CPU/RAM。
|
||||
- 自動處置率只採用 `/api/v1/stats/disposition` 的 `auto_rate`;沒有 disposition 資料時顯示 `--`,不再用 resolved incident ratio 代替。
|
||||
- 順手清除同檔案已無用的 import、static helpers、p0Count、TOOL_ICON 等髒資料。
|
||||
|
||||
**邊界**:
|
||||
|
||||
- 本輪是首頁 read-only 呈現與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。
|
||||
- 完整 400+ 事件仍由 Alerts / Work Items / AwoooP Runs 承接;首頁只放可追蹤、可讀的最新 25 筆。
|
||||
|
||||
**Local / production verification**:
|
||||
|
||||
```text
|
||||
node JSON parse zh-TW/en messages
|
||||
-> i18n json ok
|
||||
pnpm --dir apps/web exec tsc --noEmit --pretty false
|
||||
-> pass
|
||||
pnpm --dir apps/web exec next lint --file 'src/app/[locale]/page.tsx'
|
||||
-> exit 0; existing any/literal-string warnings only
|
||||
NEXT_PUBLIC_API_URL=https://awoooi.wooo.work pnpm --dir apps/web run build
|
||||
-> compiled successfully, 90/90 static pages
|
||||
Local Playwright http://localhost:3030/zh-TW
|
||||
-> flowCount=25, statusChainOkCount=25, source=truth-chain, live host view has 192.168.0.112 Kali Security, no fake external topology
|
||||
Production health
|
||||
-> healthy, prod, mock_mode=false
|
||||
Production /api/v1/dashboard/snapshot
|
||||
-> host_count=5, hosts=110/112/120/121/188
|
||||
Production /api/v1/platform/ai-route-status?workload_type=deep_rca
|
||||
-> selected_provider=ollama_gcp_a; policy order GCP-A -> GCP-B -> local 111 -> Gemini
|
||||
Production Playwright https://awoooi.wooo.work/zh-TW
|
||||
-> flowCount=25, statusChainOkCount=25, snapshotOkCount=2, latest footer visible, hasKali=true, hasFake=false, pageErrors=0, consoleErrors=0
|
||||
-> screenshot /tmp/awoooi-t104-home-production.png
|
||||
```
|
||||
|
||||
**Gitea deploy / smoke**:
|
||||
|
||||
```text
|
||||
Code commit:
|
||||
72af10b4 fix(web): align homepage evidence with live data
|
||||
|
||||
Deploy marker:
|
||||
ed3a1646 chore(cd): deploy 72af10b [skip ci]
|
||||
|
||||
Gitea Actions:
|
||||
1921 Code Review -> success in 14s
|
||||
1920 CD -> success in 9m43s
|
||||
```
|
||||
|
||||
**目前整體進度**:
|
||||
|
||||
- 首頁資料可信度:約 99.9%。
|
||||
- 前端 AI 自動化管理介面同步:約 99.8%。
|
||||
- AwoooP 告警可觀測鏈:約 99.8%。
|
||||
- 低風險自動修復閉環:約 95.2%。
|
||||
- 完整 AI 自動化管理產品化:約 98.9%。
|
||||
|
||||
## 2026-05-20|T103 Alert Chain smoke evidence 與 NoAlertsReceived2Hours 收斂
|
||||
|
||||
**觸發**:
|
||||
|
||||
@@ -2410,6 +2410,14 @@ Phase 6 完成後
|
||||
- Production / CI:`598f33ae fix(monitoring): clarify alert chain smoke evidence`、`4956fbb8 fix(monitoring): verify alert rule deploy content` 已推 Gitea main;deploy marker `1b525b7c chore(cd): deploy 598f33a [skip ci]`。Actions:#1916 Code Review success 11s、#1917 Deploy Alert Rules success 22s、#1915 CD success 9m05s、#1918 Code Review success 11s、#1919 Deploy Alert Rules success 23s。
|
||||
- 目前進度更新:AwoooP 告警可觀測鏈約 99.8%;Monitoring rule deploy proof 約 99.8%;低風險自動修復閉環約 95.2%;前端 AI 自動化管理介面同步約 99.6%;完整 AI 自動化管理產品化約 98.7%。
|
||||
|
||||
**T104 Homepage live-data trust 與 Incident flow 對齊(2026-05-20 台北)**:
|
||||
- 觸發:首頁仍混用 hardcoded infra catalog、fallback CPU/RAM、heuristic incident flow 與 400+ active incidents 渲染;Operator 從首頁很難判斷告警是否真的跑過 AI 自動化流程、卡在哪個階段、是否需要人工介入。
|
||||
- 修正:首頁 active incidents 限制為前 25 筆,與 status-chain 預取上限一致;超出事件連到 Alerts。基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機資料,移除靜態 `HOST_CATALOG` / fake topology / fallback CPU RAM。自動處置率只採 `/api/v1/stats/disposition` 的 `auto_rate`,不再把 resolved ratio 當自動修復率。
|
||||
- 驗證:i18n JSON ok;`tsc --noEmit` pass;首頁目標 lint exit 0(既有 any / literal-string warnings 保留);production build 90/90 static pages。Local Playwright 與 Production Playwright 都確認 `flowCount=25`、`statusChainOkCount=25`、事件卡全為 `data-flow-source=truth-chain`、首頁 footer 顯示最新 25 筆、live host view 有 `192.168.0.112 Kali Security`、沒有 fake external topology、pageErrors=0 / consoleErrors=0。
|
||||
- Production / CI:`72af10b4 fix(web): align homepage evidence with live data` 已推 Gitea main;deploy marker `ed3a1646 chore(cd): deploy 72af10b [skip ci]`。Actions:#1921 Code Review success 14s、#1920 CD success 9m43s。Production health healthy/prod/mock_mode=false;`/api/v1/dashboard/snapshot` 回 5 hosts;AI route status 確認 `ollama_gcp_a -> ollama_gcp_b -> ollama_local(111) -> gemini`。
|
||||
- 邊界:T104 是 read-only 首頁產品化與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。完整事件處理仍由 Alerts / Work Items / AwoooP Runs 承接。
|
||||
- 目前進度更新:首頁資料可信度約 99.9%;前端 AI 自動化管理介面同步約 99.8%;AwoooP 告警可觀測鏈約 99.8%;低風險自動修復閉環約 95.2%;完整 AI 自動化管理產品化約 98.9%。
|
||||
|
||||
---
|
||||
|
||||
### 2026-04-20 晚 (台北) — C1-C4 全流程串接 — Playbook 鏈路保護(commit de2d34d)
|
||||
|
||||
Reference in New Issue
Block a user