diff --git a/docs/LOGBOOK.md b/docs/LOGBOOK.md index 1948d5d8..1d7f514a 100644 --- a/docs/LOGBOOK.md +++ b/docs/LOGBOOK.md @@ -1,3 +1,70 @@ +## 2026-05-20|T104 Homepage live-data trust 與 Incident flow 對齊 + +**觸發**: + +- 統帥指出首頁許多數據與事件流程進度條沒有正常運作,尤其是看不出告警是否進入 AI 自動化、卡在哪個階段、是否需要人工介入。 +- 追查確認首頁仍混用 hardcoded infra catalog / fallback CPU RAM / heuristic incident flow;事件列表一次渲染 400+ active incidents,但 status-chain 只預取前 25 筆,導致後段卡片必然 fallback。 +- 自動處置率曾在 disposition API 無資料時 fallback 成 incident resolved ratio,語意上會把「已解決」誤讀成「AI 自動修復」。 + +**修正**: + +- 首頁 active incidents 固定顯示前 25 筆,與 `GET /api/v1/platform/status-chain` 預取上限一致;超出的事件改用「查看全部告警」連到 Alerts,避免 400+ 卡片造成視覺與證據鏈混亂。 +- `IncidentCard` status-chain 來源在 production 已確認 25/25 都是 `truth-chain / ADR-100`,不再靠 heuristic 進度條回答主流程。 +- 基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機與服務資料,移除硬編碼 `HOST_CATALOG`、靜態拓樸與 fallback CPU/RAM。 +- 自動處置率只採用 `/api/v1/stats/disposition` 的 `auto_rate`;沒有 disposition 資料時顯示 `--`,不再用 resolved incident ratio 代替。 +- 順手清除同檔案已無用的 import、static helpers、p0Count、TOOL_ICON 等髒資料。 + +**邊界**: + +- 本輪是首頁 read-only 呈現與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。 +- 完整 400+ 事件仍由 Alerts / Work Items / AwoooP Runs 承接;首頁只放可追蹤、可讀的最新 25 筆。 + +**Local / production verification**: + +```text +node JSON parse zh-TW/en messages + -> i18n json ok +pnpm --dir apps/web exec tsc --noEmit --pretty false + -> pass +pnpm --dir apps/web exec next lint --file 'src/app/[locale]/page.tsx' + -> exit 0; existing any/literal-string warnings only +NEXT_PUBLIC_API_URL=https://awoooi.wooo.work pnpm --dir apps/web run build + -> compiled successfully, 90/90 static pages +Local Playwright http://localhost:3030/zh-TW + -> flowCount=25, statusChainOkCount=25, source=truth-chain, live host view has 192.168.0.112 Kali Security, no fake external topology +Production health + -> healthy, prod, mock_mode=false +Production /api/v1/dashboard/snapshot + -> host_count=5, hosts=110/112/120/121/188 +Production /api/v1/platform/ai-route-status?workload_type=deep_rca + -> selected_provider=ollama_gcp_a; policy order GCP-A -> GCP-B -> local 111 -> Gemini +Production Playwright https://awoooi.wooo.work/zh-TW + -> flowCount=25, statusChainOkCount=25, snapshotOkCount=2, latest footer visible, hasKali=true, hasFake=false, pageErrors=0, consoleErrors=0 + -> screenshot /tmp/awoooi-t104-home-production.png +``` + +**Gitea deploy / smoke**: + +```text +Code commit: + 72af10b4 fix(web): align homepage evidence with live data + +Deploy marker: + ed3a1646 chore(cd): deploy 72af10b [skip ci] + +Gitea Actions: + 1921 Code Review -> success in 14s + 1920 CD -> success in 9m43s +``` + +**目前整體進度**: + +- 首頁資料可信度:約 99.9%。 +- 前端 AI 自動化管理介面同步:約 99.8%。 +- AwoooP 告警可觀測鏈:約 99.8%。 +- 低風險自動修復閉環:約 95.2%。 +- 完整 AI 自動化管理產品化:約 98.9%。 + ## 2026-05-20|T103 Alert Chain smoke evidence 與 NoAlertsReceived2Hours 收斂 **觸發**: diff --git a/docs/superpowers/specs/2026-04-15-MASTER-ai-autonomous-flywheel-v2.md b/docs/superpowers/specs/2026-04-15-MASTER-ai-autonomous-flywheel-v2.md index 184da226..cf3d0b5d 100644 --- a/docs/superpowers/specs/2026-04-15-MASTER-ai-autonomous-flywheel-v2.md +++ b/docs/superpowers/specs/2026-04-15-MASTER-ai-autonomous-flywheel-v2.md @@ -2410,6 +2410,14 @@ Phase 6 完成後 - Production / CI:`598f33ae fix(monitoring): clarify alert chain smoke evidence`、`4956fbb8 fix(monitoring): verify alert rule deploy content` 已推 Gitea main;deploy marker `1b525b7c chore(cd): deploy 598f33a [skip ci]`。Actions:#1916 Code Review success 11s、#1917 Deploy Alert Rules success 22s、#1915 CD success 9m05s、#1918 Code Review success 11s、#1919 Deploy Alert Rules success 23s。 - 目前進度更新:AwoooP 告警可觀測鏈約 99.8%;Monitoring rule deploy proof 約 99.8%;低風險自動修復閉環約 95.2%;前端 AI 自動化管理介面同步約 99.6%;完整 AI 自動化管理產品化約 98.7%。 +**T104 Homepage live-data trust 與 Incident flow 對齊(2026-05-20 台北)**: +- 觸發:首頁仍混用 hardcoded infra catalog、fallback CPU/RAM、heuristic incident flow 與 400+ active incidents 渲染;Operator 從首頁很難判斷告警是否真的跑過 AI 自動化流程、卡在哪個階段、是否需要人工介入。 +- 修正:首頁 active incidents 限制為前 25 筆,與 status-chain 預取上限一致;超出事件連到 Alerts。基礎架構拓樸與主機 view 改用 live `/api/v1/dashboard/snapshot` 的 5 台主機資料,移除靜態 `HOST_CATALOG` / fake topology / fallback CPU RAM。自動處置率只採 `/api/v1/stats/disposition` 的 `auto_rate`,不再把 resolved ratio 當自動修復率。 +- 驗證:i18n JSON ok;`tsc --noEmit` pass;首頁目標 lint exit 0(既有 any / literal-string warnings 保留);production build 90/90 static pages。Local Playwright 與 Production Playwright 都確認 `flowCount=25`、`statusChainOkCount=25`、事件卡全為 `data-flow-source=truth-chain`、首頁 footer 顯示最新 25 筆、live host view 有 `192.168.0.112 Kali Security`、沒有 fake external topology、pageErrors=0 / consoleErrors=0。 +- Production / CI:`72af10b4 fix(web): align homepage evidence with live data` 已推 Gitea main;deploy marker `ed3a1646 chore(cd): deploy 72af10b [skip ci]`。Actions:#1921 Code Review success 14s、#1920 CD success 9m43s。Production health healthy/prod/mock_mode=false;`/api/v1/dashboard/snapshot` 回 5 hosts;AI route status 確認 `ollama_gcp_a -> ollama_gcp_b -> ollama_local(111) -> gemini`。 +- 邊界:T104 是 read-only 首頁產品化與資料可信度修正,不新增自動修復權限、不改 incident / approval / execution 狀態機。完整事件處理仍由 Alerts / Work Items / AwoooP Runs 承接。 +- 目前進度更新:首頁資料可信度約 99.9%;前端 AI 自動化管理介面同步約 99.8%;AwoooP 告警可觀測鏈約 99.8%;低風險自動修復閉環約 95.2%;完整 AI 自動化管理產品化約 98.9%。 + --- ### 2026-04-20 晚 (台北) — C1-C4 全流程串接 — Playbook 鏈路保護(commit de2d34d)