Files
awoooi/docs/AIOPS_WWOOO_VS_LOCALHOST_REPORT.md
OG T 7478dc0254 feat(phase6-9): Complete modular architecture and Agent Teams
Phase 6.4 - Modular Architecture:
- Add lewooogo-brain adapters for LLM providers
- Add lewooogo-data dual memory (Redis + PostgreSQL)
- Implement consensus engine for multi-agent decisions
- Add incident memory service for historical context

Phase 9 - Agent Teams (Claude Agent SDK):
- Add base agent class with Claude Sonnet 4 integration
- Implement action planner, blast radius, and security agents
- Add agent API endpoints and proposal workflow
- Integrate ADR-009 OpenClaw Agent Teams architecture

DevOps & CI/CD:
- Add GitHub Actions CI/CD workflows (ci.yaml, cd.yaml)
- Add pre-commit hooks and secrets baseline
- Add docker-compose for local development
- Update Kubernetes network policies

Frontend Improvements:
- Add auto-healing error boundary component
- Update i18n messages for agent features
- Enhance dual-state incident card with execution feedback

Documentation:
- Add 7 ADRs covering MCP, design system, architecture decisions
- Update ARCHITECTURE_MEMORY.md with modular design
- Add GLOBAL_RULES.md and SOUL.md for project identity

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-03-23 18:40:36 +08:00

90 lines
7.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# AIOps 平台差異分析與進化策略報告
**比較對象**:
1. **商業標準版**: `https://aiops.wooo.work/` (WOOO AIOps)
2. **次世代試驗版**: `http://localhost:3000/zh-TW` (AWOOOI)
---
## 1. 視覺與操作體驗對比 (UI/UX Comparison)
| 維度 | WOOO AIOps (線上版) | AWOOOI (Localhost) | 專家點評 |
|------|-------------------|--------------------|---------|
| **設計語彙** | 現代化企業 SaaS 面板 (可能基於 Shadcn UI/Radix) | **Nothing.tech** 極簡美學與「硬核駭客」風格 | Localhost 的美學極具辨識度與高級感,打破了傳統運維面板的枯燥,但目前欠缺資料密度與視覺引導。 |
| **色彩策略** | 鮮豔藍色 (Vibrant Blue) 點綴,明暗雙主題 | 高對比黑白灰 (`#nothing-black`),特殊狀態才用色彩點綴 (綠/紅/紫) | Localhost 透過克制的色彩更能凸顯關鍵告警(例如突發的紅色錯誤或 AI 介入的紫色)。 |
| **字體排版** | 易讀的標準網頁無襯線字體 | 大量使用**等寬字體 (Monospaced)** 呈現資料與日誌 | 神來之筆。等寬字體極大增強了「戰情室」的專業與壓迫感。 |
| **資料呈現** | 豐富的資料視覺化 (Recharts)、表格、圓餅圖 | 卡片化、進度條、狀態燈號與原始 Log 輸出 | 商業版適合經理人觀看,**Localhost 更適合 SRE 與 DevOps 的第一線作戰**。 |
---
## 2. 功能盤點與差異分析 (Feature Gap Analysis)
經過雙瀏覽器 Subagent 深度爬蟲,以下為雙方平台的功能覆蓋率對比:
### 🔴 嚴重落後 (Localhost 呈現 404 狀態)
1. **授權中心 (Approval Center)**: `/zh-TW/approvals` 找不到頁面。這是 Multi-Sig 多重簽核引擎的關鍵介面。
2. **知識殿堂 (Knowledge Base)**: `/zh-TW/knowledge` 找不到頁面。缺少事故處理 SOP 的檢索入口。
3. **設定 (Settings)**: `/zh-TW/settings` 找不到頁面。缺少使用者權限 (RBAC) 與通知頻道的設定。
### 🟡 深度不足 (Localhost 有介面但資料維度單薄)
1. **監控與效能 (Monitoring & APM)**: 線上版整合了 SigNoz 來追蹤 Trace/Latency還有服務拓樸圖 (Service Topology)。Localhost 目前僅在「全局脈搏」呈現高階數據 (RPS, Error Rate),缺少微服務級別的下鑽 (Drill-down) 能力。
2. **自動修復與工單 (Auto Repair & Tickets)**: 線上版有完整的工單 SLA 追蹤與自動修復觸發紀錄。Localhost 目前將其合併在「行動日誌 (Action Logs)」中,以流水帳呈現,不易追蹤單一事件的完整生命週期。
3. **成本優化 (FinOps)**: 線上版有詳細的雲端帳單視覺化與優化建議Localhost 完全缺乏此區塊。
### 🟢 本機優勢 (Localhost 獨創功能)
1. **AI 代理實體化 (OpenClaw 面板)**: Localhost 擁有獨立的 `[AGENT] patrolling...` 即時串流介面,讓 AI 像是真人在值班,這點在 UX 上大勝線上版傳統的自動化腳本感受。
---
## 3. AWOOOI (Localhost) 究極進化策略與解決方案
我們的目標不是「模仿」線上版,而是要在 **保留 Nothing.tech 美學** 的前提下,將線上版的複雜功能以更高級的方式重塑到 Localhost讓其進化成次世代的「AI 智能戰情室」。
### ⚡ Phase 1: 基礎建設與 404 修復 (1-2 週)
**目標:補齊核心體驗,打通後端引擎。**
1. **實作高冷風格的「授權中心 (Approval Center)」**
- **問題**: 缺少 `/approvals` 頁面。
- **解決方案**: 結合後端的 `approval.py` (Multi-Sig Engine),設計一個終端機風格的審批介面。捨棄傳統的資料表格 (DataGrid)。
- **UI 設計**: 使用全螢幕的分割視窗,左側顯示紅色/橘色的「風險等級 (Risk Level: Critical)」,右側顯示需要審批的具體 K8s Diff (變更對比),按鈕設計成實體的「確認授權 (Authorize)」與「執行拒絕 (Reject)」,帶有機械物理按壓的過渡動畫。
2. **實作 Markdown 驅動的「知識殿堂 (Knowledge Base)」**
- **問題**: 缺少 `/knowledge` 頁面。
- **解決方案**: 實作一個左側大綱樹狀圖、右側 Markdown Render 的簡潔介面。加入一個全域的 `⌘+K` AI 搜尋框,直接串接 RAG 引擎,詢問「如何處理 Harbor Node 離線?」直接給出解答,而非傳統的關鍵字搜尋。
### 🚀 Phase 2: 核心功能的高級感重塑 (2-3 週)
**目標:將 WOOO AIOps 的複雜功能,轉化為符合 Nothing.tech 風格的資料視覺化。**
1. **服務拓樸 (Service Topology) 的「賽博解剖圖」**
- **分析**: 線上版使用傳統的節點連線圖。我們可以使用後端 `graph_rag.py` 提供的 `BlastRadiusResult` (爆炸半徑)。
- **進化方案**: 開發一個 3D 或極度平面的深色網路拓樸組件 (基於 React Flow 或 D3.js)。正常狀態下只有黑白相間的連線;當發生故障時,由故障節點向外擴散發出「紅色波紋 (Glitch 效果)」,一秒鐘讓 SRE 知道災情範圍。
2. **APM 效能監控的「極簡心電圖」**
- **分析**: 傳統 Grafana/SigNoz 圖表太過凌亂。
- **進化方案**: 在儀表板引入 **Sparklines (微型折線圖)**。移除所有的 X/Y 軸標籤與網格線,只用一條純白或高對比色的折線顯示過去 1 小時的 Latency 趨勢。當超出 P99 閾值時,折線局部變紅。這種高密度、低干擾的設計完美契合 Nothing 風格。
3. **成本優化 (FinOps) 的「廢墟數字」**
- **進化方案**: 不需要複雜的圓餅圖。直接在首頁放置一個巨大的、動態跳動的紅色數字:`WASTED CLOUD BUDGET: $1,245`,下方配一個按鈕 `[Execute AI Cleanup]`。這種強烈的視覺衝擊比十張分析圖表都有效。
### 🧠 Phase 3: AI 代理 (OpenClaw) 的雙向互動武裝 (3-4 週)
**目標:讓 AI Agent 不只是背景程序,而是運維團隊的「虛擬 SRE 同事」。**
1. **思維串流終端機 (Thinking Stream Terminal)**
- 目前 `agent.store.ts` 已經實作了強大的 SSE 解析與 Buffer 機制。我們應該將首頁右側的 OpenClaw 面板升級為一個**互動式終端機**。
- 當 AI 在處理問題時,以打字機效果 (Typing Effect) 實時印出它的推理過程:
```text
> [ERROR DETECTED] CPU spike on frontend-pod-1a2b
> [ANALYZING] Querying GraphRAG for blast radius...
> [RESULT] 3 upstream services might degrade.
> [DECISION] Propose auto-scaling. Waiting for Admin (CTO) approval.
```
2. **對話式命令列 (Command Palette)**
- 保留極簡 UI取代傳統選單。使用者隨時可以按 `/` 喚出命令列,直接輸入自然語言:「重啟所有失敗的 pod」或「幫我整理昨天的錯誤日誌」。AI 會解析並產生對應的操作卡片供使用者確認 (Multi-Sig)。
---
**總結報告**
`localhost:3000` 在設計美學上已經走在前端,但內部功能的骨架還需補齊。只要優先將缺少的核心路由 (`/approvals`, `/knowledge`) 補上,並針對 GraphRAG 與 SSE Thinking Stream 這兩個殺手級後端引擎進行前端特化渲染AWOOOI 將成為市面上最酷、最實用的運維作戰平台!