Phase 6.4 - Modular Architecture: - Add lewooogo-brain adapters for LLM providers - Add lewooogo-data dual memory (Redis + PostgreSQL) - Implement consensus engine for multi-agent decisions - Add incident memory service for historical context Phase 9 - Agent Teams (Claude Agent SDK): - Add base agent class with Claude Sonnet 4 integration - Implement action planner, blast radius, and security agents - Add agent API endpoints and proposal workflow - Integrate ADR-009 OpenClaw Agent Teams architecture DevOps & CI/CD: - Add GitHub Actions CI/CD workflows (ci.yaml, cd.yaml) - Add pre-commit hooks and secrets baseline - Add docker-compose for local development - Update Kubernetes network policies Frontend Improvements: - Add auto-healing error boundary component - Update i18n messages for agent features - Enhance dual-state incident card with execution feedback Documentation: - Add 7 ADRs covering MCP, design system, architecture decisions - Update ARCHITECTURE_MEMORY.md with modular design - Add GLOBAL_RULES.md and SOUL.md for project identity Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
90 lines
7.0 KiB
Markdown
90 lines
7.0 KiB
Markdown
# AIOps 平台差異分析與進化策略報告
|
||
**比較對象**:
|
||
1. **商業標準版**: `https://aiops.wooo.work/` (WOOO AIOps)
|
||
2. **次世代試驗版**: `http://localhost:3000/zh-TW` (AWOOOI)
|
||
|
||
---
|
||
|
||
## 1. 視覺與操作體驗對比 (UI/UX Comparison)
|
||
|
||
| 維度 | WOOO AIOps (線上版) | AWOOOI (Localhost) | 專家點評 |
|
||
|------|-------------------|--------------------|---------|
|
||
| **設計語彙** | 現代化企業 SaaS 面板 (可能基於 Shadcn UI/Radix) | **Nothing.tech** 極簡美學與「硬核駭客」風格 | Localhost 的美學極具辨識度與高級感,打破了傳統運維面板的枯燥,但目前欠缺資料密度與視覺引導。 |
|
||
| **色彩策略** | 鮮豔藍色 (Vibrant Blue) 點綴,明暗雙主題 | 高對比黑白灰 (`#nothing-black`),特殊狀態才用色彩點綴 (綠/紅/紫) | Localhost 透過克制的色彩更能凸顯關鍵告警(例如突發的紅色錯誤或 AI 介入的紫色)。 |
|
||
| **字體排版** | 易讀的標準網頁無襯線字體 | 大量使用**等寬字體 (Monospaced)** 呈現資料與日誌 | 神來之筆。等寬字體極大增強了「戰情室」的專業與壓迫感。 |
|
||
| **資料呈現** | 豐富的資料視覺化 (Recharts)、表格、圓餅圖 | 卡片化、進度條、狀態燈號與原始 Log 輸出 | 商業版適合經理人觀看,**Localhost 更適合 SRE 與 DevOps 的第一線作戰**。 |
|
||
|
||
---
|
||
|
||
## 2. 功能盤點與差異分析 (Feature Gap Analysis)
|
||
|
||
經過雙瀏覽器 Subagent 深度爬蟲,以下為雙方平台的功能覆蓋率對比:
|
||
|
||
### 🔴 嚴重落後 (Localhost 呈現 404 狀態)
|
||
1. **授權中心 (Approval Center)**: `/zh-TW/approvals` 找不到頁面。這是 Multi-Sig 多重簽核引擎的關鍵介面。
|
||
2. **知識殿堂 (Knowledge Base)**: `/zh-TW/knowledge` 找不到頁面。缺少事故處理 SOP 的檢索入口。
|
||
3. **設定 (Settings)**: `/zh-TW/settings` 找不到頁面。缺少使用者權限 (RBAC) 與通知頻道的設定。
|
||
|
||
### 🟡 深度不足 (Localhost 有介面但資料維度單薄)
|
||
1. **監控與效能 (Monitoring & APM)**: 線上版整合了 SigNoz 來追蹤 Trace/Latency,還有服務拓樸圖 (Service Topology)。Localhost 目前僅在「全局脈搏」呈現高階數據 (RPS, Error Rate),缺少微服務級別的下鑽 (Drill-down) 能力。
|
||
2. **自動修復與工單 (Auto Repair & Tickets)**: 線上版有完整的工單 SLA 追蹤與自動修復觸發紀錄。Localhost 目前將其合併在「行動日誌 (Action Logs)」中,以流水帳呈現,不易追蹤單一事件的完整生命週期。
|
||
3. **成本優化 (FinOps)**: 線上版有詳細的雲端帳單視覺化與優化建議,Localhost 完全缺乏此區塊。
|
||
|
||
### 🟢 本機優勢 (Localhost 獨創功能)
|
||
1. **AI 代理實體化 (OpenClaw 面板)**: Localhost 擁有獨立的 `[AGENT] patrolling...` 即時串流介面,讓 AI 像是真人在值班,這點在 UX 上大勝線上版傳統的自動化腳本感受。
|
||
|
||
---
|
||
|
||
## 3. AWOOOI (Localhost) 究極進化策略與解決方案
|
||
|
||
我們的目標不是「模仿」線上版,而是要在 **保留 Nothing.tech 美學** 的前提下,將線上版的複雜功能以更高級的方式重塑到 Localhost,讓其進化成次世代的「AI 智能戰情室」。
|
||
|
||
### ⚡ Phase 1: 基礎建設與 404 修復 (1-2 週)
|
||
|
||
**目標:補齊核心體驗,打通後端引擎。**
|
||
|
||
1. **實作高冷風格的「授權中心 (Approval Center)」**
|
||
- **問題**: 缺少 `/approvals` 頁面。
|
||
- **解決方案**: 結合後端的 `approval.py` (Multi-Sig Engine),設計一個終端機風格的審批介面。捨棄傳統的資料表格 (DataGrid)。
|
||
- **UI 設計**: 使用全螢幕的分割視窗,左側顯示紅色/橘色的「風險等級 (Risk Level: Critical)」,右側顯示需要審批的具體 K8s Diff (變更對比),按鈕設計成實體的「確認授權 (Authorize)」與「執行拒絕 (Reject)」,帶有機械物理按壓的過渡動畫。
|
||
|
||
2. **實作 Markdown 驅動的「知識殿堂 (Knowledge Base)」**
|
||
- **問題**: 缺少 `/knowledge` 頁面。
|
||
- **解決方案**: 實作一個左側大綱樹狀圖、右側 Markdown Render 的簡潔介面。加入一個全域的 `⌘+K` AI 搜尋框,直接串接 RAG 引擎,詢問「如何處理 Harbor Node 離線?」直接給出解答,而非傳統的關鍵字搜尋。
|
||
|
||
### 🚀 Phase 2: 核心功能的高級感重塑 (2-3 週)
|
||
|
||
**目標:將 WOOO AIOps 的複雜功能,轉化為符合 Nothing.tech 風格的資料視覺化。**
|
||
|
||
1. **服務拓樸 (Service Topology) 的「賽博解剖圖」**
|
||
- **分析**: 線上版使用傳統的節點連線圖。我們可以使用後端 `graph_rag.py` 提供的 `BlastRadiusResult` (爆炸半徑)。
|
||
- **進化方案**: 開發一個 3D 或極度平面的深色網路拓樸組件 (基於 React Flow 或 D3.js)。正常狀態下只有黑白相間的連線;當發生故障時,由故障節點向外擴散發出「紅色波紋 (Glitch 效果)」,一秒鐘讓 SRE 知道災情範圍。
|
||
|
||
2. **APM 效能監控的「極簡心電圖」**
|
||
- **分析**: 傳統 Grafana/SigNoz 圖表太過凌亂。
|
||
- **進化方案**: 在儀表板引入 **Sparklines (微型折線圖)**。移除所有的 X/Y 軸標籤與網格線,只用一條純白或高對比色的折線顯示過去 1 小時的 Latency 趨勢。當超出 P99 閾值時,折線局部變紅。這種高密度、低干擾的設計完美契合 Nothing 風格。
|
||
|
||
3. **成本優化 (FinOps) 的「廢墟數字」**
|
||
- **進化方案**: 不需要複雜的圓餅圖。直接在首頁放置一個巨大的、動態跳動的紅色數字:`WASTED CLOUD BUDGET: $1,245`,下方配一個按鈕 `[Execute AI Cleanup]`。這種強烈的視覺衝擊比十張分析圖表都有效。
|
||
|
||
### 🧠 Phase 3: AI 代理 (OpenClaw) 的雙向互動武裝 (3-4 週)
|
||
|
||
**目標:讓 AI Agent 不只是背景程序,而是運維團隊的「虛擬 SRE 同事」。**
|
||
|
||
1. **思維串流終端機 (Thinking Stream Terminal)**
|
||
- 目前 `agent.store.ts` 已經實作了強大的 SSE 解析與 Buffer 機制。我們應該將首頁右側的 OpenClaw 面板升級為一個**互動式終端機**。
|
||
- 當 AI 在處理問題時,以打字機效果 (Typing Effect) 實時印出它的推理過程:
|
||
```text
|
||
> [ERROR DETECTED] CPU spike on frontend-pod-1a2b
|
||
> [ANALYZING] Querying GraphRAG for blast radius...
|
||
> [RESULT] 3 upstream services might degrade.
|
||
> [DECISION] Propose auto-scaling. Waiting for Admin (CTO) approval.
|
||
```
|
||
|
||
2. **對話式命令列 (Command Palette)**
|
||
- 保留極簡 UI,取代傳統選單。使用者隨時可以按 `/` 喚出命令列,直接輸入自然語言:「重啟所有失敗的 pod」或「幫我整理昨天的錯誤日誌」。AI 會解析並產生對應的操作卡片供使用者確認 (Multi-Sig)。
|
||
|
||
---
|
||
**總結報告**
|
||
`localhost:3000` 在設計美學上已經走在前端,但內部功能的骨架還需補齊。只要優先將缺少的核心路由 (`/approvals`, `/knowledge`) 補上,並針對 GraphRAG 與 SSE Thinking Stream 這兩個殺手級後端引擎進行前端特化渲染,AWOOOI 將成為市面上最酷、最實用的運維作戰平台!
|