Files
ewoooc/docs/adr
ogt 77d3a1da48
Some checks failed
CD Pipeline / deploy (push) Failing after 3m24s
feat(ai-ops): ADR-013 AIOps 自動修復閉環完整實作
架構(Exception → Incident → PlayBook → Heal → KM → Telegram):

新增元件:
- database/autoheal_models.py: Incident/Playbook/HealLog 三張表 + 7 條種子 PlayBook
- migrations/013_autoheal.sql: 建表 DDL + 種子資料(冪等 INSERT)
- services/auto_heal_service.py: 核心引擎 7 步閉環
  - _classify_error: 8 類錯誤自動分類 (DNS_FAIL/DB_UNREACHABLE/OOM/...)
  - _match_playbook: error_type + keyword + 冷卻 + max_retries 保護
  - _execute_playbook: DOCKER_RESTART/SSH_CMD/ALERT_ONLY/WAIT_RETRY
  - _sink_to_km: 修復知識寫入 ai_insights (auto_heal_playbook)
  - SSH 白名單:僅允許 docker restart / compose restart / docker start

修改元件:
- database/manager.py: _init_autoheal_tables() 啟動時建表+種子 PlayBook
- scheduler.py: 3 個核心任務植入 handle_exception
  (run_auto_import_task / run_icaim_analysis_task / run_weekly_strategy_task)
- requirements.txt: paramiko(SSH 跳板;不可用時降級 subprocess+CLI ssh)

安全設計: CMD 白名單 + cooldown + max_retries escalation + DB 冪等 migration

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-19 16:03:49 +08:00
..

Architecture Decision Records (ADR)

本目錄記錄 EwoooC(原 MOMO Pro System的所有重大架構決策。 專案範圍:momo-pro-system 目錄(不含 AWOOOI / WOOO AIOps SaaS Platform 遵循 Claude Code 官方規範CLAUDE.md憲法+ ADR決策+ Memory協作+ Skills流程

編號規則

  • 格式:ADR-XXX-kebab-case-title.md
  • 編號連續遞增,已撤銷的 ADR 保留編號(標記 Status: Superseded by ADR-YYY

狀態

狀態 說明
Proposed 提案中,尚未實作
Accepted 已批准,正在實作或已實作
Deprecated 已被取代,但保留歷史
Superseded 被新 ADR 完全取代

索引

ADR 標題 狀態 日期
001 三 Agent 自主學習分工Hermes/NemoTron/OpenClaw Accepted 2026-04-18
002 pgvector 作為唯一 KM 向量庫 Accepted 2026-04-18
003 Embedding 本地化到 Ollama 主機 Accepted 2026-04-18
004 NemoTron 配額耗盡 fallback 至 Hermes Rule-based Accepted 2026-04-18
005 KM 品質分數加入時間衰減 Accepted 2026-04-18
006 專案正名 MOMO Pro System → EwoooC Accepted 2026-04-18
007 AI 學習雙寫規範DB + KM 同步寫入) Accepted 2026-04-18
008 正式運行環境確認 — 188 Docker Compose(非 110 K3s) Accepted 2026-04-18
009 Embedding Retry Queue 持久化DB-backed Accepted 2026-04-19
010 EwoooC Gitea CI/CD PipelineGitea Actions + Docker Compose Accepted 2026-04-19

規範

  1. 任何重大架構決策(影響三條產品線之一、改動資料結構、引入新依賴)必須建 ADR
  2. 每份 ADR 包含Context背景→ Decision決策→ Alternatives Considered替代方案→ Consequences後果
  3. 建立後同步更新:本 README 索引、相關 SOT 文件、MEMORY.md