This commit is contained in:
@@ -1,25 +1,34 @@
|
||||
# MOMO PRO — AI 競價情報模組 Single Source of Truth
|
||||
|
||||
> **最後更新**: 2026-05-01 (台北時間)
|
||||
> **狀態**: 🟢 四 AI Agent 自動化閉環已落地 — EventRouter / AutoHeal / OpenClaw Memory / ElephantAlpha bridge / Prometheus metrics / Smoke Dashboard / Smoke Trend Management / Telegram Summary / Grafana provisioning / Prometheus scrape / CD Gunicorn 掛載具測試覆蓋
|
||||
> **適用版本**: V10.22 Legacy 5888 入口清理版
|
||||
> **最後更新**: 2026-05-12 (台北時間)
|
||||
> **狀態**: 🟢 四 AI Agent 自動化閉環已落地;LLM 路由紅線升級為 Ollama-first 三主機級聯,Gemini 僅備援 / 鎖定場景
|
||||
> **適用版本**: V10.91
|
||||
|
||||
---
|
||||
|
||||
## 零、LLM 路由紅線(2026-05-12)
|
||||
|
||||
- 所有 AI Agent、LLM 推理與 embedding 預設必須走 Ollama 三主機級聯:GCP-A `34.143.170.20:11434` → GCP-B `34.21.145.224:11434` → 111 `192.168.0.111:11434`。
|
||||
- `services/ollama_service.resolve_ollama_host()` 是主機解析契約;`OLLAMA_HOST`、`HERMES_URL`、`EMBEDDING_HOST`、`OLLAMA_API_BASE` 只接受 GCP-A / GCP-B / 111 或 110 的核准轉發端口。
|
||||
- Gemini 只能作為 Ollama 主路徑失敗後的備援,或 ADR-028 明確鎖定的 MCP Grounding、PPT/vision、週/月報、Code Review、EA HITL、複雜 SKU 升級等低頻場景。
|
||||
- 188 `192.168.0.188` 僅是 App / DB / scheduler / Telegram bot 容器宿主與 AutoHeal target,不可作為 Ollama 節點。
|
||||
- 通用 AI 文案、關鍵字、商品洞察與 Telegram Q&A 第一響應不得 Gemini-first。
|
||||
|
||||
## 一、四 AI Agent 路由架構
|
||||
|
||||
```
|
||||
SQL漏斗(~300筆)
|
||||
↓
|
||||
[Hermes 3 8B] — 分析師 (本地 Ollama, 零成本)
|
||||
模型: hermes3:latest @ 192.168.0.111:11434
|
||||
[Hermes 3 8B] — 分析師 (Ollama 三主機級聯, 零成本)
|
||||
模型: hermes3:latest @ GCP-A → GCP-B → 111
|
||||
任務: 競價威脅分類 → TOP 20 HIGH/MED/LOW
|
||||
↓
|
||||
[NemoTron NIM] — 派發器 (雲端, 免費配額)
|
||||
模型: meta/llama-3.1-8b-instruct @ NVIDIA NIM
|
||||
[NemoTron / qwen3] — 派發器
|
||||
主路徑: qwen3:14b @ Ollama 三主機級聯
|
||||
備援: NVIDIA NIM meta/llama-3.1-8b-instruct
|
||||
任務: Tool Calling → Telegram 告警 / DB 寫入
|
||||
↓
|
||||
[OpenClaw / Gemini] — 策略師 (費用審批制)
|
||||
[OpenClaw] — 策略師 (Ollama-first;Gemini 僅備援 / 鎖定場景)
|
||||
任務: 週策略報告、洞察報告、L3 HITL 建議
|
||||
↓
|
||||
[ElephantAlpha] — 編排者 (L3 Orchestrator)
|
||||
@@ -41,9 +50,9 @@ SQL漏斗(~300筆)
|
||||
|
||||
| 角色 | 模型 | 主機 | 成本 | 每日限額 |
|
||||
|------|------|------|------|---------|
|
||||
| Hermes 分析師 | hermes3:latest / embedding model | 192.168.0.111:11434 或 188 Ollama | 零 | 無限 |
|
||||
| NemoTron 派發器 | meta/llama-3.1-8b-instruct | NVIDIA NIM | 免費 80/天 | 80 |
|
||||
| OpenClaw 策略師 | Gemini | 雲端 | 需審批 | — |
|
||||
| Hermes 分析師 | hermes3:latest / bge-m3 | GCP-A → GCP-B → 111 Ollama | 零 | 無限 |
|
||||
| NemoTron 派發器 | qwen3:14b;NIM fallback | GCP-A → GCP-B → 111;NVIDIA NIM 備援 | Ollama 零;NIM 配額內免費 | NIM 80 |
|
||||
| OpenClaw 策略師 | qwen3:14b / Gemini 鎖定場景 | Ollama-first;Gemini 備援 | Ollama 零;Gemini 需控管 | — |
|
||||
| ElephantAlpha 編排者 | ElephantAlpha | 依部署環境 | 受控 | HITL / 任務制 |
|
||||
|
||||
---
|
||||
@@ -363,7 +372,7 @@ python3 services/competitor_price_feeder.py
|
||||
|
||||
─────────────────────
|
||||
⚙️ 運算足跡:
|
||||
• 🔍 分析: Hermes 3 8B (本地 111) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• 🔍 分析: Hermes 3 8B (GCP-A/GCP-B/111 Ollama) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• ⚡ 決策: NemoTron NIM | 185 Tokens | $0 (配額內 2/80)
|
||||
```
|
||||
|
||||
@@ -386,7 +395,7 @@ python3 services/competitor_price_feeder.py
|
||||
|
||||
─────────────────────
|
||||
⚙️ 運算足跡:
|
||||
• 🔍 分析: Hermes 3 8B (本地 111) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• 🔍 分析: Hermes 3 8B (GCP-A/GCP-B/111 Ollama) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• ⚡ 決策: NemoTron NIM | 185 Tokens | $0 (配額內 2/80)
|
||||
```
|
||||
|
||||
@@ -407,18 +416,18 @@ python3 services/competitor_price_feeder.py
|
||||
|
||||
─────────────────────
|
||||
⚙️ 運算足跡:
|
||||
• 🔍 分析: Hermes 3 8B (本地 111) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• 🔍 分析: Hermes 3 8B (GCP-A/GCP-B/111 Ollama) | 耗時: 34.2s | Tokens: 512 | $0 成本
|
||||
• ⚡ 決策: NemoTron NIM | 185 Tokens | $0 (配額內 2/80)
|
||||
```
|
||||
|
||||
#### 類別四(未來):Gemini 雲端推理週報
|
||||
#### 類別四:Gemini 備援 / 鎖定場景推理週報
|
||||
|
||||
```
|
||||
... (前文省略) ...
|
||||
─────────────────────
|
||||
⚙️ 運算足跡:
|
||||
• 🔍 彙整: Hermes 3 8B (本地 111) | 耗時: 12s | $0 成本
|
||||
• 🧠 推理: Gemini 1.5 Flash | 8,420 Tokens | 費用: 約 $0.003 USD
|
||||
• 🔍 彙整: Hermes 3 8B (GCP-A/GCP-B/111 Ollama) | 耗時: 12s | $0 成本
|
||||
• 🧠 備援/鎖定場景: Gemini 2.5 Flash | 8,420 Tokens | 費用: 約 $0.003 USD
|
||||
```
|
||||
|
||||
### 5.4 運算足跡資料來源
|
||||
@@ -459,7 +468,7 @@ python3 services/competitor_price_feeder.py
|
||||
|------|--------------|
|
||||
| Hermes 分析師 | `[Hermes 分析師]` |
|
||||
| NemoTron 派發器 | `[NemoTron 派發器]` |
|
||||
| Gemini 策略師 | `[Gemini 策略師]` (未來) |
|
||||
| Gemini 備援 | `[Gemini 備援]`(僅 Ollama 失敗或 ADR-028 鎖定場景) |
|
||||
|
||||
### 三種告警類型
|
||||
| Tool | 觸發條件 | Telegram 格式 |
|
||||
@@ -476,7 +485,7 @@ python3 services/competitor_price_feeder.py
|
||||
| 參數 | 值 |
|
||||
|------|---|
|
||||
| 模型 | `hermes3:latest` |
|
||||
| Ollama URL | `http://192.168.0.111:11434` |
|
||||
| Ollama URL | GCP-A `http://34.143.170.20:11434` → GCP-B `http://34.21.145.224:11434` → 111 `http://192.168.0.111:11434` |
|
||||
| Timeout | 120s |
|
||||
| Temperature | 0.1 |
|
||||
| 實測推理時間 | **19.3s(3筆,實彈 2026-04-17)** |
|
||||
@@ -506,7 +515,7 @@ python3 services/competitor_price_feeder.py
|
||||
| P1 | 告警去重 TTL | 同一 SKU 短期內重複告警未防範 |
|
||||
| P1 | `daily_sales_snapshot` 欄位防禦 | 若 Excel 欄位名變更,JOIN 條件會靜默失效 |
|
||||
| P2 | Scheduler 整合 | 每6小時自動觸發 Hermes→NIM→Telegram 管線 |
|
||||
| P2 | Gemini 策略師 | 週報生成(需費用審批後實作) |
|
||||
| P2 | Gemini 備援治理 | 僅保留 ADR-028 鎖定場景與 Ollama 失敗備援,新增 caller 必須走 ADR |
|
||||
|
||||
---
|
||||
|
||||
@@ -519,7 +528,9 @@ python3 services/competitor_price_feeder.py
|
||||
| PostgreSQL | 192.168.0.188 | `momo-db` | pgvector/pgvector:pg14,含所有 AI 相關表 |
|
||||
| momo-app | 192.168.0.188 | `momo-pro-system` | **Up healthy,port 5002:80**(5001 被 docker-registry 佔用,已改 5002) |
|
||||
| momo-scheduler | 192.168.0.188 | `momo-scheduler` | 常駐排程容器 |
|
||||
| Hermes 3 8B | 192.168.0.111 | Ollama 原生 | `hermes3:latest`,E2E 可達 |
|
||||
| Ollama Primary | 34.143.170.20 | Ollama 原生 | GCP-A,AI/LLM/embedding 主路徑 |
|
||||
| Ollama Secondary | 34.21.145.224 | Ollama 原生 | GCP-B,同等備援 |
|
||||
| Ollama Fallback | 192.168.0.111 | Ollama 原生 | 最後一道本地防線 |
|
||||
| E2E 驗證容器 | 192.168.0.188 | `momo-e2e-test` | 臨時容器,含新服務模組 |
|
||||
|
||||
### 188 `/home/ollama/momo-pro/.env` 正確設定
|
||||
|
||||
Reference in New Issue
Block a user