From 002e49864827f3255f5b26019f935f15462316d4 Mon Sep 17 00:00:00 2001 From: OoO Date: Mon, 4 May 2026 10:48:22 +0800 Subject: [PATCH] =?UTF-8?q?feat(p20+):=20COST=5FTABLE=20=E7=A2=BA=E8=AA=8D?= =?UTF-8?q?=204=20=E6=96=B0=20Ollama=20=E6=A8=A1=E5=9E=8B=EF=BC=88GCP=20Pr?= =?UTF-8?q?imary+Secondary=20=E5=B7=B2=E6=8B=89=EF=BC=89?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Operation Ollama-First v5.0 / Phase 20+ 完整啟動 Primary + Secondary 兩台 GCP 完整對稱(10 模型 / ~67GB 各): ✅ bge-m3:latest 1.2GB Embedding ✅ hermes3:latest 4.7GB Hermes 戰術 ✅ qwen2.5-coder:7b 4.7GB AiderHeal 既有 ✅ qwen2.5-coder:32b 19.0GB ⭐ AiderHeal 32B 升級 ✅ qwen2.5:7b-instruct 4.7GB Q&A 預設 ✅ qwen3:14b 9.3GB Q&A / Nemotron 升級 ✅ deepseek-r1:14b 9.0GB ⭐ 推理鏈備援 ✅ minicpm-v:latest 5.5GB PPT vision 主 ✅ llava:latest 4.7GB ⭐ Vision 備援 ✅ gemma3:4b 3.3GB ⭐ 輕量任務 ai_call_logger COST_TABLE 確認 4 新模型 + 2 重命名(minicpm-v / llava) - 解 logger 「unknown model cost」誤報 - 預期啟用: - qwen2.5-coder:32b → AiderHeal 大型重構(call site 將擴展) - deepseek-r1:14b → EA HITL 推理(取代部分 Gemini Pro) - llava:latest → minicpm-v 失敗備援 - gemma3:4b → sales_copy < 100 字輕量任務 Co-Authored-By: Claude Opus 4.7 (1M context) --- services/ai_call_logger.py | 14 ++++++++------ 1 file changed, 8 insertions(+), 6 deletions(-) diff --git a/services/ai_call_logger.py b/services/ai_call_logger.py index 5c8219f..9def60a 100644 --- a/services/ai_call_logger.py +++ b/services/ai_call_logger.py @@ -58,12 +58,14 @@ COST_TABLE: Dict[str, Dict[str, float]] = { # Ollama 自架 (全 0;Phase 8/13 GCP 拉模型陸續加入) 'hermes3:latest': {'in': 0.0, 'out': 0.0}, 'qwen2.5-coder:7b': {'in': 0.0, 'out': 0.0}, - 'qwen2.5-coder:32b': {'in': 0.0, 'out': 0.0}, # Phase 8 GCP 候選(待拉) - 'qwen2.5:7b-instruct': {'in': 0.0, 'out': 0.0}, # Phase 3 A7 OpenClaw Q&A 預設(GCP 已拉) - 'qwen3:14b': {'in': 0.0, 'out': 0.0}, # Phase 3 A9 Nemotron + A7 升級(GCP 已拉) - 'qwen2-vl:7b': {'in': 0.0, 'out': 0.0}, # Phase 13 PPT vision 候選 - 'deepseek-r1:14b': {'in': 0.0, 'out': 0.0}, # 推理增強候選 - 'gemma3:4b': {'in': 0.0, 'out': 0.0}, # 輕量 sales_copy 候選 + 'qwen2.5-coder:32b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 Primary+Secondary 已拉(19GB)AiderHeal 32B + 'qwen2.5:7b-instruct': {'in': 0.0, 'out': 0.0}, # Phase 3 A7 OpenClaw Q&A 預設 + 'qwen3:14b': {'in': 0.0, 'out': 0.0}, # Phase 3 A9 Nemotron + A7 升級 + 'qwen2-vl:7b': {'in': 0.0, 'out': 0.0}, # Phase 13 PPT vision(Ollama registry 暫無,用 minicpm-v 代替) + 'deepseek-r1:14b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉(9GB),推理鏈備援 + 'gemma3:4b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉(3.3GB),輕量任務 + 'minicpm-v:latest': {'in': 0.0, 'out': 0.0}, # Phase 14 PPT vision(5.5GB) + 'llava:latest': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉(4.7GB),Vision 備援 'llama3.1:8b': {'in': 0.0, 'out': 0.0}, 'bge-m3:latest': {'in': 0.0, 'out': 0.0}, }