feat(p20+): COST_TABLE 確認 4 新 Ollama 模型(GCP Primary+Secondary 已拉)
All checks were successful
CD Pipeline / deploy (push) Successful in 2m52s

Operation Ollama-First v5.0 / Phase 20+ 完整啟動

Primary + Secondary 兩台 GCP 完整對稱(10 模型 / ~67GB 各):
   bge-m3:latest         1.2GB  Embedding
   hermes3:latest        4.7GB  Hermes 戰術
   qwen2.5-coder:7b      4.7GB  AiderHeal 既有
   qwen2.5-coder:32b    19.0GB   AiderHeal 32B 升級
   qwen2.5:7b-instruct   4.7GB  Q&A 預設
   qwen3:14b             9.3GB  Q&A / Nemotron 升級
   deepseek-r1:14b       9.0GB   推理鏈備援
   minicpm-v:latest      5.5GB  PPT vision 主
   llava:latest          4.7GB   Vision 備援
   gemma3:4b             3.3GB   輕量任務

ai_call_logger COST_TABLE 確認 4 新模型 + 2 重命名(minicpm-v / llava)
- 解 logger 「unknown model cost」誤報
- 預期啟用:
  - qwen2.5-coder:32b → AiderHeal 大型重構(call site 將擴展)
  - deepseek-r1:14b → EA HITL 推理(取代部分 Gemini Pro)
  - llava:latest → minicpm-v 失敗備援
  - gemma3:4b → sales_copy < 100 字輕量任務

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
OoO
2026-05-04 10:48:22 +08:00
parent c13dc22639
commit 002e498648

View File

@@ -58,12 +58,14 @@ COST_TABLE: Dict[str, Dict[str, float]] = {
# Ollama 自架 (全 0Phase 8/13 GCP 拉模型陸續加入)
'hermes3:latest': {'in': 0.0, 'out': 0.0},
'qwen2.5-coder:7b': {'in': 0.0, 'out': 0.0},
'qwen2.5-coder:32b': {'in': 0.0, 'out': 0.0}, # Phase 8 GCP 候選(待拉)
'qwen2.5:7b-instruct': {'in': 0.0, 'out': 0.0}, # Phase 3 A7 OpenClaw Q&A 預設GCP 已拉)
'qwen3:14b': {'in': 0.0, 'out': 0.0}, # Phase 3 A9 Nemotron + A7 升級GCP 已拉)
'qwen2-vl:7b': {'in': 0.0, 'out': 0.0}, # Phase 13 PPT vision 候選
'deepseek-r1:14b': {'in': 0.0, 'out': 0.0}, # 推理增強候選
'gemma3:4b': {'in': 0.0, 'out': 0.0}, # 輕量 sales_copy 候選
'qwen2.5-coder:32b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 Primary+Secondary 已拉19GBAiderHeal 32B
'qwen2.5:7b-instruct': {'in': 0.0, 'out': 0.0}, # Phase 3 A7 OpenClaw Q&A 預設
'qwen3:14b': {'in': 0.0, 'out': 0.0}, # Phase 3 A9 Nemotron + A7 升級
'qwen2-vl:7b': {'in': 0.0, 'out': 0.0}, # Phase 13 PPT visionOllama registry 暫無,用 minicpm-v 代替)
'deepseek-r1:14b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉9GB推理鏈備援
'gemma3:4b': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉3.3GB),輕量任務
'minicpm-v:latest': {'in': 0.0, 'out': 0.0}, # Phase 14 PPT vision5.5GB
'llava:latest': {'in': 0.0, 'out': 0.0}, # 2026-05-04 已拉4.7GBVision 備援
'llama3.1:8b': {'in': 0.0, 'out': 0.0},
'bge-m3:latest': {'in': 0.0, 'out': 0.0},
}