校準 GCP-B embedding timeout
All checks were successful
CD Pipeline / deploy (push) Successful in 1m6s

This commit is contained in:
OoO
2026-05-25 13:43:10 +08:00
parent e3dadc28db
commit 44ef5a70a1
9 changed files with 43 additions and 12 deletions

View File

@@ -155,9 +155,9 @@ HERMES_ALLOW_111_FALLBACK=false
# [選填] Embedding 服務主機;留空時自動走同一條 Ollama 三主機級聯
EMBEDDING_HOST=
# [預設 15] Embedding API timeout優先使用 Ollama /api/embed舊節點 fallback /api/embeddings
EMBEDDING_TIMEOUT=15
OLLAMA_EMBED_MAX_TIMEOUT=15
# [預設 30] Embedding API timeout優先使用 Ollama /api/embed舊節點 fallback /api/embeddings
EMBEDDING_TIMEOUT=30
OLLAMA_EMBED_MAX_TIMEOUT=30
OLLAMA_EMBED_KEEP_ALIVE=1m
OLLAMA_EMBED_MAX_CHARS=4000
OLLAMA_EMBED_GCP_FAILURE_COOLDOWN_SEC=60
@@ -410,8 +410,8 @@ OLLAMA_HOST_FALLBACK=http://192.168.0.111:11434
OLLAMA_MODEL=gemma3:4b
OLLAMA_TIMEOUT=120
OLLAMA_COPY_TIMEOUT=180
OLLAMA_EMBED_TIMEOUT=15
OLLAMA_EMBED_MAX_TIMEOUT=15
OLLAMA_EMBED_TIMEOUT=30
OLLAMA_EMBED_MAX_TIMEOUT=30
OLLAMA_EMBED_KEEP_ALIVE=1m
OLLAMA_EMBED_MAX_CHARS=4000
OLLAMA_EMBED_GCP_FAILURE_COOLDOWN_SEC=60
@@ -419,7 +419,7 @@ OLLAMA_EMBED_GCP_FAILURE_NOTICE_SEC=30
OLLAMA_HOST_HEALTH_MODEL_PROBE_ENABLED=true
OLLAMA_HOST_HEALTH_MODEL_PROBE_INCLUDE_111=false
OLLAMA_HOST_HEALTH_EMBED_MODEL=bge-m3:latest
OLLAMA_HOST_HEALTH_EMBED_TIMEOUT=8
OLLAMA_HOST_HEALTH_EMBED_TIMEOUT=30
OLLAMA_HOST_HEALTH_EMBED_KEEP_ALIVE=1m
# 111 是 Mac final fallback不承接 7B+ / vision / long-context / 長輸出任務;落到 111 時自動降級與縮短常駐。
OLLAMA_111_MODEL_FALLBACK=llama3.2:latest