docs(ops): record momo reboot noise cleanup

This commit is contained in:
Your Name
2026-05-06 00:34:25 +08:00
parent cb9551fb00
commit 20ef0c1455

View File

@@ -15,6 +15,21 @@
- `_push_decision_to_telegram()` 與 stale READY token resend 共用同一個 dedup helper避免兩條路徑再次漂移。
-`test_decision_manager_telegram_dedup.py`,鎖住 `Incident``title` 欄位時仍能產出 alertname fingerprint。
## 2026-05-06 | momo-scheduler cold-start noise cleanup after reboot recovery
**背景**:全棧冷啟動 SOP 已達 `PASS=51 WARN=0 BLOCKED=0`,但 188 `momo-scheduler` 仍留下三個非致命噪音:白頁檢查沿用舊文案 marker、TokenReport 查詢缺少 `ai_call_budgets` 表、ElephantAlpha/Hermes legacy step 缺 engine 注入。
**現場修補與持久化**
- 188 live source 先備份到 `/home/ollama/backups/momo-hotfix-20260506-002930/`,再同步修補 `scheduler.py``services/elephant_alpha_autonomous_engine.py`
- 已在 `momo-db` 套用 `migrations/025_create_mcp_calls_and_budgets.sql`,補齊 `ai_call_budgets` / `mcp_calls`,並確認 `ai_call_budgets` 10 筆預算 seed 存在。
- momo repo 已推 `0904a60 fix(scheduler): quiet cold-start noise gates` 到 Gitea mainGitea Actions run 343 = Success。
**驗證**
- `momo-scheduler` 重啟後 `running healthy 0`
- 容器內 whitepage smoke`https://mo.wooo.work/` HTTP 200current EwoooC shell markers 通過。
- `generate_daily_report()` 不再回報生成失敗,`evaluate_throttle_status()` 可列出 providers。
- OpenClaw legacy `generate_resource_optimization_strategy` 轉為 advisory no-op避免冷啟動時被當成未識別 step。
## 2026-05-05 | Alert diagnosis prioritizes resolution over speed
**背景**:統帥明確修正策略:告警不是為了快速發卡片,而是為了把問題想清楚並完成 AI 自動化解決GCP-A/GCP-B 有 SSD可承擔深度診斷等待時間Gemini 只能作 GCP-A → GCP-B → 111 全失敗後的備援。