MOMO Pro 監控中心

統一監控 UAT + GCP 雙環境

上次更新: -

應用服務

MOMO Pro System UAT

測試環境 - 商品看板與業績分析系統

MOMO Pro System GCP

正式環境 - 商品看板與業績分析系統

Apache Superset

BI 分析儀表板 - 資料視覺化平台

開發工具

GitLab

Git 版本控制 + CI/CD 自動化部署

Docker Registry

私有容器映像倉庫

n8n

自動化工作流程引擎 (29 個工作流程)

監控服務 (K8s)

Grafana

監控儀表板 - K8s 叢集視覺化

Prometheus

時序資料庫 - 指標收集與查詢

Alertmanager

告警管理 - 整合 Telegram 通知

容器管理與日誌

Portainer

Docker 容器管理平台

Loki

日誌聚合系統 (Grafana 整合)

cAdvisor

容器資源監控

BI 分析平台

Metabase

資料分析與視覺化平台

Docker Grafana

Docker 版監控儀表板

檔案與協作

Nextcloud

私有雲端檔案儲存

系統狀態概覽

K8s Pods 狀態
momo namespace
  • Running momo-app
  • Running momo-postgres
  • Running momo-scheduler
  • Running postgres-exporter
monitoring namespace
  • Running prometheus-grafana
  • Running alertmanager
  • Running prometheus
  • Running node-exporter

排程任務總覽

Cron 排程
頻率 任務
*/5 * * * * 域名健康監控
*/5 * * * * 主自動修復 (UAT+GCP)
*/5 * * * * Docker 健康監控
*/5 * * * * K8s 健康監控
0 */2 * * * 新聞抓取 (每2小時)
30 */3 * * * AI 處理 (每3小時)
n8n 工作流程 (29 個)
頻率 工作流程
每 5 分鐘 雙環境健康監控
每 10 分鐘 K8s Pod 狀態監控
每 15 分鐘 PostgreSQL 慢查詢監控
每 30 分鐘 Google Drive 匯入監控
每小時 磁碟空間監控
每日 09:00 每日系統報告
每日 09:00 SSL 證書監控
每週一 09:00 每週業績摘要
Python Scheduler (momo-scheduler Pod)
每 30 分鐘
  • Google Drive 自動匯入
  • 網頁白頁監控
每 1 小時
  • 主站商品爬蟲
  • EDM 限時搶購爬蟲
每 6 小時
  • 購物節活動爬蟲
每日
  • 每日業績 Telegram 通知
  • 每日業績 LINE 通知

自動修復機制

UATUAT 環境修復
OOM Handler 每 15 分鐘
PostgreSQL Repair 每 30 分鐘
Auto Rollback 每 5 分鐘
GCPGCP 環境修復 (遠端)
OOM Handler GCP 每 15 分鐘
PostgreSQL Repair GCP 每 30 分鐘
Auto Rollback GCP 每 5 分鐘
修復能力總覽
記憶體問題

OOM 自動增加記憶體限制 +50%

自動重啟 Pod

資料庫問題

連線失敗自動重啟

死鎖自動終止查詢

表膨脹自動 VACUUM

應用問題

5 次健康失敗自動回滾

服務無回應自動重啟