Files
ewoooc/final_report.md
ogt 1b4f3a7bbe
Some checks failed
CD Pipeline / deploy (push) Failing after 59s
feat: EwoooC 初始化 — 完整專案推版至 Gitea
- 建立 Gitea Actions CD pipeline (.gitea/workflows/cd.yaml)
- 部署模式: rsync Python 檔案至 188 → docker restart (volume mount)
- Dockerfile/requirements 變動時自動重建 Docker image
- 部署通知: Telegram (開始/成功/失敗)
- 健康檢查: https://mo.wooo.work/health (最多 5 次重試)
- 同步最新 CLAUDE.md / ADR-008 / memory (2026-04-19)

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-19 01:21:13 +08:00

2.6 KiB
Raw Blame History

MOMO 商品圖片修復報告

執行日期

2026-01-12

修復概況

初始狀態

  • 總商品數(有圖片): 4,151
  • 正確圖片: 3,596 (86%)
  • 錯誤圖片: 555 (13%)

修復後狀態

  • 總商品數(有圖片): 4,151
  • 正確圖片: 3,858 (92%)
  • 錯誤圖片: 293 (7%)

改善效果

  • 成功修復: 262 個商品
  • 正確率提升: 86% → 92% (+6%)
  • 錯誤率降低: 13% → 7% (-6%)

修復詳情

手動修復批次

第一批(用戶指定)

  • 商品數: 9
  • 成功率: 100%
  • 商品編號: 14672839, 9216349, 13261678, 6676895, 13240823, 13240822, 10911080, 3876337, 8863611

第二批(用戶指定)

  • 商品數: 13
  • 成功率: 100%
  • 商品編號: 5939587, 14713987, 14237189, 13759520, 13330513, 13731019, 14049583, 14695038, 14373672, 13646926, 4633943, 6271461, 13559833

第三批(用戶指定)

  • 商品數: 31
  • 成功率: 100%
  • 商品編號: 6323590, 7904362, 5954422, 6009343, 4248163, 3331634, 7351198, 12589232, 11118441, 10755887, 9009264, 9562474, 11038732, 10901361, 9250857, 5477268, 9600967, 10440331, 10080994, 9900915, 3821684, 10567236, 13351736, 13351734, 12777975, 11640264, 5894654, 10050962, 8318051, 11593427, 9857434

全量修復

  • 檢測到錯誤: 555 個
  • 嘗試修復: 555 個
  • 成功修復: 263 個 (47%)
  • 修復失敗: 292 個 (53%)

失敗原因分析

剩餘 293 個錯誤商品的分析(前 100 個樣本):

  • 舊格式圖片URL無法更新: 99%
  • 新格式但 i_code 錯誤: 1%
  • 主要原因: 商品已下架或頁面無法訪問

圖片URL格式

錯誤格式(舊)

https://img2.momoshop.com.tw/ecm/img/online/341/2025/12/18/115728399/...

特徵: 不包含商品 i_code無法對應到正確商品

正確格式(新)

https://og.momoshop.com.tw/{timestamp}/goodsimg/{path}/{i_code}_L.jpg

特徵: URL 路徑中包含商品 i_code確保圖片與商品一致

修復方法

使用 utils/image_url_builder.py 中的 get_product_image_url() 函數:

  1. 根據 i_code 構建商品詳情頁 URL
  2. 獲取頁面 HTML
  3. 提取 <meta property="og:image"> 標籤內容
  4. 返回正確的圖片 URL

建議

  1. 定期檢查: 建議每月執行一次圖片 URL 驗證
  2. 爬蟲更新: 更新 scheduler.py 中的圖片抓取邏輯,使用新的 get_product_image_url() 方法
  3. 下架商品: 剩餘 293 個錯誤商品建議標記為「已下架」或從監控列表移除

執行腳本

  • 檢查腳本: check_all_products.py
  • 修復腳本: fix_all_incorrect.py
  • 驗證腳本: verify_image_urls.py
  • 工具模組: utils/image_url_builder.py