Files
2026FIFAWorldCup/docs/crawler-source-policy.md
QuantBot 64cae96d0d
Some checks failed
2026 World Cup Quant Platform - Production Deployment / Code Quality, Security Gate & Testing (push) Failing after 4m12s
2026 World Cup Quant Platform - Production Deployment / Deploy to Production VM via Gitea CD (push) Has been skipped
deploy: push latest version to production
2026-06-26 14:06:37 +08:00

27 lines
1.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 爬蟲與資料來源政策
正式站目標是提供高時效、高可信度的世界盃投注研究資料,但所有來源都必須分級處理,避免把未授權資料當成主資料源。
## 來源分級
1. `active_api`:有授權 API、可機器讀取、可監控 quota 與錯誤率,例如 The Odds API。
2. `official_reference`:官方賽程、公告、比分與規則來源,例如 FIFA 官方網站。
3. `market_reference`:本地市場口徑核對來源,例如台灣運彩官方網站。
4. `news_reference`:新聞與事件訊號來源,例如 Google 新聞 RSS、NewsAPI、路透社、BBC、ESPN。
5. `manual_reference`:只能人工核對,不能自動高頻抓取。
## 台灣運彩使用原則
- `https://www.sportslottery.com.tw/` 可作為台灣市場投注語言、玩法名稱與盤口口徑參考。
- 未完成條款與 robots 檢查前,不做高頻爬取。
- 若未來要自動化導入必須加入節流、快取、錯誤退避、User-Agent 標示與資料來源標記。
- 台灣運彩資料不得覆蓋授權 odds API只能作市場口徑交叉檢查與前台繁體中文術語校準。
## 首頁推薦資料優先序
1. 授權賠率 API 與官方賽程。
2. 後端量化模型產生的勝率、期望值、模型優勢與倉位建議。
3. 新聞與事件訊號作風險調整。
4. 台灣運彩作台灣市場口徑參考。
5. 若資料源不健康,首頁必須顯示資料延遲或暫停推薦,不得硬推單。