27 lines
1.4 KiB
Markdown
27 lines
1.4 KiB
Markdown
# 爬蟲與資料來源政策
|
||
|
||
正式站目標是提供高時效、高可信度的世界盃投注研究資料,但所有來源都必須分級處理,避免把未授權資料當成主資料源。
|
||
|
||
## 來源分級
|
||
|
||
1. `active_api`:有授權 API、可機器讀取、可監控 quota 與錯誤率,例如 The Odds API。
|
||
2. `official_reference`:官方賽程、公告、比分與規則來源,例如 FIFA 官方網站。
|
||
3. `market_reference`:本地市場口徑核對來源,例如台灣運彩官方網站。
|
||
4. `news_reference`:新聞與事件訊號來源,例如 Google 新聞 RSS、NewsAPI、路透社、BBC、ESPN。
|
||
5. `manual_reference`:只能人工核對,不能自動高頻抓取。
|
||
|
||
## 台灣運彩使用原則
|
||
|
||
- `https://www.sportslottery.com.tw/` 可作為台灣市場投注語言、玩法名稱與盤口口徑參考。
|
||
- 未完成條款與 robots 檢查前,不做高頻爬取。
|
||
- 若未來要自動化導入,必須加入節流、快取、錯誤退避、User-Agent 標示與資料來源標記。
|
||
- 台灣運彩資料不得覆蓋授權 odds API,只能作市場口徑交叉檢查與前台繁體中文術語校準。
|
||
|
||
## 首頁推薦資料優先序
|
||
|
||
1. 授權賠率 API 與官方賽程。
|
||
2. 後端量化模型產生的勝率、期望值、模型優勢與倉位建議。
|
||
3. 新聞與事件訊號作風險調整。
|
||
4. 台灣運彩作台灣市場口徑參考。
|
||
5. 若資料源不健康,首頁必須顯示資料延遲或暫停推薦,不得硬推單。
|