ewoooc/docs/phase11_db_design_20260503.md at dev

CD Pipeline / deploy (push) Successful in 3m30s

Details

db(p11): rag_query_log + learning_episodes — RAG 自主學習迴圈基礎

Operation Ollama-First v5.0 / Phase 11 RAG + 自主學習

migrations/027 — rag_query_log（每次 RAG 查詢的 audit log）
- query_text 4KB CHECK + 90 天保留
- VECTOR(1024) bge-m3 embedding (與 ai_insights 一致簽名)
- ivfflat lists=100 索引
- saved_call 欄位追蹤「成功攔截 LLM 呼叫」次數
- feedback_score 1-5（NULL=未反饋）
- 6 條 CHECK 含 chk_rag_saved_consistent

migrations/028 — learning_episodes（蒸餾池 → ai_insights 前哨）
- 8 狀態機：pending/approved/awaiting_review/rejected_*4/expired
- weight 0-1（>=0.8 觸發 PromotionGate Stage 4 人工驗收）
- 9 條 CHECK 含 chk_le_approved_consistent / chk_le_review_consistent
- partial index idx_le_status WHERE in (pending, awaiting_review)
- distilled_text 16KB 上限

docs/phase11_db_design — 設計文檔
- 6 大決策（兩表分離 / ivfflat / partial index / 軟連結 / 90天保留 / 應用層白名單）
- 6 大風險評估（R1 PII / R2 蒸餾失誤 / R3 ivfflat 退化 / R4 dangling FK / R5/R6 trade-off）
- Phase 11 上線後驗收 SQL（EXPLAIN ANALYZE）

PromotionGate 4 階段（v5.0 護欄 #1, ADR-033）：
  Stage 1: quality_score >= 0.7
  Stage 2: 無幻覺檢測（規則引擎，零 LLM）
  Stage 3: 與既有 insight 相似度 < 0.95
  Stage 4: weight >= 0.8 必經 Telegram 👍/👎（24h 無回應 → expired）

A4 fullstack-engineer 同時在寫 services/rag_service.py + learning_pipeline.py，
service 完成後一起部署啟用。

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

維度	rag_query_log	learning_episodes
角色	RAG 召回的 audit log	知識庫前哨（蒸餾池）
資料方向	從用戶/呼叫者「進來」	給 ai_insights「出去」
生命週期	90 天滾動刪除	長期（approved/rejected 走冷儲檔）
寫入頻率	高（每次 RAG 召回都寫）	中（過 quality 才寫）
PII 風險	高（query_text = 用戶問題）	低（distilled 已蒸餾）
典型查詢	「過去 24h 命中率」「caller 分布」	「待人工驗收清單」「Stage 3 dedup query」
是否進 RAG 召回語料	否（只是 log）	否（只有晉升 ai_insights 後才進）

表	保留	工具	預計排程
`rag_query_log`	90 天	scheduler `DELETE WHERE queried_at < NOW() - INTERVAL '90 days'`	03:30 daily
`learning_episodes` (pending/awaiting_review)	永久（直到狀態變化）	—	—
`learning_episodes` (approved)	永久（蒸餾溯源）	—	—
`learning_episodes` (rejected_*/expired)	180 天後可冷儲檔	後續 ADR 定	monthly
`ai_calls`	90 天	（已存在 migration 024 註解）	03:00 daily
`mcp_calls`	90 天	同上	03:15 daily

9.6 KiB

Raw Permalink Blame History

Phase 11 DB 設計：RAG + 自主學習迴圈

1. 為何分兩表（rag_query_log vs learning_episodes）

2. ivfflat lists=100 計算依據

3. promotion_status 狀態機

4. 90 天保留策略

5. 風險評估

R1（HIGH）—— query_text PII 落地

R2（HIGH）—— 蒸餾失誤污染 RAG

R3（MEDIUM）—— ivfflat 索引膨脹 / 退化

R4（MEDIUM）—— ai_insights 軟連結 dangling

R5（LOW）—— used_results BIGINT[] 反正規化

R6（LOW）—— caller 白名單未在 DB 強制

6. 驗收清單（給 critic）

9.6 KiB Raw Permalink Blame History Unescape Escape

Phase 11 DB 設計：RAG + 自主學習迴圈

1. 為何分兩表（rag_query_log vs learning_episodes）

2. ivfflat lists=100 計算依據

3. promotion_status 狀態機

4. 90 天保留策略

5. 風險評估

R1（HIGH）—— query_text PII 落地

R2（HIGH）—— 蒸餾失誤污染 RAG

R3（MEDIUM）—— ivfflat 索引膨脹 / 退化

R4（MEDIUM）—— ai_insights 軟連結 dangling

R5（LOW）—— used_results BIGINT[] 反正規化

R6（LOW）—— caller 白名單未在 DB 強制

6. 驗收清單（給 critic）

9.6 KiB

Raw Permalink Blame History