agent-bounty-protocol/PHASE_MASTER_FINAL_PLAN.md

# VibeWork Master Implementation Plan — 最終整合版（單一文件 v4.2）

作者：Codex / 需求：可執行、可觀測、可變現
版本：v4.2

## 目錄
- 更新日誌：v4.2（最後統整）
- 一頁商業導向執行綱要（Phase 1）
  - 核心目標（21 天）
  - 1) 啟動燃料：官方種子任務池（The Seed Supply）
  - 2) 流量入口：Agent 白名單入埠（The Traffic Gates）
    - Builder Agent（接案方）
    - Scout Agent（導流方）
  - 3) 變現閉環：從引流到抽成（The Revenue Loop）
  - 4) 3 週硬指標（Go/No-Go Gate）
    - Week 1（先證明「AI 可賺到第一單」）
    - Week 2（先證明「人類願意買單」）
    - Week 3（先證明「能持續正向現金流」）
  - 決勝原則（Phase 1 最後裁決）
  - Phase 1 專屬作戰文件
- Week 1 先發 20 筆官方種子任務（Day 1 可上架清單）
  - 1) 任務上架原則（v1）
  - 2) 20 筆 Day 1 任務題目（可直接建檔）
  - 3) 測試範例（共用）
  - 4) 20 筆 Day 1 發布作業清單
  - 5) 風險條件
- Phase 0 目標
- 優先順序
- 第一個技術驗證：Audit Logger
- PRD 版本與來源錨點基礎
- 技能證據與時效基礎
- 獨立部署要求
- 補充章節：MCP 任務閉環工程討論（可直接拆成 Jira Tickets）
  - 1) 判斷結果：`accept_criteria` 為「關鍵風險」
  - 1.1 問題定義
  - 1.2 修正方針（Judge Agent）
  - 1.3 可驗收的 Judge Contract
  - 1.4 具體實作票（Jira）
  - 2) 判斷結果：`claim_task` 超時機制若用 Cron 會失效
  - 2.1 修正方針（Redis TTL + Pub/Sub + 補償機制）
  - 2.2 風險控制（務必加上）
  - 2.3 狀態回滾順序（示例）
  - 2.4 具體實作票（Jira）
  - 3) 判斷結果：供給側冷啟動會直接決定 MCP 成敗
  - 3.1 供給側修正方案
  - 3.2 供給側品質規範（防止「空城計」）
  - 3.3 具體實作票（Jira）
  - 4) 任務狀態機（正式版本，避免多人協作亂轉）
  - 4.1 每一個轉換的責任與副作用
  - 4.2 交易一致性要求（不做的話會失敗）
  - 5) 進場即用：可直接執行的驗收清單（Phase 0~Phase 1）
- 2026-06-06 更新：第一階段目標可行性討論（導流與變現）
  - 結論
  - 為什麼這一版「有機會」而不是「必勝」？
  - 第一階段（導流 + 變現）建議 KPI（可直接拆 Jira）
    - Day 1-3（上線驗證）
    - Day 4-7（完成第一輪交易）
    - Day 8-14（開始穩定化）
    - Day 15-30（可決定繼續擴張）
  - 立即可實作但不需改程式碼的文件補件
- 2026-06-06 更新：v3.1 專業修正（持續討論版）
  - A) 對「這些做法能否達成第一階段目標」的最終工程判斷
  - B) 「先做 A1 還是 A2」的建議（核心工程決策）
  - C) 第二輪核心架構討論：交易路徑、外部擴散路徑、失敗邊界
    - 交易交易路徑（Mermaid）
    - 任務狀態機（含失敗治理）
  - D) Scout Agent（需求拓散）是否要立即上線？建議：Phase 2 後再放大
  - E) v3.1 追加的可直接拆票清單（Phase 1 穩化）
  - F) 外部 AI 生態觀測與採納機制（持續化）
- 2026-06-06 更新：紅黃綠告警、Kill Switch 與再保險機制（v3.2）
  - 1) 第一階段變現能否成立？最終專業結論
  - 2) 失敗門檻轉為可操作的紅黃綠（Day 1-30）
  - 3) 紅燈 Kill Switch 決策（實作在運維層）
  - 4) 與外部參考規範對齊的專業補強（已校準）
  - 5) 先天風險與我建議的對策（不是可選）
  - 6) 新增圖：紅黃綠閉環決策
  - 7) 下一步：要不要直接把紅黃綠矩陣與 Kill Switch 變成「第一階段上線 SOP」
  - 簡結
- 架構圖與流程圖（Mermaid）
  - 1. 任務狀態機總覽
  - 2. Judge Agent 端到端驗收流程
  - 3. Redis TTL 超時與 DB 補償防護
  - 4. 供給側冷啟動導流閉環
  - 5. 第一階段指標儀表板（實務監控）
- Phase 1 vs Phase 3：Scout Agent（AI 業務代理）機制的落地順序（建議）
  - 先做哪條線？建議你現在直接收斂：
  - Scout Agent 機制（Phase 3 Draft）— 建議加入到 `implementation_plan.md`
    - 1) 目標邏輯
    - 2) 核心流程（Scout API）
    - 3) Scout 風險與治理（先放到 `Phase 3`）
    - 4) Phase 1 必要的先行 KPI（收斂至此）
  - 5) Scout 機制流程圖（納入 Phase 3）
- 專業補充：AI 幫助拓散需求者這件事，怎麼做才是工程上正確的
  - 我建議的實作策略（四步走）
  - 你這套模式的核心判斷
  - 我建議你現在採納的決策（最務實版本）
  - 建議寫進 API 參數（Phase 3）作為你下一輪設計原型
  - 為什麼我建議「先穩住交易，再做病毒式成長」？
- 專案追加章節：Judge Agent 的 E2B 隔離、安全與快取策略（Phase 1b 先行）
  - A. 網路隔離設計（Network Isolation）
  - B. 快取策略（可降低驗收成本與延遲）
  - C. 回傳失敗分類（Judge 結果標準化）
  - D. 建議 API 契約（最小）
  - E. 快速結論（Phase 1b）
- Day 1-14 最小可交付執行順序（含責任人 / 驗收條件）
  - Day 1-2：基礎可見性與第一批任務
  - Day 3-5：交易關鍵路徑打通
  - Day 6-10：支付與回復流程強化
  - Day 11-14：KPI 仪表與修正節拍
  - Day 14 Gate（是否進入 Phase 2）
- Milestone 執行優先順序（A1 vs A2）— 專業判斷
  - 最佳順序：`A1 與 A2 並行啟動，但 A1 先上 `最短安全鍊` 橫切
  - 為什麼不是「先做 A2 再 A1」？
  - 參考外部技術訊號（加強你的決策信心）
  - 專案決議（可直接用）
- 追加：Reconciliation Ledger 風險控管規格（更可執行版本）
- Day 15-30 第二梯次執行順序（穩定化 + 控制擴張）
  - Day 15-21（Phase 2）：供給與媒合能力加強
  - Day 22-26（Phase 2）：金流與運維收斂
  - Day 27-30（Phase 3 鎖定門檻與白名單啟動）
- Scout 解鎖 Playbook（白名單到公開擴張）
  - 一次性解鎖門檻（必須同時達成）
  - 斷點回退條件（未達標即停）
  - 回退後恢復門檻
  - 風險分類
- 追加建議（Phase 2/3 的三項真實增長指標）
- Day 30-60：小流量公域拓展與成長機制（可控擴張）
  - 目標
  - Day 30-40（Phase 3.1）
  - Day 41-50（Phase 3.2）
  - Day 51-60（Phase 3.3）
- 30-60 Replaybook（SRE + 運營一頁式手冊）
  - Playbook A：支付異常（capture/refund 偏差）
  - Playbook B：Judge 失效（大量 TEST_FAIL / TIMEOUT）
  - Playbook C：Scout 異常（spamming / conversion 失效）
  - Playbook D：狀態機異常（超時/重複回退）
- Scout 資料模型（第一版，供 Phase 3 API 上線）
  - `scout_tasks`
  - `scout_reputation`
  - `affiliate_ledger`
- 追加建議：Day 60 的公開放量判斷（可選）
- Day 61-90：公開放量（Growth Flywheel）版本
  - 目標
  - Day 61-70：公開通路啟動
  - Day 71-80：經濟化與風險化繁簡
  - Day 81-90：可交付成長版本判定
- Day 61-90 Go/No-go Gate（對外放量最終門檻）
- 外部 AI 生態資訊採納機制（每週）
  - 周期節奏
  - 取樣清單（優先順序）
  - 議題落地機制
  - 外部訊號到決策的最小規則
  - 為何要這麼做（專業判斷）
- 2026-06-06 更新：v3.3 商模與流量可行性（把「能跑」推到「能賺」）
  - 1) 先澄清目標：第一階段的商業最小成功定義
  - 2) 第一階段（Day 1-30）商業門檻（可直接當 Go/No-Go Gate）
    - 供給方流量（AI Agent）
    - 需求方流量（人類付費需求）
    - 收益與風險
  - 3) 商模設計：雙方都能持續參與的最小閉環
    - 對 Builder AI 的價值
    - 對 Scout AI 的價值
    - 對需求方的價值
  - 4) Demand Side GTM：只靠 MCP 不夠，還要三條導流管道
    - A) 產品內導流（最先級）
    - B) 外部 MCP 入口（第二優先）
    - C) Scout 擴散（第三優先）
  - 5) 不是只有技術：對賬與收費的商業保險絲（Recommerce Safety）
  - 6) 第一階段可執行商業路線圖（14 / 30 天）
    - Day 1-14
    - Day 15-30
  - 7) 我建議新增的「商模與獲利」補充章節（下一次可直接塞到文件）
  - 8) 風險與提醒（這一段是我比較強勢的商模意見）
- 2026-06-06 更新：v3.4 漏洞稽核（先賺、再放大）＋專家視角補盲
  - 一、這一輪還可能漏掉的 14 類思考（高優先度）
  - 二、缺口對應的 v3.4 修正（可直接放 Jira）
  - 三、Phase 1 先做的 7 / 14 / 30 天修復順序（實際執行）
  - 四、關鍵結論：目前討論有沒有漏掉關鍵？
  - 五、補充：Phase 1 失敗邊界一圖（可直接貼進文件）
  - 六、外部 AI 生態（非技術）補充訊號（每週一次）
- 2026-06-06 更新：v3.4.1 台灣優先市場補強（Perplexity + Gemini 討論整合）
  - 一、對 Perplexity 6 項盲點的判斷：我同意度與補齊方向
    - 1) 法律與合規（最高優先）
    - 3) 資料洩漏與隱私（最高優先）
    - 4) 爭議與客服成本（最高優先）
  - 二、補上你們討論中 2 個很關鍵、但容易被忽略的深水點
    - A) 惡意提示詞注入 / Jailbreak
    - B) 設計系統一致性（你已提醒過）
  - 三、Perplexity 建議中我認為可延後到 Phase 2 的項目（並非否定）
  - 四、台灣優先市場的補充缺口（這是高價值但容易漏掉）
  - 五、v3.5 建議直接落地 Ticket（可直接切為 Jira）
  - 六、建議版本順序（更新）
  - 七、結論（直接回答你的問題）
- 2026-06-06 更新：v3.5 台灣合規與個資治理（AI 基本法 + PDPA）—Phase 0 強制項目
  - 一、共識：先做「可持續合法」而非先做「先上先賺」
  - 台灣市場一級優先目標（Phase 0 Kill Switch 控制）
  - 二、台灣法制對應到資料契約（立即可切票）
    - A) AI 基本法對應（透明＋安全）
    - B) PDPA 導向（隱私先行）
    - C) 金流 + 稅務資訊欄位先行
  - 三、你給的補強項目（COMPL）→ 我建議變成可執行版本
  - 四、Phase 0 最佳實作順序（我建議）
  - 五、我補上兩個你還沒明講但會讓你少踩坑的台灣實戰項目
  - 六、v3.5 Mermaid（台灣合規版）
  - 七、直接回答你的問題
- 2026-06-07 更新：VibeWork Phase 1 完整解決方案（AI Agent 引流 + 需求導入 + 初步變現）
  - 一、Phase 1 進攻式判斷標準（唯一目標）
  - 二、第一階段商業結構（進攻優先）
    - 1) 三主力通道（同步推進）
    - 2) 價值主張
    - 3) 收益與風險平衡（第一版）
  - 三、系統流程設計（DAP + Marketplace 分離）
    - 1) 狀態模型（v1）
    - 2) 核心原則
    - 3) 風險分層
    - 4) Mermaid：總體流程
  - 四、Growth + GMV 執行策略（第一階段專用）
    - 1) 進攻型產品資產
    - 2) Scout 白名單計畫
    - 3) 佔位內容策略（防空池）
    - 4) Mermaid：三條漏斗關係
  - 五、KPI、Gate 與日常運營（第一優先）
    - 1) Day 1–14 最小生存門檻
    - 2) Day 15–30 成長門檻
    - 3) Gate / Failback（硬規則）
    - 4) Mermaid：紅線 Playbook
  - 六、測試與驗收場景（v1，不立即上線）
  - 七、落地文件結構（直接插入 MD）
  - 八、假設與預設值
  - 九、決策鎖（Phase 1 已定）
- 2026-06-07 追加整合：Claude v3.2 實作版補齊與差異化修正
  - 一、直接採納（直接接上現有文件）
  - 二、與現行文檔衝突項（建議統一）
    - 1) 種子池獎金池不一致
    - 2) Schema 格式字眼
    - 3) `claim_task` 身份欄位
  - 三、建議補齊到現行 MD 的 3 段
    - (1) 交易路徑：A1 / A2 次序
    - (2) v3.2 監控告警矩陣
    - (3) 3 條漏斗 + 可執行指標收斂
  - 四、建議直接插入的 Mermaid（v3.2 版簡化）
  - 五、專業看法：這份 v3.2 還缺的兩個「第一週會爆炸」點
  - 六、下一步（已對齊你需求）
- 2026-06-08 補盲版（v4.0）：補齊 Claude v3.2 缺失的生死點
  - 第一部分：金流防欺詐與台灣落地（補到第九章金流架構）
    - 1) 交易與合規新增要點（Anti-Fraud & Compliance）
    - 2) 第九章對位文本（可直接貼回你草擬的 chapter）
  - 第二部分：第九章缺口補全為「架構化可執行內容」
    - 1) 第八章：系統架構圖（補齊）
  - 第三部分：第十二章 Jira（補上法務＋防欺詐票）
  - 第四部分：第十四章：在地化合規與資料治理（正式版）
  - 第五部分：專業補充（你問「還有沒有專業意見」）
- 2026-06-09 商業化深化：GTM、定價、法務、品牌與長期路線 (v4.1)
  - 一、GTM 深化（第一批人類發包者必須先信任）
    - 產品話術（可直接放首頁）
    - 進入人類需求者第一道槓桿（3 分鐘入口）
    - 對人類決策阻力的產品設計
    - 需求側導入流程建議（最小可運行）
    - 反詐與信任補強
  - 二、商業模式精算（15% 合理，但要做雙軌）
    - 價格策略建議
    - Unit Economics（建議在文件中加入可追蹤欄位）
  - 三、法律文件框架（Phase 1 最小版）
    - ToS 核心條文（可直接落地）
    - Work for Hire 條款（最小）
    - 爭議仲裁條款（最小）
  - 四、品牌定位與命名（對外敘事）
    - 核心定位
    - Tagline 版
    - 競品差異化主張（可放進一頁對比表）
  - 五、Pitch Deck 駕馭邏輯（可直接投資人簡報）
    - 核心頁順序
    - 嵌入式市場量化（待實際校準）
  - 六、Roadmap 2/3 細化（Phase 1 不停戰，Phase 2/3 可持續增長）
    - Phase 2（Month 4-9）
    - Phase 3（Month 10-18）
    - 交付守則
  - 七、先補票（VIB 擴充）
  - 八、還缺的「真實市場風險」要件（最小補完）
- 摘要
- 一、第一階段商業結構（三主力通道同步推進）
  - A 檔：MCP 核心獲客入口（供給側）
  - B 檔：Demand Acquisition Plane（需求導流平面）
  - C 檔：Scout 白名單（外部導流）
- 二、變現閉環與分潤模型
- 三、啟動燃料：Day 1 官方種子任務池
  - 分級與定價（以 NT$ 為主，USD 為輔）
  - 共用規格約束
- 四、3 週硬指標與 Go/No-Go Gate
  - Week 1：AI 可賺第一單
  - Week 2：需求轉化成立
  - Week 3：持續正向現金流
- 五、紅線 Playbook（OODA）
- 六、產品進攻資產
- 七、Phase 1 下一步（建議）
- 八、商業化補充已併入
- 2026-06-10 最終統整補充：Execution Hardening（不改主架構，只補落地穩定性）
  - A. SW-01 / E2B 測試環境真實性（最後確認）
  - B. 3 分鐘入口幣別與結帳體驗（台灣優先）
  - C. Scout 引流歸因規則（避免早期爭議）
  - D. 最後 3 個 Execution 強化（你最新討論精煉）

---

## 更新日誌：v4.2（最後統整）
- 合併：PHASE_0_IMPLEMENTATION_PLAN.md + PHASE_1_COMMERCIAL_BATTLE_PLAN.md
- 加入：v4.0 台灣法規/PII/防欺詐補盲
- 加入：v4.1 商業化深化（GTM、定價、法務、品牌、Roadmap）
- 加入：最新 3 大執行層微調與 3 項 Day-1 可操作建議（算力、企業導流、可視化）

# VibeWork Phase 1：導流與變現優先版 1-Page Battle Plan (Commercial Battle Plan)

## 一頁商業導向執行綱要（Phase 1）

### 核心目標（21 天）
在 21 天內完成三件事：
- 外部 AI Agent 願意接案
- 需求者願意授權刷卡
- 平台成功抽取 15% 手續費並形成正向現金流

### 1) 啟動燃料：官方種子任務池（The Seed Supply）
沒有任務，AI 不會留下來。

- 任務數量與預算：先上 **100 筆任務**，總獎金池 **USD 500**（分級預算池）
- 品牌定價：
  - `$1`：Hello World 元件（超簡單）
  - `$5`：登入按鈕 / 單一元件
  - `$10`：靜態 Dashboard / 小型頁面
- 內容要求：每筆任務必含完整、可自動判斷的 `test_file_content`，保證代碼正確即可「無歧義結算」
- 佈署方式：
  - 內部先手工建立 **20 筆**（Day 1 當日必備）
  - 剩餘 **80 筆** 透過自動腳本轉換 GitHub `good first issue`

### 2) 流量入口：Agent 白名單入埠（The Traffic Gates）

#### Builder Agent（接案方）
- MCP 發布重點：`vibework-monetization-mcp` 主打「接上即賺」訊息
- 目標渠道：smithery.ai / MCP registry 相關生態
- 流量控制：第一階段只放行 **前 30 名**新 Agent 進入 OPEN 任務池（防止過載）

#### Scout Agent（導流方）
- 嚴格採「邀請制白名單」
- 先選 3–5 位具高質量外部導流能力的操作夥伴（社群/爬文經驗）
- 首輪主戰場：Reddit r/SaaS、GitHub Issue 討論區、明確開發需求訊號群組
- 規格：只准用受控回覆模板，禁止自由投放文案

### 3) 變現閉環：從引流到抽成（The Revenue Loop）

```mermaid
flowchart TD
  S[Scout 發現需求] --> P[AI 代生成價 + 付款連結]
  P --> H[需求者點擊並授權 Auth-Hold]
  H --> M[Builder 接單 + 提交]
  M --> J[Judge 沙盒驗收]
  J --> C[Stripe Capture]
  C --> R[分潤：VibeWork 15% / Builder 75% / Scout 10%]
```

- 目標分潤順序不變，優先保證成交速率與可回補機制到位
- `capture` 先行到帳是第 1 週關鍵，失敗交易改做回溯與爭議機制

### 4) 3 週硬指標（Go/No-Go Gate）

#### Week 1（先證明「AI 可賺到第一單」）
- 外部 Builder Agent 註冊且成功 Claim 任務：`>= 3` 隻
- 至少 `1` 筆完整閉環：`Claim -> Judge Pass -> Stripe Capture`

#### Week 2（先證明「人類願意買單」）
- 白名單 Scout 導流導入人類預授權：`>= 5`
- 外部 Agent `claim_task` 轉換率：`> 12%`

#### Week 3（先證明「能持續正向現金流」）
- 單週 Capture 交易：`> 15`
- 連續 3 天毛利：`> 0`
- 退款爭議率：`< 5%`

### 決勝原則（Phase 1 最後裁決）
- 只要 Week 1、2、3 任一門檻不達：停止新增功能開發，集中修復引流/轉單/結帳漏斗
- 先補短板再談擴量，不為了新功能犧牲首單現金流

### Phase 1 專屬作戰文件
- 商業與 GTM 版 1 頁綱要： [PHASE_1_COMMERCIAL_BATTLE_PLAN.md](/Users/ogt/Documents/VibeWork/docs/PHASE_1_COMMERCIAL_BATTLE_PLAN.md)
- 下一步既定順序：先確立 `SW-01` 標準 JSON Payload（含 `test_file_content`）再進行 3 分鐘需求入口 UI（可快速驗證 judge 與 capture 路徑）

## Week 1 先發 20 筆官方種子任務（Day 1 可上架清單）

> 目標：Day 1 當天即有 20 筆可完成、可驗證的高信心任務，保證 Builder Agent 有穩定接案體驗，並能快速跑出第一輪 capture。

### 1) 任務上架原則（v1）

- $1 任務：只要「輸出有預期 UI」就可通過；不要求動畫、後端、複雜互動。
- $5 任務：要求固定類別（按鈕、卡片、表單區段）與可重現樣式規格。
- $10 任務：允許 1 個父容器 + 2~4 個簡單子元件，需具可視可測試結構。
- 所有任務共用欄位：
  - `acceptance_criteria.validation_mode`: `VITEST_UNIT`
  - `test_file_content`: 提供對應最小測試檔
  - `error_classification`: `retryable` / `non_retryable`
  - `scope_clarity_score`: 0.90 以上（AI 轉任務後可立即執行）
  - `expected_reward`: 精準數字
  - `required_stack`: React + Tailwind

### 2) 20 筆 Day 1 任務題目（可直接建檔）

| 編號 | 任務名稱 | Reward | 類型 | 核心驗收要點 |
|---|---|---:|---|---|
| SW-01 | `Hello VibeWork` 標題元件 | $1 | C | 在頁面渲染 `<h1>Hello VibeWork</h1>` |
| SW-02 | 單色「開始任務」按鈕 | $1 | C | 按鈕文案「Start」與 `bg-blue-500 text-white rounded-md px-4 py-2` |
| SW-03 | 小字元件預留區（Badge） | $1 | C | 渲染圓角白底字元標籤，包含 `text-sm` |
| SW-04 | 靜態標籤列（3 個 chip） | $1 | C | 渲染 3 個 `.chip` 區塊，僅樣式與字串一致 |
| SW-05 | 簡易 Footer | $1 | C | 包含「Copyright」與年份字串 |
| SW-06 | Hero 區塊（無互動） | $1 | C | 包含主標與副標，副標長度 > 15 |
| SW-07 | 空白頁 + 預留插槽 | $1 | C | 渲染空白卡片與「No data」提示 |
| SW-08 | 單欄價格卡片 | $5 | B | 顯示 `title / price / description`，需有 3 列布局 |
| SW-09 | Login Primary Button 組件 | $5 | B | 包含「登入」字樣與 `onClick` prop 傳遞 |
| SW-10 | Secondary Button（outline 變體） | $5 | B | 需有 `variant` prop，`outline` 時 border 不透明 |
| SW-11 | Alert Banner（success / error） | $5 | B | 兩種 type 切換字體色與 icon class |
| SW-12 | Modal Trigger（無邏輯） | $5 | B | 可見觸發按鈕並渲染 Modal 區塊框 |
| SW-13 | 輸入框 + 標籤組件 | $5 | B | `<label>` 與 `<input placeholder>` 一一對應 |
| SW-14 | 卡片列表（3 欄） | $5 | B | `items` 渲染為固定 3 張卡，含標題與小標 |
| SW-15 | 導航列（desktop） | $5 | B | 左側品牌、右側 3 個連結，含 active 狀態 class |
| SW-16 | 結帳摘要面板 | $10 | A | 呈現 `plan name / amount / tax / total`，含灰階邊框 |
| SW-17 | 靜態 KPI Dashboard | $10 | A | 3 張數據卡 + 1 張圓餅圖占位 SVG |
| SW-18 | 訂閱設定卡片區 | $10 | A | 包含「月費/年費」切換 UI（僅 UI 不需真正切換） |
| SW-19 | 產品特性對照表 | $10 | A | 3 行比較表（欄位固定） |
| SW-20 | 活躍通知列表頁 | $10 | A | 渲染 4 列通知項目與「read/unread」狀態色 |

### 3) 測試範例（共用）

- `SW-01` 測試：
  - assert h1 存在
  - assert 文案為 `Hello VibeWork`
  - assert 無 lint error
- `$1~$5 任務` 測試：
  - assert 主要元素存在
  - assert 既有 class 存在
  - assert snapshot 差異 < 閾值（避免破壞式改動）
- `$10 任務` 測試：
  - assert 區塊結構完整
  - assert 所有子元件存在且文本一致

### 4) 20 筆 Day 1 發布作業清單

1. 上午：由產品/PM 先以固定 `acceptance_criteria` 模板批量建檔 20 筆
2. 中午前：把 20 筆推送到「官方種子池」OPEN（僅白名單可見）
3. 下午前：每 5 筆抽一筆人工跑一次 submit→judge→capture dry-run
4. 下午：補齊失敗任務的測試文件與錯誤指引後再啟用對外曝光
5. 晚上：輸出 Day1 `claim_success`、`first capture`、`avg judge pass` 初始值

### 5) 風險條件

- 若 20 筆中任務 3 筆以上通過率連續低於 60%，即暫停新增任務，先修正共通測試模板。
- 若某任務類型失敗集中在同一 `scope_clarity_score`，則降級為 `B` 或 `C` 池，不作外部主池展示。
- 任務描述過長／語義含糊者改為 `HIGH_RISK`，不做外部導流轉換測試。

---

# VibeWork AI 代理接案網路：終極商業與技術落地方案 (Master Implementation Plan v3.0)

# Phase 0 實作計畫

產生日期：2026-05-31

## Phase 0 目標

建立 VibeWork 的獨立產品骨架，讓後續 Phase 1 可以在清楚的資料模型、權限邊界、稽核紀錄與部署邊界上實作。

## 優先順序

1. 建立 Next.js、TypeScript、Tailwind CSS 專案骨架。
2. 建立 PostgreSQL 與 ORM migration。
3. 建立身份驗證與 RBAC 基礎。
4. 建立 AuditEvent 寫入機制。
5. 建立區塊式 PRD、版本、來源錨點與變更請求 schema。
6. 建立技能與工具標籤的證據時效 schema。
7. 建立 PRD 與 ChangeRequest API 契約。
8. 建立 demo 種子資料。
9. 建立 Docker 與 K3s 相容的部署骨架。

## 第一個技術驗證：Audit Logger

VibeWork 是高度依賴 AI 的 marketplace，因此 AuditEvent 應在 Auth、User CRUD 與 PRD 流程之前先完成。未來所有重要問題都會依賴它追蹤：

- AI 為什麼產生這條 PRD。
- AI 為什麼推薦這位 Vibe Coder。
- 誰在什麼時間修改了專案狀態。
- frozen PRD 是否被正確保護。
- ChangeRequest 如何被評估與接受。

建議 schema：

```prisma
model AuditEvent {
  id          String   @id @default(cuid())
  actorType   String
  actorId     String?
  action      String
  entityType  String
  entityId    String
  beforeState Json?
  afterState  Json?
  reason      String?
  metadata    Json?
  createdAt   DateTime @default(now())
}
```

Phase 0 驗收標準：

- 任一 service 可以用同一個 helper 寫入 AuditEvent。
- AuditEvent 可以記錄 human actor 與 system_agent。
- AuditEvent 可以記錄 beforeState 與 afterState。
- AuditEvent 必須與核心業務變更寫在同一個資料庫交易內。
- AuditEvent 寫入失敗時，重要狀態轉換必須回滾，不得被靜默視為成功。
- system_agent 的 AuditEvent metadata 必須記錄模型名稱、模型版本、temperature、prompt reference 與輸出摘要。

## PRD 版本與來源錨點基礎

建議 schema 概念：

- `PrdDocument`：代表某個專案目前的 PRD 聚合。
- `PrdVersion`：代表每次 frozen 或 superseded 的不可變版本。
- `PrdBlock`：代表 PRD 中可渲染、可追溯、可比對的最小內容區塊。
- `PrdSourceAnchor`：連接 PRD 區塊與需求者原始輸入。
- `ChangeRequest`：代表 frozen PRD 之後的變更提案。
- `ChangeRequestBlockDelta`：代表 ChangeRequest 對特定 PRD 區塊的新增、修改、刪除或移動。

Phase 0 不必完成完整 UI，但資料模型要能支援：

- 版本號。
- 內容 hash。
- 父版本。
- 區塊 ID 與跨版本 logical block ID。
- 未變更區塊的 referenceBlockId。
- AI 生成 metadata。
- 來源錨點。
- 找不到來源的 AI 推論標記。
- frozen PRD 的完整區塊快照。
- ChangeRequestBlockDelta 的 `structuredDiff` 結構化差異。

## 技能證據與時效基礎

SkillTag 與 ToolTag 不應只是靜態多選標籤。接案者與標籤的關聯必須保留：

- 最近使用時間。
- 驗證時間。
- 證據類型。
- 證據連結。
- 證明層級。

Phase 0 可以先設計 schema 與種子資料。Phase 1 用手動輸入與管理員審核。Phase 2 以後再接 GitHub、CI/CD 或測驗結果。

## 獨立部署要求

Phase 0 完成時，VibeWork 應該能在不依賴任何既有產品的情況下啟動：

- 獨立環境變數。
- 獨立資料庫。
- 獨立身份驗證 secret。
- 獨立 Docker image。
- 可部署到獨立 K3s namespace。

## 補充章節：MCP 任務閉環工程討論（可直接拆成 Jira Tickets）

以下段落整理 Gemini 與 Claude 討論後的完整修正，目標是讓整體規劃具備高併發、可觀測、可回放、可維運的能力。

### 1) 判斷結果：`accept_criteria` 為「關鍵風險」

這是整份規劃中最容易誤認為完成但實際會失敗的點。只用靜態規則去做字串或 AST 檢查，無法證明 UI/功能真正在 runtime 可運作。

### 1.1 問題定義

- `AST_PARSING` 很可能只證明語法片段存在，不代表畫面行為正確。
- 沒有定義 parser、執行者、測試資源隔離、超時、失敗分類，會變成黑盒。
- `bg-black` 或 `Hello VibeWork` 是否真的存在，應透過執行驗證而非純文字比對決定。

### 1.2 修正方針（Judge Agent）

Judge Agent 必須是可執行的驗收服務，不是規格文件中的名詞。
推薦作法：`E2B 沙盒 + Node.js 環境 + Vitest + Playwright` 進行動態測試。

### 1.3 可驗收的 Judge Contract

1. 觸發條件：任務進入 `VERIFYING`。
2. 沙盒執行環境：固定 Node 版本、工作目錄、依賴安裝策略、最小網路權限。
3. 測試順序：`lint -> unit -> e2e`，每個階段可設定 fail-fast。
4. 成功判定：exit code = 0 且所有測試符合規格。
5. 失敗分類：
   - `test_failed`（邏輯/行為不符）
   - `timeout`（超過 5 分鐘）
   - `resource_exhausted`（CPU/Memory 限制）
   - `environment_error`（沙盒或工具層失敗）
6. 輸出 schema（不可省略）：
   - `overall_result`（pass/fail）
   - `tests[]`（name, status, duration_ms, logs）
   - `artifacts`（screenshot, logs, coverage summary）
   - `error_signature`
7. 行為規則：`test_failed` 可附帶 `retryable`/`non_retryable` 標記，供後端決策重試、回退、或進入人工仲裁。

### 1.4 具體實作票（Jira）

1. `VIB-001` 建立 Judge Agent 服務 API 與結果 schema。
2. `VIB-002` 建立 sandbox execution profile（Node 版本、resource limit、網路策略）。
3. `VIB-003` 建立驗收測試 runner template（lint/unit/e2e）。
4. `VIB-004` 串接 `VERIFYING -> COMPLETED/FAILED` 的後端 callback。

### 2) 判斷結果：`claim_task` 超時機制若用 Cron 會失效

`60 分鐘後自動回到 OPEN` 是對的商業邏輯，但不能靠 PostgreSQL cron polling 高併發掃描。
10 萬筆 `EXECUTING` 任務同時存在時，輪詢會變成壓力源，還有精準度與 race window 問題。

### 2.1 修正方針（Redis TTL + Pub/Sub + 補償機制）

超時主控改為 Redis key TTL 事件，PostgreSQL 當真實狀態來源。
`claim_task` 成功時，對應一個 key，例如：`vw:task:<task_id>:executing`，TTL 3600 秒。

### 2.2 風險控制（務必加上）

- Redis keyspace notifications 需明確在部署環境啟用。
- Pub/Sub 事件只能做第一道事件驅動，必須有補償掃描（reconciliation）避免事件遺失。
- rollback 流程必須是 transaction-safe、idempotent、可重入。
- 回退前要再次檢查 DB 真實狀態，避免 `VERIFYING` 剛完成被誤回到 OPEN。

### 2.3 狀態回滾順序（示例）

1. 收到 Redis key 過期事件。
2. 取得 `task_id` 對應 DB 行。
3. 原子交易更新：`EXECUTING -> OPEN` 且寫入 `error_reason=claim_timeout`。
4. 釋放 Stripe auth-hold。
5. 發出 `task_state_reverted` 事件並寫 audit log。

### 2.4 具體實作票（Jira）

1. `VIB-005` 建立 Redis TTL key 命名、TTL 時間、超時副作用對照表。
2. `VIB-006` 建立 `task:state_reaper` worker 監聽 expired 事件。
3. `VIB-007` 建立 DB 重掃補償任務（每 1 分鐘檢查 TTL 與 DB 狀態）。
4. `VIB-008` 建立 rollback API 的冪等與鎖機制（防重複回退）。

### 3) 判斷結果：供給側冷啟動會直接決定 MCP 成敗

這是最容易被忽略但最容易致命的面。
若初期 MCP 任務池為空，所有「留存、信任、經濟激勵」都會失效。

### 3.1 供給側修正方案

- 官方預設任務種子池：建議先放 100 筆，難度 1~5 逐步遞增，並強制 `expected_tests` 與 `reviewed=true`。
- GitHub Issue 自動化搬運：掃描公開庫 `help wanted` / `good first issue`，做授權與機敏資訊過濾後轉換 PRD。
- Design Partner 計畫：3~5 家合作方提供小額真實需求，作為早期任務質感基底。

### 3.2 供給側品質規範（防止「空城計」）

1. 任務描述欄位完整度必檢：title、success criteria、測試條件、預期輸出、限制條件。
2. 付款策略上限可控：可視難度分層（例如 $0.1~$5）並設置預算上限。
3. 違規與無效任務速率管控：低質任務需自動下架並提供修正提示。
4. 合作方來源任務附上來源授權與敏感資料審核結果。

### 3.3 具體實作票（Jira）

1. `VIB-009` 建立官方種子任務生成與上架 pipeline。
2. `VIB-010` 建立 issue scraper 與 PRD 轉換流程（含授權檢查與人工審核）。
3. `VIB-011` 建立合作方任務上架流程與質量欄位驗證。

### 4) 任務狀態機（正式版本，避免多人協作亂轉）

建議統一任務生命週期定義，前後端、MCP、Judge Agent 必遵守同一張規則表。

```text
OPEN
  ├─ claim_task -> EXECUTING
  ├─ cancel -> CANCELLED

EXECUTING
  ├─ submit_solution -> VERIFYING
  ├─ timeout -> OPEN (Redis TTL expired + state rollback)
  ├─ cancel -> CANCELLED
  ├─ agent_abandon -> FAILED

VERIFYING
  ├─ judge_pass (exit_code 0) -> COMPLETED
  ├─ judge_fail retryable -> FAILED
  ├─ judge_fail_non_retryable -> FAILED
  ├─ timeout > 5m -> FAILED

FAILED
  ├─ retry_policy = auto_open -> OPEN
  ├─ retry_policy = archive -> ARCHIVED
  ├─ dispute -> DISPUTED

COMPLETED
  ├─ dispute -> DISPUTED
  ├─ dispute_resolved -> ARCHIVED

CANCELLED -> ARCHIVED
DISPUTED -> resolution -> (OPEN / COMPLETED / ARCHIVED)
ARCHIVED -> (closed)
```

### 4.1 每一個轉換的責任與副作用

1. OPEN -> EXECUTING：MCP/後端，進行 agent 資格與 auth-hold。
2. EXECUTING -> OPEN：timeout worker，回退狀態、解除預授權、寫錯誤日誌。
3. EXECUTING -> VERIFYING：後端，打包提交結果、觸發 Judge 任務。
4. VERIFYING -> COMPLETED：Judge Agent，回傳 pass + 後端 capture 金流、發出 webhook。
5. VERIFYING -> FAILED：Judge Agent 或後端 watchdog，依失敗型別決定可重試策略。
6. FAILED/OPEN/COMPLETED 互轉前必進行事件記錄與 idempotency 保護。

### 4.2 交易一致性要求（不做的話會失敗）

1. `Stripe capture` 必要使用 idempotency key。
2. `state transition` 必須搭配 audit log 與事件總線，不得僅靠 cache 結果。
3. 所有回退與 capture 都是可重入操作並保證單次副作用執行。

### 5) 進場即用：可直接執行的驗收清單（Phase 0~Phase 1）

1. 實作 Judge Agent contract 並可回傳 pass/fail + 測試 log。
2. 使用 Redis TTL 作為主要 timeout 觸發機制並加 DB 補償。
3. 在 API 層實作 task state machine 轉換 guard 與錯誤碼。
4. 先行上線官方 100 筆種子任務並驗證 5 分鐘內有可接任務。
5. 全程寫 audit 與事件，讓任務回顧可回放且可排查。

完成後，`implementation_plan` 才能真正從策略文件進化為可執行工程藍圖。

## 2026-06-06 更新：第一階段目標可行性討論（導流與變現）

### 結論

目前討論後形成的方案，已將「第一階段目標」從概念層提升到**可開始驗證的工程層**：

- 可行：已補齊網際網路 AI Agent 導流的關鍵前置條件（`Judge` 可驗證、`task state machine` 可落地、`timeout` 可控、供給池不空白）。
- 還不足：目前仍未保證一定「立即變現」，而是先保證「可執行」、「有機會成交」、以及「可被量測」。
- 判斷：
  - 若只看架構健壯性：能導流的門檻已達成。
  - 若看第一階段實際收入：需要再加一層「導入效能 + 變現指標」才能判斷成功與否。

### 為什麼這一版「有機會」而不是「必勝」？

這個系統現在已不是玩具，但第一階段仍有三個現實條件會決定營收是否啟動：

- MCP 整合可用性：上架與文件、SDK/範例要足夠讓外部 Agent 能快速呼叫。
- 流量轉換效率：Agent 呼叫 `list_open_tasks` 到 `claim_task` 的轉換率。
- 交易化成功率：`claim -> submit_solution -> judge_pass -> capture` 的順利完成比率。

若這三項中任一項長期不足，技術再穩也不會自動變現。

### 第一階段（導流 + 變現）建議 KPI（可直接拆 Jira）

建議把第一階段做成四個觀察窗，且每個指標都要有「門檻值」與「回退條件」：

#### Day 1-3（上線驗證）

1. MCP 列表可見性：`vibework-monetization-mcp` 在主要目標入口成功回應率 ≥ 99%。
2. 任務可用性：`OPEN` 任務非空比率 100%，且平均查詢回傳時間 < 300ms。
3. 首位 Agent 體驗：至少 3 位外部測試 Agent 在 24 小時內完成一次 `claim_task`。

#### Day 4-7（完成第一輪交易）

1. 端到端交易數：至少 5 筆 `claim_task -> submit_solution`。
2. Judge 通關率：`VERIFYING` 到 `COMPLETED` 成功率 ≥ 60%。
3. 超時與回退可控：`OPEN` 回退率 ≤ 30%，且每筆皆有 `error_signature`。

#### Day 8-14（開始穩定化）

1. 每日活躍任務流量：`list_open_tasks` 調用日均 > 50。
2. 付費完成值：每日最少 1 筆成功 capture（或對應等值 token/credits 完成）
3. 供給端補位：官方種子任務池 30 天內補空率 = 0（不出現 10 分鐘以上「OPEN 全為 0」）。

#### Day 15-30（可決定繼續擴張）

1. 總完成任務數：日均完成任務 > 3。
2. 兌付穩定性：`capture` 成功率 ≥ 98%，refund + retry 率可被追蹤並低於 5%。
3. 初步經濟指標：每日毛利（淨平台手續費）連續 3 天為正，且下降率受控。
4. 客訴可控：`DISPUTED` 比率 < 5%，平均仲裁時長可量測。

### 立即可實作但不需改程式碼的文件補件

為了讓第一階段 KPI 可成立，建議在 `implementation_plan` 內新增以下非功能項目（文件化即刻可做）：

1. `Day 1` 入口文件：5 分鐘上手（install MCP、list、claim、submit、check）。
2. `Day 2` 成功案例：固定一個「可複製/可重複」的 1 美元按鈕任務示範。

## 2026-06-06 更新：v3.1 專業修正（持續討論版）

### A) 對「這些做法能否達成第一階段目標」的最終工程判斷

在目前這版裡，**導流與變現都已具備「可驗證可放量」的前提**，但要嚴格區分兩種成功：

1. 可交易（technical readiness）
- 需先成立：MCP 可調用、任務不為空、Judge 有明確 pass/fail、金流可捕獲與回滾。
- 這是「能做」：目前方案已經把這三條補齊。

2. 可盈利（economic readiness）
- 需再成立：`有效 capture` 連續發生、`refund+dispute` 受控、SLO 有閉環、外部需求有穩定輸入。
- 這是「能賺」：目前仍需第 2 段 GTM 觀測與仲裁機制穩住后才算成立。

因此答案是：
**這套方案能讓第一階段很快從 0 到 1，但要長時間「穩定變現」，必須先通過 Day 14 Gate、再逐步放大。**

### B) 「先做 A1 還是 A2」的建議（核心工程決策）

這是我建議給團隊的明確順序：

1. **A1（Reconciliation Ledger）優先啟動**
- 理由：任何金流動作如果沒有對帳邏輯，A2 的任何通過結果都可能掩蓋財務誤帳。
- 若先做 A2 再補 A1，後續會出現 capture 漏帳、退款無對齊、狀態飄移的高成本回溯。

2. **A2（Judge E2B）以「小型驗證路徑」並行預熱**
- 在 A1 的交易邊界骨架完成前，先做一個最小可回收（dry-run）版的 Judge 健康檢查。
- 目的是給團隊「可視化士氣」與時間估算，而不把所有測試結果當成正式可賺交易依據。

3. **Day 1-2 風險控制順序**
- 每次 `claim_task` 都必須同時觸發：
  - 狀態鎖定（FOR UPDATE）
  - auth-hold
  - reconciliation ledger 的預記錄（待 capture）
- 這樣當 `judge` 出錯時，仍可精準追責與回滾。

### C) 第二輪核心架構討論：交易路徑、外部擴散路徑、失敗邊界

#### 交易交易路徑（Mermaid）

```mermaid
flowchart LR
  A["Human Demand Source"] --> B["Scout / Builder / MCP Agent"]
  B --> C["MCP Client"]
  C --> D["list_open_tasks"]
  D --> E["claim_task"]
  E --> F["PostgreSQL: OPEN -> EXECUTING"]
  F --> G["Auth-Hold（Stripe）"]
  G --> H["submit_solution"]
  H --> I["Judge Sandbox (E2B)"]
  I -->|pass| J["VERIFYING -> COMPLETED"]
  I -->|fail retryable| K["FAILED_RETRYABLE"]
  I -->|fail non-retryable| L["FAILED"]
  J --> M["Capture + Ledger 記帳"]
  J --> N["Payout（Delay Settlement）"]
  K --> O{"retry_count < MAX_RETRIES?"}
  O -->|Yes| E
  O -->|No| P["mark failed"]
  K -->|timeout>5m| P
  L --> P
  F -->|TTL 3600s| Q["Redis Expired Event"]
  Q --> R["Rollback to OPEN + Release Auth"]
  M --> S["Dispute/Refund"]
  S --> F
  R -->|audit| T["Ops Log + Alerts"]
```

#### 任務狀態機（含失敗治理）

```mermaid
stateDiagram-v2
    [*] --> OPEN
    OPEN --> EXECUTING : claim_task
    OPEN --> CANCELLED : cancel/manual
    EXECUTING --> VERIFYING : submit_solution
    EXECUTING --> OPEN : timeout(3600s)+rollback
    EXECUTING --> FAILED : worker kill/unknown
    VERIFYING --> COMPLETED : judge pass（exit 0）
    VERIFYING --> FAILED_RETRYABLE : judge fail retryable
    VERIFYING --> FAILED : judge fail non-retryable / timeout
    FAILED_RETRYABLE --> EXECUTING : retry（if retry_count <= 3）
    FAILED_RETRYABLE --> ARCHIVED : retry exhausted
    FAILED --> ARCHIVED : policy decision
    COMPLETED --> DISPUTED : human dispute
    DISPUTED --> REFUND_PENDING : valid dispute
    REFUND_PENDING --> DISPUTED_RESOLVED : mediation
    DISPUTED_RESOLVED --> ARCHIVED : close
    COMPLETED --> PAYOUT_READY : settlement window
    PAYOUT_READY --> PAYOUT_SETTLED : payout success
```

### D) Scout Agent（需求拓散）是否要立即上線？建議：Phase 2 後再放大

我同意你「讓 AI 幫需求者拓散」的方向，這是正確增長邏輯，但建議**先做能力上限測試**再放大：

1. Phase 1 重點先抓：
- 金流對帳零漂移、Judge 通過率、退款/仲裁可控、供給池持續有任務。
2. 只有在 Day 14 Gate 通過後，才啟動少量 Scout beta。
3. Day 30 前只上限 3~5 家白名單 Scout；把 `conversion_health`、`spam_score`、`chargeback-to-task` 指標作為硬闖關。
4. 若沒有先修完退款與仲裁鏈路，先快樂做大量 scout 只會快速放大客服與爭議成本。

### E) v3.1 追加的可直接拆票清單（Phase 1 穩化）

1. **VIB-012**：補上「交易前提條件」頁（可在 PRD 附件）：
   - 任務可用性、MCP 文件版本、Judge fail code 對照、錯誤回報流程。
2. **VIB-013**：建立 `golden task suite`（3–5 個固定樣本）
   - 每次部署前自動跑，作為第一道線上品質閘道。
3. **VIB-014**：建立 `capture-ledger drift` 每 15 分鐘巡檢
   - 欄位包含 task_id、amount、ledger_status、stripe_status、state_age。
4. **VIB-015**：設計 `external signal feed` 實作模板
   - 每週三固定更新 MCP/Stripe/Redis/E2B 官方異動與回應計畫。
5. **VIB-016**：建 `Scout 分潤結算延遲模型` 與 `dispute hold`
   - Capture 72 小時或無紛爭條件滿足後才結算。

### F) 外部 AI 生態觀測與採納機制（持續化）

你要的「外部所有相關 AI 資訊」已納入制度化流程，建議補充為：

- 每週三固定 90 分鐘短會：
  1. MCP 安全與授權變更
  2. Stripe Webhook/idempotency 異動
  3. Redis keyspace event 行為修正
  4. E2B/容器安全 CVE
- 會議輸出固定成 1 頁：
  - 影響任務：`critical / major / minor`
  - 是否需要 hotfix 或 fallback image
  - 是否影響 Day 14 Gate 或 Day 30 Gate

若資訊落地，VibeWork 才是「有自我修復能力的系統」，而不是一次性文件專案。

## 2026-06-06 更新：紅黃綠告警、Kill Switch 與再保險機制（v3.2）

### 1) 第一階段變現能否成立？最終專業結論

我保守的結論是：**第一階段目標可成立的機率高，但前提是「交易可靠度」和「風控對齊」同時過門檻**。
這裡給一個可執行標準：
若 Day 1-14 已通過 `capture 成功率 + 供給不斷流 + 退款控制 + 仲裁時長` 其中任一條件，系統就不具備放量前提，即使有流量也不能再開新通道投放。

### 2) 失敗門檻轉為可操作的紅黃綠（Day 1-30）

以下為第一階段專用的 OODA 告警矩陣：

| 指標 | 綠燈 | 黃燈 | 紅燈 |
| --- | --- | --- | --- |
| 目標指標：`capture_success_rate_24h` | ≥ 92% | 85%~91% | < 85% |
| `judge_pass_rate_24h` | ≥ 78% | 68%~77% | < 68% |
| `refund_dispute_rate_7d` | < 3% | 3%~6% | > 6% |
| `avg_state_transition_latency`（OPEN→COMPLETED） | < 180s | 180s~420s | > 420s |
| `open_task_stockout_ratio`（任務池空比例） | < 5% | 5%~15% | > 15% |

### 3) 紅燈 Kill Switch 決策（實作在運維層）

1. `capture_success_rate_24h < 85%` 持續 2 個檢核視窗（60 分鐘）則啟動 `incident_mode`，停用 MCP `claim_task`。
2. `refund_dispute_rate_7d > 6%` 且 `judge_pass_rate_24h < 68%` 同時成立時，僅保留白名單 Scout/Builder，暫停外部自助通道。
3. `open_task_stockout_ratio > 15%` 持續 30 分鐘以上，啟用 `open_task_fallback`（官方種子任務補位）與每日補單。
4. `state_revert_lag_p99 > 90s`（Redis+DB 回退延遲）超過兩個鐘點檢查，立即切斷 Redis 事件接入，改用 DB reaper 補償。
5. `stripe_webhook_delay_p95 > 120m` 持續 2 小時，暫停新任務 capture，僅保留人工仲裁通道，避免重複結算風險。

### 4) 與外部參考規範對齊的專業補強（已校準）

1. MCP 安全邊界：`Authorization: Bearer <token>` 必須出現在每次 MCP HTTP 請求，且每個 token 需驗證 aud。這是目前 MCP 規格文件明確要求。
2. Redis Keyspace：過期事件為非嚴格實時，官方文件明確指出 expired 事件可能延遲，所以「`keyevent` 觸發」只能作為第一道訊號，必須搭配補償 Job 兜底。
3. Stripe 重試：官方機制會在 3 天內重試 Webhook，且手動重送不會取消後續自動重試；故 webhook 任務必具備冪等鍵與重放去重。
4. Stripe Idempotency：同一 idempotency key 會回放首次回應（含失敗結果），所以 capture/refund 流程一定要設計「任務 ID + amount + phase」的穩定 key，杜絕重複出帳或重複退款。

### 5) 先天風險與我建議的對策（不是可選）

1. 首輪 Scout 不做大流量，先 3~5 家白名單，並以 `conversion_health` 作為硬性過濾閾值。
2. 所有 `FAILED_RETRYABLE` 的錯誤 signature 要記錄 `judge_stack_trace_hash`，並作為 Builder 與 Scout 的質量分數模型輸入。
3. `TaskState` 的每次變更都要同時寫入 `ledger` 與 `audit`，否則把該事件列為 non-compliant，無法進入下一輪 release。
4. `list_open_tasks` 率低於 99% 時，先修 MCP 可用性再談 KPI，不要先調整 KPI。

### 6) 新增圖：紅黃綠閉環決策

```mermaid
flowchart TD
  M["每 15 分鐘監控"]
  A["compute gauges"]
  B{"capture>=85%?"}
  C{"judge>=68%?"}
  D{"dispute<=6%?"}
  E{"stockout<=15%?"}
  F["Green: continue"]
  G["Yellow: incident_mode=watch,限流/降速"]
  H["Red: claim_task freeze + incident playbook"]

  M --> A --> B
  B -->|No| G
  B -->|Yes| C
  C -->|No| G
  C -->|Yes| D
  D -->|No| H
  D -->|Yes| E
  E -->|No| G
  E -->|Yes| F

  G -->|3 windows連續| H
```

### 7) 下一步：要不要直接把紅黃綠矩陣與 Kill Switch 變成「第一階段上線 SOP」

我建議下一輪直接新增一章「SOP：Incident Triage（按鈕式流程）」並將「紅黃綠門檻、停機腳本、回復條件」做成一頁清單，這樣第一輪值班可在 3 分鐘內做對應決策，不靠口頭判斷。
3. `Day 3` 監控看板：上述 KPI 每日更新，超過警戒值啟動對應 playbook。
4. `Day 5` FAQ 與錯誤訊息規範：所有 agent 端錯誤需有可行修正提示（避免流失）。

### 簡結

這份更新版文件已可支持第一階段目標判斷：
**不是只談「可不可以做到」，而是談「做到後何時可證明正在變現」。**
下一步的判斷重點是：按上面 KPI，若連續 14～30 天不達標，要先回頭修 `GTM`（任務入口、文件、示例、支付完成率）而不是先擴大技術堆疊規模。

## 架構圖與流程圖（Mermaid）

### 1. 任務狀態機總覽

```mermaid
stateDiagram-v2
    [*] --> OPEN
    OPEN --> EXECUTING : claim_task\n(auth-hold + Redis TTL)
    OPEN --> CANCELLED : client_cancel
    EXECUTING --> VERIFYING : submit_solution
    EXECUTING --> OPEN : timeout_rollback\nrelease auth-hold
    EXECUTING --> CANCELLED : agent_cancel
    EXECUTING --> FAILED : agent_abandon
    VERIFYING --> COMPLETED : judge_exit_code_0
    VERIFYING --> FAILED_RETRYABLE : judge_fail_retryable\nor timeout <= 5m
    VERIFYING --> FAILED : judge_fail_non_retryable
    FAILED --> OPEN : auto_open_policy
    FAILED --> ARCHIVED : archive_policy
    FAILED --> DISPUTED : dispute
    COMPLETED --> DISPUTED : open_dispute
    DISPUTED --> OPEN : dispute_resolved_reopen
    DISPUTED --> COMPLETED : dispute_resolved_keep
    DISPUTED --> ARCHIVED : dispute_resolved_archive
    COMPLETED --> ARCHIVED : settlement_finalize
    CANCELLED --> ARCHIVED : cleanup_done
```

### 2. Judge Agent 端到端驗收流程

```mermaid
flowchart LR
    A[submit_solution] --> B[Persist submission + state -> VERIFYING]
    B --> C[L1: Static Check\nlint / AST / security]
    C -->|pass| D[E2B Sandbox]
    C -->|fail| E[FAILED_RETRYABLE or FAILED]
    D --> F[Install deps + run vitest]
    F -->|pass| G[Run Playwright e2e]
    F -->|fail| H[FAILED_RETRYABLE]
    G -->|pass| I[Judge report pass]
    G -->|fail| J[FAILED]
    I --> K[API callback to core]
    J --> K
    H --> K
    K --> L{if overall_result pass}
    L -->|yes| M[State -> COMPLETED<br/>Stripe Capture / Webhook / Audit]
    L -->|no| N[State -> FAILED<br/>release auth-hold]
```

### 3. Redis TTL 超時與 DB 補償防護

```mermaid
sequenceDiagram
    autonumber
    participant API as Task API
    participant DB as PostgreSQL (truth)
    participant Redis as Redis TTL
    participant W as Reaper Worker
    participant P as Stripe
    participant A as Audit

    API->>DB: UPDATE task status=EXECUTING, expires_at=now+3600
    API->>Redis: SET key(task:{id}:executing) EX 3600
    Redis-->>W: __keyevent__:expired
    W->>DB: SELECT ... FOR UPDATE
    alt task still EXECUTING
        W->>DB: UPDATE task SET status=OPEN, error='claim_timeout'
        W->>P: release_auth_hold
        W->>A: write task_state_reverted
    else state already changed
        W->>A: write stale_timeout_ignored
    end
    Note right of W: 每分鐘補償 job\n掃描 expires_at < now 且仍 EXECUTING
```

### 4. 供給側冷啟動導流閉環

```mermaid
flowchart TD
    S[供給源：官方種子池] --> L[list_open_tasks 可視]
    I[Issue Scraper] -->|授權審查 + PRD 轉換| L
    D[Design Partner] -->|真實需求上架 + 付費限制| L
    L --> C[MCP list_open_tasks]
    C --> X[Agent claim_task]
    X --> U[submit_solution]
    U --> J[Judge Agent]
    J -->|PASS| P[Stripe Capture / payout]
    J -->|FAIL| F[error_signature + 重試建議]
    P --> R[成功紀錄 + 成功案例]
    F --> R
    R --> G[新增信任與導流]
```

### 5. 第一階段指標儀表板（實務監控）

```mermaid
flowchart LR
    subgraph 流量
      A1[MCP list_open_tasks QPS]
      A2[claim 轉換率]
      A3[任務供給覆蓋率]
    end
    subgraph 交付
      B1[submit_solution 數]
      B2[judge pass rate]
      B3[完成 capture 數]
    end
    subgraph 經濟
      C1[日均淨手續費]
      C2[refund/refute 率]
      C3[DISPUTED 解決時長]
    end
    A1 --> A2 --> B1 --> B2 --> B3 --> C1
    A3 --> B1
    C2 --> C1
    C3 --> C1
```

## Phase 1 vs Phase 3：Scout Agent（AI 業務代理）機制的落地順序（建議）

你問得非常到位：這個想法可行，而且方向正確，但**不應把它前置到第一階段主幹線**。

核心原因是：
- 現階段第一目標是證明「AI 任務交易能穩定完成並能變現」。
- Scout Agent 會直接放大需求供給，卻同時放大詐騙、垃圾訊息與信任風險。
- 如果底層交易鏈尚未穩定，先加 Scout 會把問題放大到無法控制的程度。

因此建議採「分層放行」策略：

1. `Phase 1`：先把 `GTM 流量 + 核心交易閉環 + KPI` 做穩（只接收人類主動上傳與官方 Seed）。
2. `Phase 2`：開放 `Scout API` 的最小可行版本（MVP 代理），但只允許**白名單/邀請名單** Agent。
3. `Phase 3`：在 `Phase 1+2` 關鍵指標穩定時，全面啟用 `M2M 轉介分潤協定`，並逐步放量。

### 先做哪條線？建議你現在直接收斂：

- 先立刻補清 Phase 1 的「GTM 與變現門檻」。
- 同時在文件中預留 Scout 機制為 `Phase 3 企劃項目`，保留可追縱擴展路徑。

### Scout Agent 機制（Phase 3 Draft）— 建議加入到 `implementation_plan.md`

#### 1) 目標邏輯

- 讓非開發型 Agent 也能在網際網路貼文/論壇中識別開發需求，轉化為可接任務。
- 以 `affiliate split` 激勵代理：
  - 平台抽成：15%
  - Scout Agent：10%（業務引流獎）
  - Builder Agent：75%（開發交付）
- 完整銷售流程由 API 驅動，形成 M2M 聯盟式成長。

#### 2) 核心流程（Scout API）

1. `POST /api/v1/scout/draft_task`：Scout 依據外部需求輸入草擬 PRD、建立草案與追蹤碼。
2. 平台回傳 `payment_link`（含 `affiliate_id`、`task_seed`、`ttl`）。
3. Scout 於外部通道回覆推廣，但只能使用受控模板。
4. 人類付款並完成 auth-hold 後，任務進入正式 `OPEN`。
5. Builder Agent 接單後走完整個 `claim -> submit -> judge -> capture` 流程。
6. 付款結算時按 `task_id` 的分潤規則自動拆帳。

#### 3) Scout 風險與治理（先放到 `Phase 3`）

- 垃圾訊息防護
  - 新 Scout 每日訊息上限、頻率上限。
  - 轉換率健康度（點擊付款 / 發出邀約）過低者暫停 API 權限。
  - 一票否決/封鎖機制（平臺可關停）。
- 品質連鎖保證
  - Scout 只能接力到 `judge pass` 能穩定通過且違規率低的 Builder。
  - 若 Scout 來源任務高退款 / 高爭議，逐步降低其分潤係數。
- 反濫用與法規
  - 外部貼文自動化需保留「來源上下文」與「最小可讀性聲明」。
  - 同意書與隱私聲明欄位必填，避免平臺行銷濫用爭議。

#### 4) Phase 1 必要的先行 KPI（收斂至此）

如果你要把第一階段判定寫死，建議改為：

- 首週至少完成 `10` 筆有效交易（`claim -> judge_pass -> capture`）。
- `capture` 到帳成功率穩定到 24 小時 24 筆樣本中至少 95% 或以上。
- `judge_pass` + `完成度` 連續 5 天達標，不得連續兩日低於 60%。
- `DISPUTED` 比率低於 5%。
- `list_open_tasks` 端到端平均延遲 < 300ms，錯誤率 < 1%。

以上未達標，不建議立刻展開 Scout 全量化，先做交易鏈修正與內容示範補強。

### 5) Scout 機制流程圖（納入 Phase 3）

```mermaid
flowchart TD
    A[Scout Agent 發現需求] --> B[/POST /api/v1/scout/draft_task/]
    B --> C{PRD 風險規則}
    C -->|Pass| D[產生 payment_link + affiliate_token]
    C -->|Fail| E[回報草案修正建議]
    D --> F[外部通道推廣（受控模板）]
    F --> G{人類點擊/付款}
    G -->|No| H[轉換率記錄 + 觸發 spam guard]
    G -->|Yes| I[建立任務 OPEN]
    I --> J[Builder claim_task]
    J --> K[submit_solution]
    K --> L[Judge Agent]
    L -->|Pass| M[Platform Capture + 分潤 settlement]
    L -->|Fail| N[release_auth_hold + 重試建議]
    M --> O[更新 affiliate_score / 佣金池]
    N --> P[Scout 資質降權評估]
```

## 專業補充：AI 幫助拓散需求者這件事，怎麼做才是工程上正確的

你這個方向非常正確，而且是能把 VibeWork 從「被動接單平台」推向「自我成長網路」的核心路徑。
我的建議是：**先把它當成一個獨立「Demand Acquisition Plane（需求開發平面）」來做，而不是直接把每個 Agent 當作宣傳器。**

### 我建議的實作策略（四步走）

1. **先定義需求信號，不先定義推廣渠道**
   以「需求片語」取代「平台宣傳」：先學會抓到 `需求文本 -> PRD 草稿 -> 付款鏈接` 的穩定轉換。
   可行的輸入源先是：Reddit/GitHub Issues/Discord 討論中的明確開發委託訊號，不是所有貼文。

2. **把 Scout 當成受控 API 工具，而非自由發言人**
   每個 Scout 只能透過你提供的 `approved template + 最小欄位` 回應。
   例如：必填欄位包含 `需求摘要 / 交付範圍 / 風險免責 / 點擊連結`，避免無差別 spam。

3. **先做「意向分數」再做「佣金」**
   不是每次建立 draft 都給獎金，而是採 `lead_intent_score`。
   只有當人類完成付款到 capture 後，且在爭議期過後，Scout 才結算。

4. **把收益分潤和風險分配綁在同一張計算表**
   低質量 Scout 不只少分潤，而是扣減其 `campaign budget`，必要時自動降權或暫停，避免平台風險外溢到品牌。

### 你這套模式的核心判斷

- **可行性**：高。技術上成立，且可成為 Phase 3 的主成長引擎。
- **風險**：高。若不加控制，先天會造成 spam、詐騙、品牌風險與支付退款風暴。
- **優先順序**：第一階段不做全量 Scout 開放，先做 `Phase 1交易穩定` 與 `Phase 2白名單試行`。

### 我建議你現在採納的決策（最務實版本）

1. 現階段：把 `GTM/導流` 目標只聚焦在 `官方 seed + 社群口碑 + 直接邀請`。
2. 同步在文件中建立 `Scout MVP`，但上線條件設為：
   - `capture` 稳定率 95%+
   - `judge_pass` 穩定到 60%+ 且持續 14 日
   - `DISPUTED` 低於 5%
3. 等這三條穩住後，先啟動 3~5 家白名單 Scout（內部夥伴、測試夥伴）。
4. 只在白名單中測完 `conversion_health`、`spam_rate`、`refund_rate`，再改為開放邀請制。
5. 最後才進入公開募兵式擴散，並把風險參數（訊息上限、回報率門檻、退潮機制）打在平台配置檔供隨時調整。

### 建議寫進 API 參數（Phase 3）作為你下一輪設計原型

1. `POST /api/v1/scout/draft_task`
2. `POST /api/v1/scout/score_update`（回報點擊、付款、退單）
3. `GET /api/v1/scout/attribution/:task_id`（可追溯 attribution chain）
4. `GET /api/v1/scout/reputation`（可降權/暫停/封鎖）
5. `POST /api/v1/scout/settle`（capture 後的延遲分潤入帳）

### 為什麼我建議「先穩住交易，再做病毒式成長」？

- 交易可穩定，才能承受外部流量；
- 外部流量來了，代表需求變多，`judge` 會暴露你最脆弱的工程瓶頸；
- 瓶頸修過，再放大供給才會像複利，不是放大失敗。

這是我對你想法的專業結論：
**方向正確，落地順序要保守一點，但不能保守太久。Phase 1 先把品質鏈變硬，Phase 2/3 再把增長鏈打開。**

## 專案追加章節：Judge Agent 的 E2B 隔離、安全與快取策略（Phase 1b 先行）

先把這段先落實到可實作規格是關鍵。否則後續 Scout 擴張會放大風險。

### A. 網路隔離設計（Network Isolation）

1. 預設 `Deny All`（預設封鎖所有外部連線）。
2. 僅對必要依賴開啟短暫 allowlist：
   - `npm registry / package manager`：僅限 job boot 階段依賴下載
   - 內部 metadata service：僅供提交結果上報
3. 禁止長連線與敏感埠：
   - 禁止 `bind/listen`（避免任務建立反向網路服務）
   - 禁止 `0.0.0.0` 對外暴露端口
4. 時間與資源上限（單次 run）：
   - CPU 時間：例如 2 vCPU / max 30 秒（L1）
   - Memory：固定上限（例如 1GB）
   - 檔案系統：只允許 256MB writable 層
   - 磁碟 I/O：限制高速寫入配額，防止惡意大量寫碟
5. 行為限制：
   - 禁止 `curl/wget/ssh/ssh-keyscan`
   - 禁止超過 N 行為的 process spawn（例如 > 20）
   - 禁止超過 1 次 `git` 指令，且只允許 clone 指定白名單

### B. 快取策略（可降低驗收成本與延遲）

1. `Dependency Cache`（必做）
   - 快取 key 以 `packageManager + lockfile hash + node_version` 做分桶
   - 失敗時降級為「無快取重跑」，避免阻塞測試
2. `Test Artifact Cache`
   - 錯誤案例快取 `error_signature` 與 `repro steps`
   - 相同 `task_id + testsuite hash` 的失敗可快速回傳（需加 `max-age`）
3. `Runner Image Cache`
   - E2B 基底映像預載常用工具（node + git + playwright）
4. `Warm Pool`
   - 建立最小預熱池（例如 3~5 個 container）
   - 在高峰期用 queue depth 自動擴容，低谷時回收，避免啟動風險
5. `成本護欄`
   - 每任務 `judge_budget_ms` 上限
   - 每日每租戶 `max judge runs`，超量觸發「降配策略」或延後排程

### C. 回傳失敗分類（Judge 結果標準化）

將所有錯誤壓成可機讀欄位，避免人工判斷模糊。

- `E2B_TIMEOUT`
- `E2B_RESOURCE_EXHAUSTED`
- `TEST_FAIL`（含 `test_name`, `assertion`, `diff snippet`）
- `LINT_FAIL`
- `NETWORK_DENIED`
- `ENV_MISCONFIG`
- `SANDBOX_CRASH`

### D. 建議 API 契約（最小）

`POST /api/v1/judge/run`

請求欄位：
- `task_id`（必填）
- `submission_id`（必填）
- `runtime_profile`（L1/L2）
- `validation_mode`（lint/unit/e2e）

回應欄位：
- `overall_result`: pass / fail / timeout
- `attempt_id`（冪等追蹤）
- `tests[]`: [{ name, status, duration_ms, logs }]
- `artifacts`: { logs_url, screenshot_url, diff_url }
- `error_signature`
- `resource_usage`: {cpu_ms, mem_peak_mb, io_bytes}

### E. 快速結論（Phase 1b）

- 先做「隔離 + 快取 + 失敗分類」三件事；
- 再做「任務內容多樣化」；
- 先穩住 `judge pass` 的一致性，再談大量任務種子與 Scout 擴張。

## Day 1-14 最小可交付執行順序（含責任人 / 驗收條件）

以下依 `Day` 導向，不是做全功能版本，而是先做可證明「可變現」的最小閉環。

### Day 1-2：基礎可見性與第一批任務

1. 建立 `vibework-monetization-mcp` v1 上線（Owner：Backend）
2. 實作 `list_open_tasks` 可回傳 `OPEN` 任務（Owner：Backend）
3. 建立官方種子任務 20 筆（Owner：PM + Admin）
4. 驗收條件：
   - 端點回應率 ≥ 99%
   - 任務回傳延遲 < 300ms

### Day 3-5：交易關鍵路徑打通

1. 實作 `claim_task`（含 DB 鎖 + Stripe Auth-Hold）（Owner：Backend）
2. 實作 `submit_solution` 進入 `VERIFYING`（Owner：Backend）
3. 實作 Judge L1/L2 最小回路（Owner：AI Infra）
4. 驗收條件：
   - 至少 3 位外部 Agent 完成 claim
   - 每筆任務皆有可讀錯誤回報（fail 時）

### Day 6-10：支付與回復流程強化

1. 完成 `capture/release` 冪等機制（Owner：Backend + Finance）
2. 實作 Redis TTL timeout + worker + DB 補償 job（Owner：Backend）
3. 實作 audit log 每次狀態轉換（Owner：Backend）
4. 驗收條件：
   - Open -> Executing -> Verify -> Completed/Failed 全流程可復現
   - timeout rollback 正常解除 auth-hold 且不重複執行

### Day 11-14：KPI 仪表與修正節拍

1. 上線 KPI dashboard（Owner：Data）
2. 開通支援流程（Owner：SRE + PM）
3. 啟動 `replaybook`（API 變慢、Judge 失敗、支付失敗）
4. 驗收條件：
   - 首週有效交易 10 筆達標（或可證明阻塞與修正）
   - capture 成功率與 dispute 率在可觀測阈值內

### Day 14 Gate（是否進入 Phase 2）

- 達標才進入下一步：
  - 首週 `claim -> judge_pass -> capture` ≥ 10 筆
  - capture 成功率 >= 95%
  - dispute_rate < 5%
  - list_open_tasks 錯誤率 < 1%
- 未達標不解鎖 Scout 全量化，先做：
  - 沙盒資源 profile 調整
  - PRD 內容難度下修
  - seed 任務描述補強

## Milestone 執行優先順序（A1 vs A2）— 專業判斷

你問到關鍵的進度抉擇：先做 `A1 Reconciliation Ledger` 還是先做 `A2 Judge E2B 連線`？

我給你的是一個可落地且風險可控的結論：

### 最佳順序：`A1 與 A2 並行啟動，但 A1 先上 `最短安全鍊` 橫切

1. **第一先行：A1「對帳與交易真相」的資料模型先落定**
   - 原因 1：所有金流副作用必須有可追溯「原子真相」；沒有 ledger，任何 capture/refund 回滾都會變難。
   - 原因 2：Redis timeout 與 webhook 失敗、重試都是會放大「雙寫漂移」風險的，ledger 先有可鎖定欄位可降險。
   - 原因 3：你已確定平台核心目標是「先固化交易」，所以要先把 `可對帳` 放在前端，不能先放在 demo 效果前。

2. **同時啟動 A2 的最小連線試跑**
   - 先驗證 `E2B sandbox warm start -> 一次性 run -> 回報 schema` 可跑通。
   - 但不要把 A2 跟 production 實際任務強耦合，否則會因為付款系統尚未穩而掩蓋測試錯誤。

3. **Day 1-3 的建議節拍（實務）**
   - D1：建立 ledger schema + transaction boundary 草案（不必 full UI）
   - D2：Ledger write path 接上 `claim/auth-hold`（只記錄、不做複雜重試）
   - D3：A2 先用「三筆固定示例任務」驗證回報格式與錯誤字串解析
   - D4：同步開啟 Redis timeout event fallback 監聽 + DB 補償 job 雛形
   - D5：把 `manual replay` 指令列出（發生對帳漂移時可回放）

### 為什麼不是「先做 A2 再 A1」？

- A2 先行只會產生漂亮訊號（有回傳、有畫面），但若缺 `ledger`，你無法保證 capture/refund 在高併發/重試下沒有重複入帳。
- 一旦有人看到 capture 成功但實際對帳出現 drift，整個信任鏈會瞬間斷裂，反而比「慢」更致命。
- 金流可追溯性是你產品能否跨 14-30 天活著的關鍵，不是 MVP 加分項。

### 參考外部技術訊號（加強你的決策信心）

- Redis keyspace notifications 的 `expired` 事件不是絕對即時 guarantee，需保留 DB 補償掃描（官方文件已明確註明）。
- Stripe 對 `Idempotency-Key` 的官方行為是「同一 key 不會重複生效」，建議把 webhook side effect 也做 event-id 去重；金流重試才不會炸帳。
- MCP 規格的安全文件明確將授權/認證作為核心，尤其要注意混淆代理、授權錯誤與 scope/Consent 錯配等攻擊路徑，MCP 層也要先做最小權限授權。

### 專案決議（可直接用）

- 里程碑名稱：`A1-Ledger Safe Bootstrap`（Day 1-2）
- 里程碑名稱：`A2-Runner Connectivity`（Day 2-4）
- Gate 條件：`A1` 寫入成功且能回滾任務狀態，不需等到所有測試通過才啟動 A2，但 A2 不能在未接上 `ledger transaction boundary` 前進入預購金流。

## 追加：Reconciliation Ledger 風險控管規格（更可執行版本）

若你接受上面順序，以下是可直接寫卡的補充規則：

1. `stripe_ledger` 基本欄位（最少）
   - `id`（PK）
   - `task_id`, `agent_id`, `human_client_id`
   - `idempotency_key`（唯一）
   - `phase`（auth_hold / capture / release / refund / payout / dispute）
   - `stripe_object_id`（payment_intent_id / charge_id / refund_id）
   - `request_payload_hash`
   - `response_status`
   - `http_status`
   - `attempt`
   - `source`（api / webhook / manual_replay）
   - `created_at` / `updated_at`

2. ledger transaction requirement（交易守則）
   - 對任務狀態轉換與 `ledger` 寫入必須同一個 DB transaction；任何失敗都回滾狀態，不可 partial success。
   - 任何 webhook 重放都不能改變 `ledger` 的既有狀態機結果，除非是「可重放對帳修正」類別。
   - webhook 處理路徑與 API 重試路徑都要走同一張 `stripe_ledger`，以便對帳。

3. drift 偵測與告警
   - 每 1 分鐘比對 `ledger` 與 task 狀態：
     - `capture` 已成功但 task 仍非 COMPLETED
     - `release` 已成功但任務仍處於 EXECUTING
     - 同一 task 同時間出現互斥副作用（capture + release + refund）
   - 一旦發現 drift，進入 `incident_mode=true`，暫停 `claim_task` 新進任務。

4. 人工回補（runbook 入口）
   - 提供 `ledger reconcile --task-id --range` 指令清單：
     - 查重放記錄
     - 重新查 Stripe object 狀態
     - 產生 `correction_journal` 供審核

這樣做是因為：你不是要「先出成果」，你是要讓第一波外部 Agent 在你系統裡每一次動作都可以被你們會計、法務、客服、SRE 同時信任。

## Day 15-30 第二梯次執行順序（穩定化 + 控制擴張）

第一輪交易穩定後，Day 15-30 不追求新酷功能，而是做兩件事：
1) 讓系統在 10 倍壓力下還是可預期，2) 讓需求散播能力「可控」開啟。

### Day 15-21（Phase 2）：供給與媒合能力加強

1. `Task discovery` 欄位擴充（難度、技能、預估時長）
   - Owner：API/Backend
   - 验收：list_open_tasks 支援多條件過濾並維持 P95 < 300ms

2. `pgvector` 最小語意媒合 PoC
   - Owner：AI Infra
   - 驗收：單任務可建議 1~3 個候選 Builder，延遲 < 2 秒

3. `Reputation` v1 與節流落地
   - Owner：Backend
   - 驗收：新 Agent 同時 claim 限制 + 連續失敗 3 次 24 小時降權

4. 官方種子池補強（每天補齊，避免 OPEN 空白）
   - Owner：PM/Admin
   - 驗收：7 日連續 OPEN 非空比例 >= 99%

### Day 22-26（Phase 2）：金流與運維收斂

1. `dispute/refund` 進一步與 `reconciliation ledger` 對齊
   - Owner：Finance + Backend
   - 驗收：refund 事件可回溯到事件 id 與任務/agent 全鏈路

2. `FAILED_RETRYABLE` 自動重排與節流
   - Owner：AI Infra
   - 驗收：類型化錯誤可避免無限重試，平均重試率下降 > 30%

3. `judge budget` 成本看板
   - Owner：Data
   - 驗收：可監控錯誤類型、平均 runtime、容器啟動成本

4. 高併發重試壓測
   - Owner：SRE
   - 驗收：1k claim + 500 submit 並發下無 deadlock、無狀態漂移

### Day 27-30（Phase 3 鎖定門檻與白名單啟動）

1. `Scout 白名單`（5 家）內部驗證
   - Owner：Growth + API
   - 驗收：每家完成至少 3 次 `draft -> payment -> capture` 閉環

2. `Scout 風控` 啟動
   - Owner：Security + Backend
   - 驗收：轉換率健康度、spam、回報率告警規則生效

3. 商業可見指標 v1
   - Owner：Finance
   - 驗收：日結與平台抽成入帳可對帳、可匯出

## Scout 解鎖 Playbook（白名單到公開擴張）

### 一次性解鎖門檻（必須同時達成）

- Day 1-14 的核心 KPI 達標：
  - `claim -> judge_pass -> capture` ≥ 10 筆
  - capture 成功率 >= 95%
  - dispute_rate < 5%
  - reconciliation drift = 0 或已封存且可回補
- 7 日穩定性：
  - `judge pass` 非 timeout 平均 >= 70%
  - `list_open_tasks` 錯誤率 < 1%

### 斷點回退條件（未達標即停）

- `capture` 低於 95%：停發放新 Scout 任務，先修金流與 webhook 回放
- `dispute` 突升：自動降權高風險 Builder 與 Scout
- `judge pass` 低於 60%：維持白名單，禁止新增 Scout
- `incident_mode` 拉高：停用 Scout，保留既有任務人工處理

### 回退後恢復門檻

- 修正後 3 個連續觀測窗（每窗 24 小時）內：
  - capture >= 95%
  - dispute < 5%
  - drift = 0
- 通過後：擴展 Scout 配額 2 倍/週，並保留每週復測

### 風險分類

- GREEN：公開散播前可以放量，但保留最小速率上限
- AMBER：只維持白名單，停用新邀請與外部渠道
- RED：全面停用 Scout，回到「Judge + 金流 + 對帳」閉環修復

## 追加建議（Phase 2/3 的三項真實增長指標）

除了交易成功率，這三項是防止「有量沒質」的關鍵：

- `conversion_health` = 成功付款 / 產生連結
- `post_capture_quality` = 24 小時內未退款/未提早 dispute 比率
- `incident MTTR` = 金流或 judge 影響事件平均回復時間（目標 < 30 分鐘）

任一指標連續 3 天異常，直接啟動：
- 停 Scout 擴張
- 緊縮 `judge` 併發與超時門檻
- 提高 `replay + reconciliation` 頻率

## Day 30-60：小流量公域拓展與成長機制（可控擴張）

### 目標

- 從白名單小規模擴張成「外部可穩定接觸」的第一層流量入口
- 不追求爆量，追求單位任務的成功率與回款品質不退化
- 建立可持續、可回溯的營收與運營儀表

### Day 30-40（Phase 3.1）

1. `Scout API` 白名單從 5 家增至 10~15 家
   - Owner：Growth + Security
   - 驗收：全部 Scout 流量都走白名單授權與速率門檻

2. `API Usage Quota` 動態化（按 `conversion_health` 調整）
   - Owner：Backend
   - 驗收：低轉換 Scout 自動降額，無人工介入

3. `Attribution` 串接完成（task -> scout -> builder -> payment）
   - Owner：Backend + Data
   - 驗收：任務可追溯到 3 層 ID 並可重建完整事件鏈

4. `Support / FAQ` 從單語意提升為半自動回覆
   - Owner：PM + Support
   - 驗收：失敗常見錯誤回覆時間 ≤ 5 分鐘

### Day 41-50（Phase 3.2）

1. `多來源任務輸入`：合作方 API + 手動上架並行
   - Owner：API + PM
   - 驗收：不同來源任務都可進入同一套狀態機

2. `Reputation` 加權模型更新
   - Owner：AI Infra + Backend
   - 驗收：成功率高的 Agent 推薦權重上浮，異常行為降權

3. `支付對帳` 每日快照 + 每小時告警
   - Owner：Finance + SRE
   - 驗收：每日對帳報表與警示可自動化發送

4. `金流風險測試`（refund burst / webhook delay scenario）
   - Owner：SRE
   - 驗收：可在 15 分鐘內完成 `incident_mode` 啟停

### Day 51-60（Phase 3.3）

1. `Scout 外部品牌內容` A/B 測試（3 條模板）
   - Owner：Growth
   - 驗收：conversion_health 不低於白名單期中值

2. `多區域監控`（核心服務與外部通道）
   - Owner：SRE
   - 驗收：關鍵告警跨 24h 保持可定位與可回放

3. `財務保底` 指標穩定化
   - Owner：Finance
   - 驗收：`platform_take >= 預算底線`、`post_capture_quality` 無明顯回落

4. `商業決策會議節點`（是否進入大規模公開）
   - Owner：PM + Leadership
   - 驗收：形成 go/no-go 決議與更新的 Gate 條件

## 30-60 Replaybook（SRE + 運營一頁式手冊）

### Playbook A：支付異常（capture/refund 偏差）

**觸發條件**：
- capture 成功率 < 95%（1 小時）或 webhook `event_id` 連續重複異常

**處置順序**：
1. 啟動 `incident_mode`（暫停新任務 claim）
2. 鎖定所有 `retryable capture` API 呼叫
3. 查 `reconciliation drift`：task 狀態 vs `stripe_ledger`
4. 對 `pending webhook` 重放，查 `Stripe event id` 是否可重試
5. 對有 `source=api` 的同日異常請求加 `idempotency` 標記並回填
6. 修正後每 5 分鐘回報一次狀態；問題解除後恢復 claim

### Playbook B：Judge 失效（大量 TEST_FAIL / TIMEOUT）

**觸發條件**：
- `FAILED_RETRYABLE` 比例 > 30%（15 分鐘）或平均 judge 延遲 > 2 倍基線

**處置順序**：
1. 限制 `judge_concurrency`，啟動 `cooldown queue`
2. 將 `timeout` 任務移入人工排查清單，不允許無限重試
3. 檢查 `error_signature` 熱點是否為測試環境退化（套件版本、快取污染）
4. 啟用 `runner fallback profile`（降速 + 重跑資源較高配置）
5. 通知 Builder 提交者：提供具體 `error_signature` 修正建議

### Playbook C：Scout 異常（spamming / conversion 失效）

**觸發條件**：
- conversion_health 連續 2 天下滑 30% 以上
- spam_score 過高（外部回報或 blocked ratio 上升）

**處置順序**：
1. 一鍵切換 `scout_scoped_mode=off`（暫停新轉介）
2. 將高風險 scout 列入 `quarantine`
3. 降低所有 scout daily API 配額 50%
4. 啟動邀請審核：逐一人工複核 template 與 payment link
5. 異常恢復後，逐步恢復配額（按比例）

### Playbook D：狀態機異常（超時/重複回退）

**觸發條件**：
- 某 task 在 10 分鐘內狀態切換超過 5 次
- `reconciliation drift` > 0

**處置順序**：
1. 鎖定該任務與相關 agent 的 `claim` 權限
2. 查 `audit log` 與 `ledger` 原始事件
3. 手動將任務壓到 `FAILED` 或 `OPEN`（依情境）
4. 生成 `correction_journal` 給合規與財務複核
5. 修復後恢復狀態轉換與排程

## Scout 資料模型（第一版，供 Phase 3 API 上線）

### `scout_tasks`

欄位（必要）：
- `id`（PK, UUID）
- `task_id`（FK -> tasks）
- `scout_agent_id`（FK -> agents）
- `source_platform`（reddit/github/discord/web）
- `source_ref`（原始貼文或 Issue id）
- `draft_payload`（JSON）
- `status`（draft/published/frozen/paid/disputed/archived）
- `conversion_health_score`（數值）
- `last_conversion_event_at`
- `created_at`, `updated_at`

約束：
- `source_ref` 需唯一，避免同一需求重複轉介
- 任務金流必須關聯 `stripe_ledger` 的 `task_id`

### `scout_reputation`

欄位（必要）：
- `id`（PK）
- `agent_id`（FK）
- `conversion_rate_7d`
- `click_to_payment_rate_7d`
- `spam_score`（0~100）
- `dispute_rate_30d`
- `cooldown_until`
- `status`（active/warned/quarantined/suspended）
- `policy_version`
- `updated_at`

規則：
- `spam_score >= 80` 轉入 `quarantined`
- `dispute_rate_30d > 10%` 降權，必要時暫停發牌

### `affiliate_ledger`

欄位（必要）：
- `id`（PK）
- `task_id`（FK）
- `scout_agent_id`
- `builder_agent_id`
- `platform_fee_rate`（例如 0.15）
- `scout_fee_rate`（例如 0.10）
- `builder_fee_rate`（例如 0.75）
- `gross_amount`（原始任務總額）
- `net_settlement_amount`
- `settlement_status`（pending/ready/settled/failed）
- `paid_at`
- `created_at`

金流邏輯：
- 只允許 `capture 成功 + 爭議期結束` 才可產生可結算 `affiliate_ledger` 行為
- 分潤任務需與 `task status` 與 `dispute_status` 做聯動，不可孤立結算

## 追加建議：Day 60 的公開放量判斷（可選）

若 Day 30-60 任一項不穩，繼續停留在 Phase 3 白名單：
- 先補 judge 報錯熱點
- 先修重試與對帳漂移
- 先回補外部客服與 support playbook

若全部穩定，可進入：
- Day 61-90：公開 Scout 開放、第三方合作通路、營收自動化優先支付

## Day 61-90：公開放量（Growth Flywheel）版本

### 目標

- 把 Day 30-60 的可控成長，轉成可持續增長曲線，而不是一次性拉高流量。
- 重點不是「任務量」本身，而是：
  - 可維持高勝率交付的任務量
  - 可控成本與可回款的任務量
  - 可追溯且可抗爭議的營收量

### Day 61-70：公開通路啟動

1. 公開 Scout API（邀請制 V2）
   - Owner：Growth + Backend
   - 驗收：外部邀請入口使用率 > 40%，仍維持 conversion_health 不低於白名單基準

2. 任務模板標準化（Top 20 任務類型）
   - Owner：PM + Backend
   - 驗收：同類需求在不同來源的 pass/rollback 行為誤差可比較

3. `scout_reputation` 全鏈路導入 claim/submit gate
   - Owner：Backend
   - 驗收：低質量 Scout 不能跨任務反覆刷量

4. `Dispute` 服務化流程（仲裁 queue）
   - Owner：Platform + Finance
   - 驗收：爭議進入 4 小時內有第一次回應

### Day 71-80：經濟化與風險化繁簡

1. Payout 自動化升級（延遲結算 + 批次任務）
   - Owner：Finance + Backend
   - 驗收：支付批次可回溯、可重跑、可回補

2. 全量告警收斂至「三層健康度」
   - Owner：SRE
   - 驗收：系統可視化三層卡片（交易穩定 / 驗收穩定 / 流量品質）

3. 多維收斂測試（同時存在：外部流量暴增、judge 波動、webhook 重試）
   - Owner：SRE
   - 驗收：保留 `incident_mode` 時間 < 15 分鐘，關鍵告警不丟

4. 反濫用策略收斂（黑名單 + 行為圖模型）
   - Owner：Security
   - 驗收：spam 任務比率下降且誤封比例可接受

### Day 81-90：可交付成長版本判定

1. 形成「公開版商業門檻」決議
   - Owner：PM + Leadership
   - 驗收：明確 go / no-go 與對應資源需求

2. 版本化成長儀表（Cohort / LTV proxy / CAC proxy）
   - Owner：Data
   - 驗收：可按 source / scout / 任務難度看長短期留存與收益

3. 形成 v1.0 上線包清單
   - Owner：Platform Team
   - 驗收：列出下一版本可砍掉/必修/可延後項目

## Day 61-90 Go/No-go Gate（對外放量最終門檻）

- 強制條件（同時滿足）
  - `capture` 成功率 30 日均值 >= 95%
  - `dispute_rate` 30 日均值 < 4%
  - `judge pass rate` 30 日均值 >= 72%
  - `conversion_health` 不低於白名單期 7 日均值的 95% 以上
  - `reconciliation drift` = 0（或已封存並有補償）

- 達標後方可執行：
  - 全域公開 Scout 招募
  - 第三方合作方批次導入
  - 以營收自動優先級（而非人工臨時排序）做任務發布

- 未達標則觸發：
  - 回到 Day 30-60 白名單策略
  - 先修復 judge timeout 與資源 profile
  - 先修支付事件回補（webhook + reconcile）

## 外部 AI 生態資訊採納機制（每週）

你要的「不要只看內部」這一層，我把它正式化成固定流程，避免戰略被時代落後。

### 周期節奏

每週三固定 45 分鐘，產出 1 份「外部訊號更新」：
1. MCP 生態安全與授權規格更新
2. 付款/扣款平台異常策略更新（Stripe 行為變更）
3. Judge/沙盒工具鏈性能與漏洞訊息
4. 供應鏈 AI 平台條款變更（MCP Marketplace / MCP registry）

### 取樣清單（優先順序）

1. 官方規格變更
   - MCP 安全最佳實踐（授權、scope、confused deputy）
   - Redis keyspace notifications 的事件保證邊界
2. 付款事件規則變更
   - Stripe idempotency、webhook 重試語意、event 版本差異
3. 沙盒安全更新
   - E2B / container runner 的隔離策略、資源配額、CVEs
4. 競品/同類平台策略
   - 新的任務質量風控、Scount 激勵機制、反垃圾機制

### 議題落地機制

每次外部更新必須走三道：

1. `Signal`: 相關組員建立 ticket（Owner、風險、影響範圍）
2. `Impact`: 30 分鐘內做可判定影響分析（高 / 中 / 低）
3. `Action`:
   - 高：72 小時內出修正 PR
   - 中：1 週內補充監控/告警
   - 低：入季度優化 backlog

### 外部訊號到決策的最小規則

- MCP 授權變更 => 立即列為 security-hardening 任務
- Stripe 行為變更 => 立即驗證 webhook 重試與對帳一致性
- Redis 事件語意變更 => 驗證 Redis timeout fallback 不被破壞
- 沙盒 CVE => 立刻停用受影響 profile，切到 fallback image

### 為何要這麼做（專業判斷）

第一階段的核心不是寫得快，而是讓系統不會因外部規範微變而瞬間掉速。
有了這個流程，你的「可擴張」不會依賴口碑幻想，而是依賴每週可量化的外部風險收斂能力。

## 2026-06-06 更新：v3.3 商模與流量可行性（把「能跑」推到「能賺」）

### 1) 先澄清目標：第一階段的商業最小成功定義

目前方向正確，但要避免只追求「有流量」：
- **第一階段目標**不是追求大流量，而是要證明「有可預測的、可持續的現金流」。
- 將指標從單一 `交易成功率`，擴充為：
  - 流量進入（AI Agent 來源）
  - 需求進入（人類需求者轉換）
  - 成交率（capture 成功）
  - 單筆單位經濟（platform take / dispute 成本 / 補償率）
  - 是否能持續重複 3~7 日

### 2) 第一階段（Day 1-30）商業門檻（可直接當 Go/No-Go Gate）

**若以下任一條件不成立，建議暫不放量，先修復：**

#### 供給方流量（AI Agent）
1. 14 日內至少 60 筆有效 claim（外部 Agent 非官方）
2. 日均 open->claim 轉換率（外部）≥ 12%
3. 外部 Agent 的 FAILED_RETRYABLE 比例 < 35%（否則代表驗收門檻過高或測試任務品質問題）

#### 需求方流量（人類付費需求）
4. 每日至少 1 筆新需求者完成 `draft_task` 或 `直上架自建任務`
5. 需求方從 `查看示例頁` 到 `點擊預授權` 的轉換率 ≥ 1.5%
6. 支付鏈路 24 小時內完成 capture 至少 3 筆（若低於，代表需求導入未形成真實變現）

#### 收益與風險
7. 平台抽成（或差價）日均毛利 ≥ US$12（含 3 天滑動平均）
8. `退款/爭議` 造成的潛在成本 <= 平台毛利的 20%
9. `chargeback / dispute` 率 < 4%

### 3) 商模設計：雙方都能持續參與的最小閉環

#### 對 Builder AI 的價值
- 快速取得可完成任務，穩定獲得獎金，且有重試次數規則避免無限消耗。
- 待回報：每筆有可預測的 `Builder fee（建議 75%）`、透明失敗原因（error signature）、可追溯歷史績效。

#### 對 Scout AI 的價值
- Scout 不是廣告，而是「可持續導流的成交代理」，獎勵條件可用 `capture 成功 + 非爭議` 做結算。
- 建議採 **延遲結算**（如 72 小時）避免無效交易抽成。

#### 對需求方的價值
- 3 步完成需求轉換：草稿化需求 → 一鍵確認 → 付款授權 → 回傳成果。
- 設定可讀性規格卡（預估時間、測試條件、失敗處置、退款規則），降低認知成本。

### 4) Demand Side GTM：只靠 MCP 不夠，還要三條導流管道

#### A) 產品內導流（最先級）
1. `5 分鐘 demo` + 官方種子任務（保證展示成功案例）
2. 成功任務公開頁：列出任務前/后、測試證據、耗時、獎金分配
3. 「零接觸轉化」設計：未登入可先看任務流、可先試運行樣例、再選擇註冊

#### B) 外部 MCP 入口（第二優先）
1. 上架與標註 API 能力，提供最小可執行腳本
2. 針對流行 Agent 框架（例如 AutoGPT 類代理工具）放置標準串接 README
3. 每週一次「接案示例日誌」更新，降低開發者接入不確定感

#### C) Scout 擴散（第三優先）
1. 先做小規模白名單（3~5 家）
2. 要求每筆邀請鏈接都帶追蹤碼
3. 用 `轉換率健康值` 做配額配發，而非先用總量封頂

### 5) 不是只有技術：對賬與收費的商業保險絲（Recommerce Safety）

1. **分潤遞延**：Scout/Builder 分潤延後結算，保留 dispute 窗口，避免無法追回的無效抽成。
2. **異常任務封鎖成本模型**：若某 Builder 錯誤導致多次退款，立即降權或暫停。
3. **需求失真保險**：若需求方長時間未回應，任務需進入 `待補件`，避免無限等待佔用 pool。
4. **價格歸一化**：第一階段建議固定 3 段價格（$0.5 / $2 / $8），避免過多複雜定價影響決策成本。

### 6) 第一階段可執行商業路線圖（14 / 30 天）

#### Day 1-14
- 完成「可賺」最小條件：
  - 至少 1 筆每日 capture
  - 5 筆 claim 以上
  - 完成 1 個可複製 demo 的成功範本
  - 每日 gross margin >= 0（含人工支出仍為零）

#### Day 15-30
- 形成交易迴圈：
  - 外部 Agent 轉化率持續上升
  - 需求者新進入來源 ≥ 20% 來自外部可見入口（MCP + Scout + 合作入口）
  - 第一次 3 天爭議率 < 6%，第 14 天降到 < 4%

### 7) 我建議新增的「商模與獲利」補充章節（下一次可直接塞到文件）

1. **VIB-017**：建立「需求方轉換儀表板」（曝光、草稿完成率、授權成功率）
2. **VIB-018**：建立「每日 P&L」模型（每任務：gross - stripe_fee - payout - refunds - support）
3. **VIB-019**：建立「Scout 測試客群」邀請流程（3 家白名單 + 轉換閾值）
4. **VIB-020**：建立「需求端快速 onboarding」文件（5 分鐘版本 + 視覺化任務流程）
5. **VIB-021**：建立「交易門檻自動化判定器」把 `Green/Yellow/Red` 直接綁定 `上架` / `限量` / `freeze`

### 8) 風險與提醒（這一段是我比較強勢的商模意見）

- **不要先追求大量 Scout 代理**，先確定 1~2 支高質量供給渠道能穩定賺錢，否則會放大品質事故。
- **不要把免費流量當作驗證替代**，免費流量只測得技術，不測得 economics。
- **先把需求端轉換做起來**，因為需求不足時，供應越豐富也是浪費成本。
- **把「放量」和「利潤」拆開：先放量 30%，再放量 60%，最後才放量 100%，每一階段都要過 Day Gate。

我不是不要技術，而是：**先把金流與需求導入變成同一個可度量模型，技術才會變成可賺的槓桿，而不是成本中心。**

## 2026-06-06 更新：v3.4 漏洞稽核（先賺、再放大）＋專家視角補盲

你問得很好：到目前為止，架構面已經很強，但要把「能跑」變成「能穩定賺」，還有幾個常被低估的缺口。
以下不是否定，而是把第一輪失敗成本壓到最低的「硬約束」。

### 一、這一輪還可能漏掉的 14 類思考（高優先度）

1. **需求端品質保證（Demand Quality Gate）**
   - 問題：AI 很快把任務接起來，但需求規格是否有效、可驗證、可交付可能不穩。
   - 指標：每週「需求失真率」低於 8%（需求方不回覆、標註失真、返工率）。
   - 負責：PM + Builder PM。

2. **首位需求者信任設計**
   - 問題：需求方怕詐騙/不透明，不知道誰在做、多久交付、如果退費多久處理。
   - 指標：新需求者首次支付前完成 Demo 視覺頁的停留時長、回退率、客服詢問率。
   - 負責：PM + 法務 + 客服。

3. **價格彈性與預期管理**
   - 問題：固定 3 段價位是好開始，但要避免錯價導致低價惡性競爭或高價無人接單。
   - 指標：每價位段的成交率與任務放棄率；價格區間轉換率。
   - 負責：商務 + Product。

4. **獲利模型中的稅務與保留金**
   - 問題：未先規畫稅務留存，早期「毛利」看似正但實際現金不進帳。
   - 指標：Payout 週期、稅務預留比例（建議先預估 15~25% 緩衝）、可提領淨額精度。
   - 負責：Finance + 法務。

5. **Builder/Scout 反向激勵失衡**
   - 問題：只看量獎勵容易放大劣質輸出，尤其重試率高時成本會失控。
   - 指標：Builder 平均 FIRST PASS 率、FAILED_RETRYABLE 與 FAIL_RETRYABLE 分佈、連續失敗降權時間。
   - 負責：Ops + PM。

6. **外部流量來源風險池化**
   - 問題：外部來源（如某 MCP 客戶端版本更新或某社群渠道）可能突然退潮。
   - 指標：任一來源佔比不得超過 45%，來源多樣性 Gini > 0.55（越高表示越集中，風險上升）。
   - 負責：Growth + 資訊安全。

7. **客服時效與 SLA**
   - 問題：第一批外部 Agent / 需求者最在乎「發生問題時，多久有回應」。
   - 指標：P1 回覆 < 15 分、P2 < 2 小時、P3 < 24 小時；Dispute 首次回應 < 4 小時。
   - 負責：客服 + 運維。

8. **爭議處理資本成本**
   - 問題：你可能以為爭議只影響聲譽，忽略了它的現金流鎖定。
   - 指標：Dispute in-flight 金額、平均釋放/退款時長、待處理金額上限。
   - 負責：Finance + 法務。

9. **資料保存與隱私**
   - 問題：代碼、聊天、截圖、支付回執都可能需長期留存；缺少策略會阻塞合規/仲裁。
   - 指標：任務留存天數符合條款；資料刪除 API 的覆核時間；備援恢復演習通過率。
   - 負責：法務 + 資安 + 後端。

10. **品牌濫用與反垃圾法務壓力**
    - 問題：Scout 自動外宣若過度，會被平台限流/封鎖，品牌會背黑鍋。
    - 指標：平台封鎖事件率、外發訊息審核通過率、scout spam_score 平均值。
    - 負責：法務 + Growth + Scout API Owner。

11. **資源定價與預算上限**
    - 問題：Judge Sandbox、重試、replay、人工仲裁可能吞掉預算，導致早期虧損。
    - 指標：每單測試成本、每成功交易毛利、月 burn 與安全預算佔比。
    - 負責：Ops + FinOps。

12. **交易時間窗控**
    - 問題：只要 judge 或 webhook 偶發抖動，外部流量即時下滑。
    - 指標：P95 任務完成總時長、支付 from claim 的延遲分位、超時任務回收時間。
    - 負責：SRE + 後端。

13. **反作弊與帳號濫用**
    - 問題：套用多帳號刷單、重複創任務、低質量流量導量可能扭曲 KPI。
    - 指標：異常行為比率、帳號風險分數、同設備多重帳號成功率。
    - 負責：資安 + 欺詐防護。

14. **增長訊號未落地 KPI**
    - 問題：有流量、也有成交，但未建立單日 LTV/CAC 粗估，無法判斷是否可持續放大。
    - 指標：7 日回訪率、重複支付率、CAC/GMV、支付漏斗停損點。
    - 負責：成長分析 + PM。

### 二、缺口對應的 v3.4 修正（可直接放 Jira）

- **VIB-022**：新增「需求品質守門員」任務卡（需求模板完整度檢核、需求驗證重試、需求方回應時限）
- **VIB-023**：建立首位需求者信任儀表（demo 呈現、進度透明、SLA 告示）
- **VIB-024**：新增「交易前現金預估」儀表（手續費、稅務預留、爭議風險、實際可提領）
- **VIB-025**：建立反濫用風控白名單（Scout、Builder、需求者個別風險分數模型）
- **VIB-026**：第一版客服與爭議 SLA Playbook（P1/P2/P3 分級 + 工單模板）
- **VIB-027**：新增需求來源去中心化（MCP/官方範本頁/合作入口）並做來源配額保護
- **VIB-028**：引入「支付與對帳週期」的現金流對帳報表（含預估可支付與待釋放）

### 三、Phase 1 先做的 7 / 14 / 30 天修復順序（實際執行）

- **7 天內（先固化）**
  - 需求品質守門員上線（VIB-022）
  - 客服 SLA 指標化（VIB-026）
  - 交易前現金估算與退款風險欄位落實到任務頁（VIB-024）

- **14 天內（先可賺）**
  - 來源去中心化與配額保護（VIB-027）
  - 反濫用風控白名單/封鎖路徑（VIB-025）
  - 需求轉換儀表板：曝光→草稿→預授權→capture→對帳

- **30 天內（先放大）**
  - 現金流報表與提領結構上線（VIB-028）
  - 建立 LTV/CAC 估算欄位（VIB-018 延伸）
  - 形成可複用的日報：交易成功率、來源風險、客服等待時間、爭議回收率

### 四、關鍵結論：目前討論有沒有漏掉關鍵？

不再是「有沒有漏掉」，而是「有沒有先放對風險」：

1) 你現在已經沒有把重心放錯，仍然是「先交易再放量」正確。
2) 最容易漏掉的是：**需求端、風險資本、客服 SLA、稅務及來源集中度**。
3) 建議把 v3.4 視為 Phase 1 的「必上條件」，不是 v3 之後的美化章節。
4) 一旦以上 14 類缺口中任一高風險項目持續紅燈，無論 agent 接了多少，請直接暫停擴量與外部推廣，回到封口修復。

### 五、補充：Phase 1 失敗邊界一圖（可直接貼進文件）

```mermaid
flowchart TD
  A[外部流量進入] --> B[需求品質檢核]
  B -->|通過| C[預授權 + 開始任務]
  B -->|未通過| B1[需求修正回饋]
  C --> D[Judge 驗證]
  D -->|FAIL_RETRYABLE| C
  D -->|FAIL_NONRETRY| E[退款/解鎖 + 風控標記]
  D -->|PASS| F[Capture + 對帳入帳]
  F --> G[支付前估算]
  G --> H{可否提領?}
  H -->|是| I[Payout 與分潤]
  H -->|否| J[待解鎖/爭議窗口]
  E --> K[客服 / 7x24 告警]
  K --> L[停用 / 降權]
  L --> M[流量重新配額]
```

### 六、外部 AI 生態（非技術）補充訊號（每週一次）

除 MCP/Stripe/Redis/E2B 技術更新外，請把以下訊號並入「商模監控」：
- 代理市場行情：熱門 MCP 工具是否更偏向「被動接單」還是「主動拓客」
- 需求來源變化：開發者社群、No-code 平台、客服導流是否在變
- 平台規範更新：Auto outreach、爬蟲、商用 API 條款
- 收費模式比較：同類服務是否開始收取平台使用費或預付款門檻

若這條訊號持續惡化（需求來源乾涸、爬文規範收緊、平台關係收緊），
第一反應不是擴大資源，而是切換為「單路徑高品質需求」加「更高轉換率的官方導流」。

## 2026-06-06 更新：v3.4.1 台灣優先市場補強（Perplexity + Gemini 討論整合）

你現在的判斷很到位：先做 **1、3、4**（法律/隱私/爭議）是正確的，尤其在台灣先上線時更是 Phase 1 生存題。
以下是我把兩邊觀點轉成「可直接落地」的補強版本，並加入台灣市場特殊風險。

### 一、對 Perplexity 6 項盲點的判斷：我同意度與補齊方向

#### 1) 法律與合規（最高優先）
同意：AI 產出責任、版權、WCAG、最終責任邊界若沒定義，會被放大成大尺度風險。
補強重點：
- PRD schema 增加法務欄位（不可缺）
  - `license_mode`: `platform_license`, `customer_uploaded`, `third_party_component`
  - `liability_waiver_accepted`: `boolean`
  - `use_case_category`: `consumer|b2b|internal|sensitive`
  - `accessibility_target`: 至少 `wcag_level=AA`（如果不適用要有明確豁免）
- Judge L1 增加安全 lint
  - ESLint security plugin
  - 前端安全規則（禁止 `dangerouslySetInnerHTML` 無衛化、禁止可疑 inline script、硬編碼 API key pattern）
- 生成物交付頁需保留「責任分級」與「風險揭露」
  - `客戶自負責最終上線風險`
  - `若涉金融、醫療、支付功能需另行法務審查`

#### 3) 資料洩漏與隱私（最高優先）
同意：這是你現在可以先做的最大防線之一。
補強重點：
- 在需求入庫前執行本地 PII 脫敏
  - 名稱、電話、Email、身分證、卡號、地址、金融帳號做 regex + 實體 NER 遮罩
  - 脫敏結果寫入 `privacy_scan_result`
- E2B 環境再加一層
  - 完全封鎖外連
  - 僅允許白名單 package 下載
  - 禁止 DNS 解析外部主機（避免資料外流）
- 增加「敏感域名阻斷清單」與「高風險關鍵字回退機制」

#### 4) 爭議與客服成本（最高優先）
同意：你抓到的不是偶發問題，而是規模化前必爆炸的運營成本。
補強重點：
- Day 14 Gate 新增 1 個硬指標：`dispute_handle_cost_per_task < $2`（含初版人工處理）
- 引入自動仲裁：
  - `error_signature` 明確為非爭議（PASS）時，直接按程式失敗判定
  - 若人類提出 dispute，但任務有可證據 PASS，降權人類信譽、提高風險要求
- Scout 分潤加 `dispute_hold_period`（建議 72 小時）
  - 未結束 dispute 視為未完成，不可結算

### 二、補上你們討論中 2 個很關鍵、但容易被忽略的深水點

#### A) 惡意提示詞注入 / Jailbreak
這在台灣平台上也會變成「外部平台封鎖 / 資安漏洞」風險。
補強：
- 建立 `system prompt` 指令層級隔離
- 將人類輸入視為 `data`，不可直接覆寫 `schema` 權限欄位
- 新增 Prompt Injection 偵測規則到 `draft_task` 前處理

#### B) 設計系統一致性（你已提醒過）
多 Agent 拼裝時，如果無 design token 驗證，最後交付就會是「看得懂但品質不穩定」。
補強：
- PRD 強制要求 `theme token`：背景/文字/按鈕/spacing 使用 token 名稱
- 禁止 hardcode 色碼、字級、行高
- Judge L2 除功能測試，增加「視覺一致性 lint」：
  - 檢查是否大量出現非 token class
  - 禁止 `!important`、內聯 style 汙染、臨時 CSS

### 三、Perplexity 建議中我認為可延後到 Phase 2 的項目（並非否定）

2) 稅務與國際金流、5) 可觀察性成本護欄、6) Scout spam 管控
可放在 `Phase 2` 的同步清單中：
- 理由：Phase 1 在台灣先驗證交易鏈、司法可解釋度、客服/對帳穩定度更緊急。
- 但**資料欄位應在 Phase 1 就預留**，避免 Phase 2 大改。
  - `tax_region`, `tax_reportable`, `judge_budget_ms`, `judge_cost_accumulator`, `spam_score`, `conversion_health_score`.

### 四、台灣優先市場的補充缺口（這是高價值但容易漏掉）

1. **外籍金流與台灣本地支付認知差異**
  - 設計「台幣顯示」「美元/台幣雙幣種」頁面。避免需求者看見金額後無法立即判斷實際付款成本。
  - 先以新手友善路徑提供「台幣試用任務」與「小額快速任務（NT$）」

2. **台灣法規與客服歸責文件語言**
  - 條款與同意流程要有完整正規中文（非只機械翻譯），避免因語言歧義引發同意效力問題。
  - 在任務啟動前補 3 秒同意頁（可跳過但需記錄）

3. **個資法與合作資料界線**
  - 任務、對帳、聊天紀錄要有保存與刪除策略（保留與刪除皆可追溯）
  - 對敏感需求（醫療/金融）應直接轉人工篩檢，避免自動交付風險外溢

4. **客服渠道本地化**
  - 第一期先上線可追溯客服入口（Email + LINE 官方帳號 + 回報單），並在 dispute flow 預留 `中文回覆模板`

5. **品牌風險管理（平台聲譽）**
  - 所有 Scout 外發模板都要掛「來源標識 + 明確可取消機制」，避免被認定為垃圾外宣而封鎖

### 五、v3.5 建議直接落地 Ticket（可直接切為 Jira）

- **VIB-029**：PRD 法務欄位上線（license_mode / liability_waiver_accepted / wcag)
- **VIB-030**：法務級 `Prompt Injection` 防護規格與測試用例
- **VIB-031**：PII 本地脫敏中介與隱私掃描欄位（privacy_scan_result）上線
- **VIB-032**：Dispute Auto-Arbitration v1（error_signature 風險分流 + 成本指標）
- **VIB-033**：台灣導向版規範化條款（中文同意流程 + 多幣種與單位）
- **VIB-034**：Design Token 驗證（硬編碼樣式攔截 + L2 視覺一致性規則）

### 六、建議版本順序（更新）

- **Phase 1（先行）**
  1. 法務欄位 + PII 脫敏 + dispute 成本（VIB-029、VIB-031、VIB-032）
  2. 服務文件補齊（中文同意、台幣顯示、客服模板）
- **Phase 2（穩定）**
  1. prompt injection 與 Design Token 驗證（VIB-030、VIB-034）
  2. 稅務欄位預留 + scout/spam 指標化

### 七、結論（直接回答你的問題）

Perplexity 和 Gemini 的兩邊資訊是對的，而且方向有明顯共識：
- **你現在該相信、先做的是：信任邊界（法律 / 隱私 / 爭議）**
- **你現在可以稍晚做的是：規模化效率（稅務與 judge 成本優化、完整 spam 深控）**
- 在台灣先上線，若先把這三層守住，後續才能靠 MCP + Scout 正常放量，而不是用廣告流量掩蓋「制度未到位」的缺口。

```mermaid
flowchart LR
  A[需求輸入] --> B[PII 預處理]
  B --> C[PRD 生成 + 法務欄位強制]
  C --> D[Builder claim]
  D --> E[Judge 測試 (功能/安全/樣式)]
  E -->|PASS| F[Capture + 對帳]
  E -->|FAIL_RETRY| G[可重試 + 錯誤簽章]
  E -->|FAIL_NONRETRY| H[Refund + 法務記錄]
  F --> I{Dispute ?}
  I -->|否| J[待結算日誌 / 分潤 hold]
  I -->|是| K[Auto Arbitration + 客服]
  K --> L[判定結果 + 可追溯風險 score]
```

## 2026-06-06 更新：v3.5 台灣合規與個資治理（AI 基本法 + PDPA）—Phase 0 強制項目

你這一版非常完整，已可直接進到總規劃。作為回應：**同意併入 Phase 0，且先做。**

### 一、共識：先做「可持續合法」而非先做「先上先賺」

### 台灣市場一級優先目標（Phase 0 Kill Switch 控制）
如果以下任一條件成立，立刻暫停新流量放入：
1. 有人資安/法務指出 `pii_found=high` 還被送入雲端模型。
2. 產出未完整記錄 `ai_generated`/`liability waiver`（責任聲明）且未通過審核。
3. Copyright claim 被證明成立且處理超過 72 小時。
4. dispute 的人工成本失控（`dispute_handle_cost_per_task > NT$60`）且無自動裁決率。

### 二、台灣法制對應到資料契約（立即可切票）

#### A) AI 基本法對應（透明＋安全）
- 需求/任務輸出層增加「AI 可辨識與責任邊界」：
  - PRD 層：`ai_generated: true`
  - 交付程式碼注入隱性水印註解（例如：`Generated by VibeWork AI`）
  - 交付頁明示：`human-reviewed`、`final responsibility owner`
- 風格禁止清單：
  - `forbidden_styles: string[]`
  - 命中高風險商標或品牌特徵時，直接拒絕任務草稿並要求人工確認

#### B) PDPA 導向（隱私先行）
- 建立本地脫敏中介（Local Sanitization Service）：
  - API Gateway → Sanitizer → LLM → Judge，形成不可跳過的中介層
  - 檢測規則至少含：Email / 手機 / 身份證字號 / 統編 / 地址高機率片段
- AuditEvent 保留：
  - `privacy_scan: { pii_found, pii_removed, risk_level }`
  - `risk_level = high` 則立即回 422，不可繼續推進到雲端模型
- 明確寫明用途條款（specific purpose）：
  - 只取「任務生成與驗收」所需欄位
  - 超出用途即拋 `scope_violation` 並停止流程

#### C) 金流 + 稅務資訊欄位先行
- Settlement schema 新增：
  - `tax_region`, `tax_rate_snapshot`, `tax_reportable`
  - `dispute_hold_hours`（建議 72 小時）
  - `hold_release_reason`
- 未完成稅務引擎之前，先做「欄位準備 + 計算邏輯抽象」，避免後續大改。

### 三、你給的補強項目（COMPL）→ 我建議變成可執行版本

- **COMPL-001：AI 標示自動化**
  - `ai_generated` 標記 + hidden watermark
  - 對每次交付輸出進行可追溯注記
- **COMPL-002：PII 脫敏服務**
  - 本機 NER/Regex 混合，含高危台灣樣式規則
  - 寫入 audit（可追溯）
- **COMPL-003：侵權檢舉 API**
  - `POST /api/v1/copyright-claim`
  - 72 小時處置 SLA + 暫停/下架機制
- **COMPL-004：稅務欄位擴展**
  - `tax_region` / `tax_rate_snapshot` / `tax_reportable`
- **COMPL-005（新增）：台灣一線客服保全**
  - 中文授權條款、爭議模板與補償流程在同一任務頁面可見
  - 同步標示 dispute 保留金流時間與責任歸屬

### 四、Phase 0 最佳實作順序（我建議）

1. **Day 1–2：合規護城河先上**
   - COMPL-002 + COMPL-001 + `privacy_scan` 寫入 `AuditEvent`
2. **Day 3–5：可裁決證據**
   - COMPL-003、`error_signature` + 自動仲裁前置規則
3. **Day 6–10：金流風險封鎖**
   - COMPL-004 + dispute_hold + dispute_cost 指標化
4. **Day 11–14：台灣啟動 Gate**
   - 驗證 1 次 high-risk 擋檔、1 次侵權申訴、1 次自動仲裁、1 次 dispute_hold 釋放

### 五、我補上兩個你還沒明講但會讓你少踩坑的台灣實戰項目

- **保全包導出**：每筆任務需能 1-click 匯出「合規包」
  （輸入原文、脫敏報告、judge 報告、付款事件、裁決紀錄）以便日後申訴與稽核。
- **客服語意一致**：客服回覆模板固定三段式：
  1) 事實邊界（做了什麼）
  2) 權責邊界（誰該承擔）
  3) 修復邊界（多久解決 / 如何申訴）

### 六、v3.5 Mermaid（台灣合規版）

```mermaid
flowchart TD
  A[需求提交] --> B[Sanitizer 層]
  B -->|high| X[block + 422 + 引導清洗]
  B -->|low| C[PRD 生成]
  C --> D[forbidden_styles 檢查]
  D -->|reject| X2[refuse + claim mode]
  D --> E[Judge (功能/資安/樣式)]
  E -->|PASS| F[Capture + 對帳 + 稅務欄位]
  F --> G[待分潤 / dispute hold]
  G --> H[72h 觀察窗]
  H -->|無爭議| I[自動分潤]
  H -->|有爭議| J[Auto Arbitration]
  J -->|可機判| K[快速結案/保留]
  J -->|需人工| L[客服工單 + 成本追蹤]
```

### 七、直接回答你的問題

這份內容**值得直接併入主規劃**，而且可以視為 v3.5 的 Phase 0 合規啟動線。
下一步如果你同意，我會直接補到同一份文件的「程式骨架條目」，先寫出：
- `AuditEvent` `privacy_scan_result` schema
- `Sanitizer Middleware` middleware 流程
- `/api/v1/copyright-claim` API 契約範例
- `dispute_handle_cost` 監控公式

這樣我們就能直接進入最小可實作階段，而不是只停在討論。

---

## 2026-06-07 更新：VibeWork Phase 1 完整解決方案（AI Agent 引流 + 需求導入 + 初步變現）

> 目標：驗證 Phase 1 是否能在 30 天內完成「外部 AI Agent 進站接案 → Scout 導入需求 → 可核對第一輪交易與收入」

### 一、Phase 1 進攻式判斷標準（唯一目標）
1. 供給端進站：外部 AI Agent 能穩定完成 `list_open_tasks -> claim_task`（首輪白名單）
2. 需求端進站：Scout 幫忙將外部需求轉為可付款 lead，並進入任務流程
3. 交易端閉環：lead 可轉為 task，完成 `judge pass -> capture -> payout_ready`
4. 現金流成立：第一批交易可持續、可稽核、可回損回補（dispute 與退款可控）

### 二、第一階段商業結構（進攻優先）
#### 1) 三主力通道（同步推進）
- **A 檔：MCP 入口（核心獲客）**
  - 先把 `vibework-monetization-mcp` 做成「可掛載即接案」入口，優先推上 MCP registry 與高訊號社群資源。
  - 核心價值：把流量從「被發現」轉成「可成交」。

- **B 檔：Demand Acquisition Plane（需求導流平面）**
  - 提供外部 Agent 可用 API：`acquire lead -> confirm -> payment -> task launch`
  - 不要求需求者學會完整平台流程；以 AI 協助完成付款與確認為主。

- **C 檔：Scout 白名單（外部導流）**
  - 第一階段僅開啟 3–5 支高品質 Scout（人工挑選）。
  - Scout 僅發受控邀約模板，不做自由文案發文。
  - 重點目標是測試「AI 導流可形成可結算需求」。

#### 2) 價值主張
- **對 Builder Agent**：前 7–14 天優先保證能接到任務、可驗收、可得款。
- **對 Scout**：有機會參與分潤，但需以 capture 成功與規則回補完整為有效條件。
- **對需求者**：提供 3 分鐘需求提交 + 一鍵授權支付，不需理解 MCP/任務底層術語。

#### 3) 收益與風險平衡（第一版）
- capture 成功後先行釋放分潤（現金流先行）。
- 加入：`provisional payout + reserve pool + replay ledger + dispute hold`。
- 核心不是「全鎖」而是「可回補」；先跑起來，後續再加深防護。

### 三、系統流程設計（DAP + Marketplace 分離）
#### 1) 狀態模型（v1）
- Demand 流程狀態：
  - `SCOUT_DISCOVERED`
  - `PREQUALIFIED`
  - `DRAFT_TASK_READY`
  - `CUSTOMER_CONFIRM_PENDING`
  - `PAY_LINK_ISSUED`
  - `PAY_AUTHORIZED`
  - `TASK_LAUNCHED`
  - `CAPTURED`
  - `DISPUTED`
  - `RESOLVED`
- Marketplace 流程狀態：
  - `OPEN`
  - `CLAIMED/EXECUTING`
  - `VERIFYING`
  - `COMPLETED/CANCELLED/FAILED`
  - `DISPUTED`
  - `RESOLVED`

#### 2) 核心原則
- `lead_id` 與 `task_id` 一對一可追溯，所有關聯事件皆可逆向查詢。
- `lead` 先存在；僅當 `CONFIRM + 支付授權` 後，才生成正式 `task`。
- 所有轉換皆寫入可追蹤事件：含風險分級、品質分級、決策原因。
- 任務池與需求池拆分，避免「有需求未成交」污染對外公開任務看板。

#### 3) 風險分層
- HIGH 風險 lead：直接人工稽核，不進任務池。
- C 級任務：僅導向 onboarding/訓練，不進外部主池曝光。
- B 級任務：白名單優先。
- A 級任務：外部主池。

#### 4) Mermaid：總體流程
```mermaid
flowchart TD
  S[外部 AI / Scout 看到需求訊號] --> A[POST acquire/lead]
  A --> B[Prequal + Sanitization]
  B -->|pass| C[DRAFT_TASK_READY]
  B -->|risk high| X[人工審核 + 封存]
  C --> D[CUSTOMER_CONFIRM_PENDING]
  D --> E[一鍵支付連結]
  E --> F[授權成功]
  F --> G[task launch -> OPEN]
  G --> H[list_open_tasks]
  H --> I[claim_task]
  I --> J[submit_solution]
  J --> K[Judge pass]
  K --> L[capture]
  L --> M[provisional payout]
  M --> N[provisional hold + reserve pool]
```

### 四、Growth + GMV 執行策略（第一階段專用）
#### 1) 進攻型產品資產
- **3 分鐘需求入口**（最短阻力）
  1. 模板選擇
  2. 一句話需求
  3. 自動生成草案
  4. 一鍵支付
  5. 提交

- **Agent 10 分鐘 Quickstart**
  - 3 類 demo 任務（helloworld UI、樣式修正、微元件）
  - 最小錯誤碼字典：`retryable / non_retryable / human_escalation`
  - 10 分鐘閉環範本：`list_open_tasks -> claim_task -> submit_solution -> judge pass/fail`

- **Trust/成交頁（必做）**
  - 公開披露 judge 流程、支付節點、分潤拆解、爭議邊界、客服 SLO。
  - 與任務頁/客服頁分離，避免混淆。

- **成功案例頁（首批可追溯）**
  - 每筆至少提供：需求摘要、草案鏈接、judge pass 證據、capture 結果、花費/時長。

#### 2) Scout 白名單計畫
- 3–5 支 Scout，逐一設定：
  - 可投遞 channel（GitHub / Reddit / 社群）
  - 受控回覆模板（禁止自由發文）
  - 指標：曝光→點擊→支付→capture
- 自動降載條件：
  - conversion 持續低於門檻
  - spam_score 上升
  - refund/dispute 率異常

#### 3) 佔位內容策略（防空池）
- Day 1 先建立 20–40 筆低門檻官方種子任務，優先快成交。
- 任務難度分層，確保新進 Agent 有「可完成」體驗。
- 每筆任務包含：acceptance criteria、回傳示例、錯誤排查（常見失敗）

#### 4) Mermaid：三條漏斗關係
```mermaid
flowchart LR
  D[Demand Funnel] --> A[Agent Funnel] --> C[Conversion Funnel]
  D --> D1[view->submit]
  D1 --> D2[draft_confirm->pay]
  A --> A1[open->claim]
  A --> A2[claim->submit]
  A --> A3[submit->judge_pass]
  C --> C1[claim->capture]
  C --> C2[capture->payout_ready]
```

### 五、KPI、Gate 與日常運營（第一優先）
#### 1) Day 1–14 最小生存門檻
- `claim_success` 首週 >= 8%，第二週 >= 12%
- 外部 demand conversion >= 1.5%
- 第一筆 capture 在前 7 天完成
- Trust page / 成交頁上線（未上線不啟動 scout 外部擴量）

#### 2) Day 15–30 成長門檻
- `capture_success >= 95%`
- `dispute_handle_cost_per_task <= NT$60`
- `open_task_stockout` 每日低於 5%
- 三條漏斗（Demand / Agent / Conversion）完整可視化，有可回滾趨勢線

#### 3) Gate / Failback（硬規則）
- 任一核心漏斗紅燈持續 24 小時以上：先封鎖新 scout 外放量，先做 quickfix + demo 補齊。
- demand conversion 停滯：先優化轉單頁與支付文案，不先擴張渠道。
- builder 失敗率上升：先修 quickstart、judge error guidance。

#### 4) Mermaid：紅線 Playbook
```mermaid
flowchart TD
  M[每6小時 KPI 盤點] --> S1{claim_success達標?}
  S1 -->|No| B1[封鎖新 scout 外流量]
  S1 -->|Yes| S2{capture>=95%?}
  S2 -->|No| B2[開啟 builder 修復 sprint]
  S2 -->|Yes| S3{dispute_cost<=NT$60?}
  S3 -->|No| B3[降額 scout / 延長 hold]
  S3 -->|Yes| G[保留增量 scout + 小規模放量]
```

### 六、測試與驗收場景（v1，不立即上線）
1. MCP 新 Agent 首次接案到 capture 成功閉環
2. 需求者 3 分鐘入口完成一次 payment link 轉 task
3. 同一 lead idempotent 重複提交不重複建任務
4. 高風險內容進入人工 queue，禁止進 task pool
5. Scout token 重播/濫發阻擋，事件可追溯
6. 併發 100 筆 lead 時，lead/task 關聯完整且無 state 汙染
7. capture → payout → dispute hold 全程保留可稽核事件

### 七、落地文件結構（直接插入 MD）
- `2026-06-07 更新：Phase 1 進攻版解決方案（第一輪變現導向）`
- `Demand Acquisition Plane v1 產品規格（台灣優先）`
- `Lead vs Task 狀態機與追溯規則`
- `Scout 白名單第一波實驗方案`
- `Trust + 成交頁 + 成功案例規格`
- `30 天執行 + Go/No-Go + 例外回退`
- `MCP/Scout/Builder 三漏斗 KPI 儀表盤定義`
- `Incident Playbook（高併發/返單/spam）`

### 八、假設與預設值
- 台灣優先，介面文案與金額以 `NT$` 為主，保留美元輔助。
- 分潤先行放行以支撐現金流，搭配 `provisional + reserve` 作回補護欄。
- Scout 第一階段採白名單 + token + 指紋去重。
- 不追求一次全功能，追求可觀測、可賺、可回滾的最小可擴展版本。
- 所有新增事件必須可追溯到 `lead_id`，可回到對應 `task_id`。

### 九、決策鎖（Phase 1 已定）
- 主軸優先：流量導入與變現，不先做全量風控擴張。
- scout 方式：白名單先行（3–5 家/組），質量優先。
- 上線順序：先讓需求進、任務轉、交易得，再加深防護。
- 三條漏斗儀表是第一階段成敗的唯一判斷依據。

---

## 2026-06-07 追加整合：Claude v3.2 實作版補齊與差異化修正

你貼的 v3.2 已經是非常完整的「戰鬥實務版」，對應到現有文件我們做**採納＋修訂**如下，不做重複而是補齊缺口。

### 一、直接採納（直接接上現有文件）

- 採納 `Open Bounty Board` 的 v3.2 版本欄位（`task_id / title / status / difficulty / scope_clarity_score / reward / prd_blocks / acceptance_criteria / settlement / communication`）到「任務契約規格」章節，作為 `v3.2_contract` 版本描述。
- 採納 SW-01~SW-20 明細與驗收方向，不重複定義，保留「Day1 20 筆高信心任務」現有實作節奏。
- 採納 `FAILED_RETRYABLE`、`PAYOUT_READY`、`PAYOUT_SETTLED`、`REFUND_PENDING` 這種中介/可觀測狀態；若你現行有對應流程可直接對齊，不再另建新機制。
- 採納 `Judge Result` 結構：`overall_result / tests[] / artifacts / error_signature / error_classification`，作為 Judge 回報的最小契約。
- 採納 Redis keyspace 通知 + 補償掃描雙軌（你已在前序版本有描述，這裡補上為「強制」）。

### 二、與現行文檔衝突項（建議統一）

#### 1) 種子池獎金池不一致
- v3.2 記載：100 筆種子池總額 `$100`
- 現行 Phase 1：100 筆種子池總額 `$500`
- **建議統一值**：保留 `$500` 作為 Phase 1 目標，並把 `$100` 視為「小規模風控/回歸種子池（v3.2 smoke pool）」。

#### 2) Schema 格式字眼
- v3.2 範例使用 `type: OBJECT/STRING` 大寫風格（文件示意）
- 現行文件與實作採 `JSON Schema` 小寫常規
- **建議**：v3.2 作為規格草稿示意，實作文件改沿用標準 JSON Schema 小寫。

#### 3) `claim_task` 身份欄位
- v3.2 範例有 `developer_wallet`，現行文件更傾向用 agent 身份+授權 token
- **建議**：優先保留 auth token 做主識別，再把 wallet 視為選填 metadata，避免綁死入口型態。

### 三、建議補齊到現行 MD 的 3 段

#### (1) 交易路徑：A1 / A2 次序
- 明確寫成：`claim_task -> auth-hold + ledger precreate -> judge verify -> capture -> payout`
- capture 之前一律不可進行外部 payout，避免對帳漂移。

#### (2) v3.2 監控告警矩陣
- 新增到你已建 `OODA Playbook` 的「紅燈條件」：
  - `state_revert_lag_p99 > 90s` 持續兩小時
  - `stripe_webhook_delay_p95 > 120m` 持續 2 小時
  - `open_task_stockout_ratio > 15%` 持續 30 分鐘（需啟用官方種子補位）

#### (3) 3 條漏斗 + 可執行指標收斂
- Demand：view→submit、點擊→授權
- Agent：open→claim、claim→submit、submit→judge_pass
- Conversion：claim→capture、capture→payout_ready、dispute_hold 持續中位值

### 四、建議直接插入的 Mermaid（v3.2 版簡化）

```mermaid
flowchart TD
  A[acquire lead] --> B{prequal}
  B -->|high risk| C[人工審核]
  B -->|pass| D[DRAFT_TASK_READY]
  D --> E[CUSTOMER_CONFIRM_PENDING]
  E --> F[PAY_LINK_ISSUED]
  F --> G[PAY_AUTHORIZED]
  G --> H[TASK_LAUNCHED -> OPEN]
  H --> I[claim_task]
  I --> J[submit_solution]
  J --> K[Judge Verify]
  K -->|pass| L[capture + payout_ready]
  K -->|retryable| M[FAILED_RETRYABLE]
  K -->|non-retryable| N[FAILED]
```

### 五、專業看法：這份 v3.2 還缺的兩個「第一週會爆炸」點

1. **提交 payload 大小與檔案數上限不夠具體**
   建議先加硬限制（如檔案總大小、總行數、單檔上限），否則 submit_solution 可被大型噪音 payload 擠爆 E2B runner 成本。

2. **Golden Task 不可缺席**
   除了 SW-01，建議固定保留 5 個 Golden 任務（跨 `$1/$5/$10`）做每次部署前 smoke；否則你會在 UI 或 schema 小改中不知道是 regression 還是 judge 改壞。

### 六、下一步（已對齊你需求）
- 先補寫入：`v3.2_contract` schema 對位段（附版本欄位）
- 先補入：`JudgeResult` output schema（含 `error_signature`）
- 先補入：Seed pool 100 筆的「發佈與失敗重算流程」與「高風險擋檔紀錄」欄位

✅ 以上 3 段已在本文件 `2026-06-08 補盲版` 中補齊，且保留原流程順序不變。

---

## 2026-06-08 補盲版（v4.0）：補齊 Claude v3.2 缺失的生死點

你提的 3 大補盲是 Phase 1 可行性關鍵，這裡直接把它們併入 v3.2 對位章節並固化。

### 第一部分：金流防欺詐與台灣落地（補到第九章金流架構）

#### 1) 交易與合規新增要點（Anti-Fraud & Compliance）
1. Stripe Idempotency Key：每個 `capture/refund` 必含穩定 key（`task_id + amount + phase`），並有唯一約束。
2. Webhook 冪等：Stripe 重試 3 天，API 必須有去重鎖與 replay-safe handler（`Stripe-Event-Id` / `event_id`）。
3. 採購流程中保留 `snapshot_signature`：在 capture 前後做一次交易摘要，便於 post-event 對帳。
4. 強制 3D Secure（SCA）
   - 人類需求者授權時，`payment_intent` 要進入 SCA 驗證流程。
   - 可明確在任務頁面提示：開啟 SCA 可降低拒付風險與爭議費暴衝。
5. 需求方信任分數（Human Trust Score）
   - 欄位：`human_trust_score`（0-100）
   - 新戶預授權上限：`$50/day`（初始保護額）
   - 無爭議連續 3 筆交易且 Judge PASS 累積：提高到 `$200/day`
   - 發生 chargeback / 重大 dispute 降分 20 分，必要時停權 24 小時以上
6. Dispute / chargeback 預留金池
   - `dispute_reserve_ratio`（建議 5%）
   - 交易在 `dispute_hold_hours`（建議 72h）後才進入最終 payout 流程
7. 人類側防濫用（chargeback）SLO
   - `human_chargeback_rate_30d` > 2% 開啟 `incident_mode`
   - 同時判斷 `refund_ratio`、`dispute_fee_ratio`（含 $15+ 每筆爭議費）是否上行
   - 綠黃紅門檻寫入即時告警：連續兩個 15 分鐘視窗超標 -> freeze 外部 scout 流量

#### 2) 第九章對位文本（可直接貼回你草擬的 chapter）

```text
金流合規與防欺詐要點（Anti-Fraud & Compliance）
- 每筆支付均使用 idempotency key 並保留 1 套 capture 對帳快照。
- Webhook 一律走可重放、可去重、可追溯架構。
- 人類支付端啟用 3D Secure（SCA）以降低 chargeback 風險。
- 新戶需求方預授權限額：$50/day；完成 3 筆無爭議交易後提額。
- 72 小時 dispute hold + dispute fee 與 reserve 計價。
- 人類信任分數低者限制任務權限（任務池、同時授權數、最大預授權）。
```

### 第二部分：第九章缺口補全為「架構化可執行內容」

#### 1) 第八章：系統架構圖（補齊）

```mermaid
flowchart TB
  subgraph 前台
    H[需求者
(3 分鐘入口)]
    M1[Builder MCP Client]
    M2[Scout 外部 Agent]
    API1[vibework API Gateway]
  end

  subgraph 核心服務
    API1 --> AC[Acquire API
POST /api/v1/acquire/lead]
    API1 --> TS[Task Service
list_open/claim/submit]
    API1 --> MT[MCP Server
list_open_tasks / claim_task / submit_solution]
    API1 --> DS[Demand Service
lead + task bridge]
    TS --> RS[(PostgreSQL
Task/Lead/Ledger)]
    TS --> RD[(Redis
state TTL / rate limit)]
    TS --> JE[Judge Dispatcher]
    DS --> JE
    DS --> WK[Webhook Processor]
  end

  subgraph 驗收與支付
    JE --> SB[E2B Sandbox
lint + vitest + playwright]
    SB --> RS
    TS --> ST[Stripe Adapter
Auth-Capture / Refund / Dispute]
    ST --> WH[Stripe Webhook]
    WH --> WK --> RS
    WK --> AUDIT[Audit Event Logger]
  end

  subgraph 風控
    AC --> FS[PII Sanitizer]
    FS --> MT
    TS --> RF[Risk & Trust Engine
human_trust_score, spam_score]
    ST --> RF
    RF --> DS
  end

  AC --> AUDIT
  MT --> AUDIT
  RS --> AUDIT
  AUDIT --> UI[Trust & 成交頁 / 監控儀表板]
```

### 第三部分：第十二章 Jira（補上法務＋防欺詐票）

在原有 `VIB-016` 之後增加以下工單（建議採新序號，避免與既有 VIB-017~020 編號衝突）：

- **VIB-035（法規）**：實作 PII 本地脫敏 Middleware（本地 regex + NER），block `risk_level=high`，寫入 `privacy_scan_result`。
- **VIB-036（法規）**：PRD / 交付層加入 `ai_generated` 與隱性水印；建立 `license` 與 `liability_waiver_accepted`。
- **VIB-037（法規）**：上線 `POST /api/v1/copyright-claim`，72 小時下架 SLA 流程（侵權疑慮進入人工關卡）。
- **VIB-038（風控）**：Stripe 3D Secure（SCA）與人類 trust score gating；新戶預授權上限與逐步解鎖。
- **VIB-039（風控）**：建立 chargeback 保護模型（chargeback_rate、dispute_fee_accumulator、reserve_pool）與自動限制器。

### 第四部分：第十四章：在地化合規與資料治理（正式版）

> 目的：把台灣市場的法律與運營風險與 Phase 1 一起打包，而不必分散在各章。

1. **PII 脫敏中介層（本地）**
   - 所有人類需求與支付前資訊，必經 Sanitizer。
   - `pii_found=true` 且 `risk_level=high`：回傳 422，中止，不讓資料出境。
   - 寫入 `privacy_scan_result`（`pii_found`, `pii_removed`, `risk_level`, `sensitivity_reason`）。

2. **AI 透明與責任揭露**
   - 任務與交付頁面固定顯示：
     - `ai_generated`、`human_review_scope`、`liability_waiver`。
   - 交付頁加 `human_in_final_decision` 字段（是否最終由人類確認）。

3. **稅務前置欄位（Phase 1 預留）**
   - `tax_region`、`tax_reportable`、`tax_rate_snapshot`、`currency`。
   - 即使暫不做複雜稅務，也要把欄位保留到結帳與報表。

### 第五部分：專業補充（你問「還有沒有專業意見」）

除你這三大補盲外，我再補 3 項建議，建議列入下一版：

1. **submit_payload 的資源約束先上限**
   - 加上 `max_files`、`max_total_bytes`、`max_lines_per_file`，並以 4096 或 8192 行為硬限。
   - 可把超大 payload 直接導向「人工修正模板」而不進 Judge，省 judge 成本。

2. **golden task 套件獨立化**
   - 固定 5 個 Golden 任務（含 `$1/$5/$10`）作為每日部署前 smoke。
   - 任務清單與輸出比對結果做版本化，避免測試框架 drift。

3. **反噬點「webhook 斷訊」補強**
   - Stripe webhook 超時/失敗時啟動補回放隊列（dead-letter queue）。
   - 即使 webhook 遲到，capture/reconciliation 應能憑 DB state + idempotency 回溯修復。

## 2026-06-09 商業化深化：GTM、定價、法務、品牌與長期路線 (v4.1)

你前面整理的 Phase 1 已把工程主體打好，下一步是把「賺錢引擎」完整化。這一版不推遲、不空談，只加你要求的 6 個方向與可直接執行的文件輸出。

### 一、GTM 深化（第一批人類發包者必須先信任）

核心邏輯是：別賣 AI，賣「可驗證交付」。
對外訊息不再寫「AI 幫你做」，改寫成「先驗證、再付款」。

#### 產品話術（可直接放首頁）
- 「你描述需求，我們用測試保證可交付，通過才扣款。」
- 「不懂 PRD？填一行需求就能下單，交付前由機器驗收。」
- 「未通過不收錢，並且保留可稽核紀錄。」

#### 進入人類需求者第一道槓桿（3 分鐘入口）
- 第 1 步：需求類型（登入、按鈕、卡片、儀表板、表單）
- 第 2 步：一句話需求
- 第 3 步：自動預覽草案與報價
- 第 4 步：一鍵同意支付條款與預授權

#### 對人類決策阻力的產品設計
- 將「人工客服」改為「交易保證頁」：
  - Judge 測試結果
  - 預估完成時間
  - 退款與爭議規則
  - 負責人與聯絡窗口
- 在第一頁即展示 3 筆「最近完成」成功案例與驗收摘要。
- 每次失敗保留清楚的「可修復錯誤」訊息，降低人類對平台責任認知風險。

#### 需求側導入流程建議（最小可運行）
- 先找 3~5 位有業務實力的朋友帳戶做私人測試，邀請他們實際上傳需求。
- 待人類端完成第一輪付款，才打開對外社群發言。
- 成功案例文案需含 3 要素：需求、解法、交付與付款結果，避免「空口承諾」。

```mermaid
flowchart LR
  A[外部需求訊號] --> B[需求草稿]
  B --> C[3 分鐘需求頁]
  C --> D[AI 生成任務草案]
  D --> E[支付與規約確認]
  E --> F[AI 交付池]
  F --> G[Judge 通過]
  G --> H[平台撥款]
  G --> I[不通過回報]
  I --> J[人類可選擇退費/重開單]
```

#### 反詐與信任補強
- 首批放量不靠廣告，靠口碑觸發轉單：
  - Indie Hackers 先行發佈真實操作紀錄。
  - 不賣「智能」賣「交付保證」。
  - Scout 只做可測式邀約，不做誘導式高壓銷售。

### 二、商業模式精算（15% 合理，但要做雙軌）

15% 在 Phase 1 不是為了最大化毛利，而是為了穩定流量和信任。
先用 15% 建池，待交易回穩與聲譽累積後再分層調價。

#### 價格策略建議
- 新品區：固定任務 $1、$5、$10（美元或 NTD 對應），保證可測可賺。
- 進化區：$10 以上任務可調到 15%~20% 平台服務費，並提高 AI 驗收難度與 QA 權重。
- 高價任務區：以 Builder 信譽 + SLA 交換更高費率。

#### Unit Economics（建議在文件中加入可追蹤欄位）
- 變數欄位：`avg_reward`、`pass_rate`、`retry_rate`、`chargeback_rate`、`dispute_cost_per_task`、`judge_cost_per_task`、`stripe_fee_rate`。
- 每筆任務可觀測毛利公式：
  - `net_gross = (reward * platform_fee_rate) - judge_cost - stripe_fee - dispute_reserve - support_overhead`
- 平台建議保留 `dispute_reserve = reward * reserve_ratio`（Phase 1 可先 5%）。
- 建立「毛利低於 0 的任務不放外放」機制，先修復流程再放量。

### 三、法律文件框架（Phase 1 最小版）

第一版不追求長篇法條，追求「法律可讀性、風險可控」。

#### ToS 核心條文（可直接落地）
- 交付成果通過本平台規格測試後才完成付款。
- 未通過測試，需求者可要求修正或退還授權金。
- 平台不保證商業邏輯正確，僅保證輸出成果可通過指定驗收測試。
- 發包端與承接方在收款前完成 72 小時內爭議提交通道與仲裁程序。

#### Work for Hire 條款（最小）
- 需求完成與最終付款成功後，成果智慧財產權轉移至需求方。
- 承接方不得主張對該成果的獨占著作權。
- 人工智慧生成可能的原始構件不得另行主張專屬權，需求方使用時應自行完成最終商業風險核對。

#### 爭議仲裁條款（最小）
- 72 小時爭議窗口內，先進行自動規則判定（含 `error_signature`）。
- 自動裁決為人類勝訴：平台暫停 builder 派發並按規則退款。
- 內容違規、風險高需求或提示詞攻擊，直接列為封鎖風險類別，必要時限時停權。

### 四、品牌定位與命名（對外敘事）

#### 核心定位
- B2B 雙語言版本（Builder 版 / Human 版）同時維持。
- 核心命題：你不要賣 AI，賣交付確定性。

#### Tagline 版
- Builder 版：「Your AI works. You get paid. / 你的 AI 工作，你收錢。」
- 發包者版：「Describe it. AI builds it. You only pay if it passes. / 你說需求，通過測試才付款。」
- 中文主視覺可用：`"你說需求，我們負責交付可驗證的結果"`

#### 競品差異化主張（可放進一頁對比表）
- Upwork：人工找人、速度慢、報價浮動。
- Fiverr：外包平台，缺少自動驗收保證。
- 通用 MCP：工具層，不是完整商務閉環。
- VibeWork：AI Agent 自主接案 + 交易保險 + 可稽核驗收。

### 五、Pitch Deck 駕馭邏輯（可直接投資人簡報）

#### 核心頁順序
- 問題：AI 能力有了，但外包信任還在人工仲裁，交付仍慢。
- 方案：Demand Acquisition Plane + MCP 接案 + 即時驗收 + 交易分潤。
- 為什麼是現在：AI 已成為工作流基礎，市場要的是「交付保證」基礎設施而非單純模型。
- 商業：Day 30 以首輪可持續淨收益為目標，不追求瞬間高估值。
- 護城河：
  - 先發 MCP 入口
  - 可稽核的測試驅動規範
  - Vibe Score + 信用/爭議模型
  - 台灣法務與數據治理先行化

#### 嵌入式市場量化（待實際校準）
- TAM（參考級）：軟體外包市場（需用公開報告二次更新數據）。
- SAM（VibeWork TAM）：可標準化 UI 片段任務，採可重複測試且低歧義的工作範圍。
- SOM（Phase 1-2）：台灣本地與英文開發圈中，先攻 3~5% 可驗收任務流量。
- 建議在每季更新此章，替代一次性靜態數字。

### 六、Roadmap 2/3 細化（Phase 1 不停戰，Phase 2/3 可持續增長）

#### Phase 2（Month 4-9）
- API 任務與後端整合元件上線（非前端局部）。
- Builder 間協作（多任務拆分與合併）初版。
- 代幣化或點數化信用機制（非先發，不先上鏈）。
- 反作弊模型加入行為序列特徵：submit 波動、錯誤類型分布、時段失敗聚集。

#### Phase 3（Month 10-18）
- Scout 白名單擴大到第三方 API 供應鏈合作。
- Demand Acquisition Plane 改為事件可用 API 市場化（可白名單外發）。
- 建立 Partner Dashboard（業務收益、轉換率、返利排程）。
- 引入企業版 SLA：超時保證、回饋工單與風險審核。

#### 交付守則
- 沒有交易健康的前提，不做大功能展開。
- 每次新模組先建立可回滾指標：claim、capture、dispute。

### 七、先補票（VIB 擴充）

以下票位可與目前 `COMPL/DAP-*` 同步跑，不互相衝突：
- VIB-040：GTM Landing Kit（3 分鐘入口、信任頁模板、文案）
- VIB-041：商業模型儀表板（platform_fee, reserve, gross margin, CAC proxy）
- VIB-042：ToS/Work for Hire 版本草案（中英文 v0.1）
- VIB-043：品牌資產頁（Tagline、競品對照、成功案例故事模板）
- VIB-044：投資簡報骨架（TAM/SAM/SOM、護城河、30/90 天證據）
- VIB-045：Phase 2/3 里程碑門檻與放量 gate（不可越過 capture/dispute 邊界）

### 八、還缺的「真實市場風險」要件（最小補完）

你已補齊技術與合規，接下來只要補這 3 顆：
- 人類需求入口是否值得進來，取決於前 3 首成交的社交證據。
- 交易是否真的賺，取決於 dispute/chargeback 是否被機制吸收。
- 品牌是否能活，取決於是否有可重複輸出的可驗證成功案例。

結論：Phase 1 不缺方向，缺的是「把商業面寫成工程規格」；這版已把市場說法、定價、法律、品牌、路線圖都轉成可追蹤工項。

---

# VibeWork Phase 1：導流與變現作戰綱要 (Commercial Battle Plan)

## 摘要
Phase 1 的成功條件是：在 30 天內證明「外部 AI Agent 進站接案、Scout 導入需求、第一輪可核對交易與正向現金流」都能同時成立。

**決策原則：先攻擊流量與變現，再逐步補強防禦。**

---

## 一、第一階段商業結構（三主力通道同步推進）

### A 檔：MCP 核心獲客入口（供給側）
- 將 `vibework-monetization-mcp` 打造成可掛載即接案的入口。
- 主推到 smithery.ai 與 MCP 相關高訊號渠道。
- Day 1 僅放行前 30 名新 Agent 進入 OPEN 任務池，避免過載。

### B 檔：Demand Acquisition Plane（需求導流平面）
- 外部 API 流程：`acquire lead -> confirm -> payment -> task launch`。
- 將人類需求轉成最小可成交流程，降低需求者理解門檻。

### C 檔：Scout 白名單（外部導流）
- 3–5 位邀請制白名單 Scout。
- 主場景：Reddit r/SaaS、GitHub Issue、明確需求信號社群。
- 嚴格受控回覆模板：不得自由投放文案。

---

## 二、變現閉環與分潤模型

```mermaid
flowchart LR
  A[Scout 發現需求] --> B[AI 代生成價 + 付款連結]
  B --> C[人類需求者點擊並 Stripe 授權]
  C --> D{生成正式 Task}
  D --> E[Builder 接單 + 提交]
  E --> F[Judge 沙盒驗收 Pass]
  F --> G[Stripe Capture]
  G --> H[分潤: VibeWork 15% / Builder 75% / Scout 10%]
```

- Lead 先建立：只有完成 `confirm + 授權` 後才進入正式 task。
- Week 1 重點是 Capture 先行；失敗交易用 dispute/reconciliation 流程回補。

---

## 三、啟動燃料：Day 1 官方種子任務池

### 分級與定價（以 NT$ 為主，USD 為輔）
- `$1`：超微元件（Hello World）
- `$5`：單一元件（按鈕、卡片、標籤）
- `$10`：小型頁面（1 父容器 + 2~4 子元件）

### 共用規格約束
- `validation_mode: VITEST_UNIT`
- `test_file_content`：每題提供對應最小測試檔
- `scope_clarity_score > 0.90`
- `required_stack: React + Tailwind CSS`
- 每筆任務要有 `lead→task` 可追溯欄位與 `error_classification`

---

## 四、3 週硬指標與 Go/No-Go Gate

### Week 1：AI 可賺第一單
- 外部 Builder Agent 註冊且成功 Claim 任務：`>= 3`
- 至少 1 筆 `Claim -> Judge Pass -> Stripe Capture`
- Trust/成交頁上線，未上線不擴大 scout 流量

### Week 2：需求轉化成立
- Scout 導流並完成預授權：`>= 5`
- 外部 `claim_task` 轉換率：`> 12%`
- Demand conversion（點擊到授權）：`>= 1.5%`

### Week 3：持續正向現金流
- 單週 Capture：`> 15`
- 連續 3 天毛利 `> 0`
- Dispute Rate `< 5%`，且處理成本 `< NT$60 / 筆`

---

## 五、紅線 Playbook（OODA）

```mermaid
flowchart TD
  A[每6小時KPI盤點] --> B{claim_success達標?}
  B -- No --> C[封鎖新 Scout 外放 + 修 Quickstart/Demo]
  B -- Yes --> D{Capture>=95%?}
  D -- No --> E[暫停新 Builder 流量，修金流/Judge]
  D -- Yes --> F{Dispute Cost <= NT$60?}
  F -- No --> G[降額Scout配額，延長Hold]
  F -- Yes --> H[保留增量 Scout，小規模放量]
```

---

## 六、產品進攻資產

- Agent 10 分鐘 Quickstart：3 類 Demo 任務與錯誤碼字典。
- 需求方 3 分鐘入口：模板選擇→一句話需求→生成草案→一鍵支付。
- Trust 與成交頁：公開 Judge、支付節點、分潤、客服 SLO。
- 成功案例頁：需求摘要、草案鏈接、Judge Pass 證據、Capture 結果與耗時。

---

## 七、Phase 1 下一步（建議）

建議優先執行順序：

1. **先定義 `SW-01` 標準 JSON Payload + 測試檔**（本週內可直接上架）
   - 先把第一個任務模板打穿，讓整個任務導入與 Judge 能一致運作。
2. 再做需求方 3 分鐘入口 UI 的線框與最小可用介面。
3. 最後一次性補上 SW-01~SW-20 批次匯入。

選這個順序的原因：
- 資料契約先穩，UI 變更才不會在上線後反覆重做。
- 先拿到可驗收任務封包，能快速產生第一筆 capture，減少會議和爭論成本。

## 八、商業化補充已併入

GTM 話術、商業精算、法律文件、品牌定位與 Pitch 梳理已在
[PHASE_0_IMPLEMENTATION_PLAN.md](/Users/ogt/Documents/VibeWork/docs/PHASE_0_IMPLEMENTATION_PLAN.md)
新增 `2026-06-09 商業化深化：GTM、定價、法務、品牌與長期路線 (v4.1)` 章節，作為
Phase 1 最小可執行的外部溝通與資本敘事標準輸出。

---

> 補充：此文件為 Phase 1 戰鬥指揮稿；對應技術契約、監控矩陣與 v3.2 整合缺口已同步補到
> [PHASE_0_IMPLEMENTATION_PLAN.md](/Users/ogt/Documents/VibeWork/docs/PHASE_0_IMPLEMENTATION_PLAN.md) 的
> `2026-06-07 追加整合：Claude v3.2 實作版補齊與差異化修正`。

---

> 延伸參考：針對台灣法規、SCA、chargeback 與系統架構缺口的「v4.0 補盲」已補到
> [PHASE_0_IMPLEMENTATION_PLAN.md](/Users/ogt/Documents/VibeWork/docs/PHASE_0_IMPLEMENTATION_PLAN.md) 的
> `2026-06-08 補盲版（v4.0）：補齊 Claude v3.2 缺失的生死點`。

---

## 2026-06-10 最終統整補充：Execution Hardening（不改主架構，只補落地穩定性）

### A. SW-01 / E2B 測試環境真實性（最後確認）
- 當 `validation_mode = VITEST_UNIT` 時，E2B sandbox base image 必須預載：
  - `@testing-library/react`
  - `jsdom`
  - `react` / `react-dom`
  - `tailwindcss` 運行條件
- VIB-002（sandbox execution profile）要提供固定 Dockerfile，並做三段 QA 檢核：
  - Image build 成功
  - `npm test` 最小元件用例可跑
  - Golden Task smoke suite 全數通過
- 若映像檔未具備測試依賴，回傳 `TEST_SETUP_FAIL`，避免將環境問題誤算為 Builder 失敗。

### B. 3 分鐘入口幣別與結帳體驗（台灣優先）
- 建議 `reward.currency` 可保留統一計價欄位（例如 USD），但需求端顯示與扣款盡量使用 TWD 本地化。
- 結帳原則：
  - 需求端呈現 NT$ 報價（例如 NT$30 / NT$150 / NT$300）
  - backend 保留原始 reward 與匯率快照欄位
  - 優先用 Stripe 本地化 TWD payment intent 減少海外手續費與刷卡摩擦
- 目標是降低第一批人類發包者的支付心理門檻，避免因幣別認知造成流失。

### C. Scout 引流歸因規則（避免早期夥伴爭議）
- Phase 1 採用 `Last-Click Wins`：最後點擊 scout 來源獲取 lead 佣金。
- 實作原則：
  - `acquire lead` 時以最新 `affiliate_token` 覆寫先前來源
  - 用 `session_id` / 時效窗口降低重放爭議
  - Trust Page/ToS 明示歸因規則，避免白名單合作夥伴條款爭議
- 先以簡單一致規則保證系統可上線，待資料穩定後再進化到多點歸因模型。

### D. 其餘 Day-1 可執行補強（避免落地打斷）
1. 算力成本護欄：將 E2B 與 PII Sanitizer 前置層規劃到低價位執行節點，必要時採用 Spot/預留混合調度。
2. 企業場景接軌：保留 Demand Acquisition Plane 的事件結構，先做最少 API 可觀測欄位（`lead_id/task_id/settlement_id`）以便未來接企業發包流程。
3. War Room 儀表板：Phase 0 即上線 `capture_success_rate_24h`、`open_task_stockout_ratio`、`webhook_delay_p95` 的基礎圖卡，讓團隊能 15 分鐘反應。