diff --git a/docs/LOGBOOK.md b/docs/LOGBOOK.md index 7c1951ed..64b841b4 100644 --- a/docs/LOGBOOK.md +++ b/docs/LOGBOOK.md @@ -1,4 +1,4 @@ -## 2026-06-13|P2-107 Owner-approved result capture readback / promotion readiness 本地完成 +## 2026-06-13|P2-107 Owner-approved result capture readback / promotion readiness 本地完成與正式驗證 **背景**:P2-106 已把統帥批准後的 result capture 行為固定成 no-write dry-run template、score fixture 與 operator action;但仍缺「批准後 Agent 看過 dry-run / 報告後,如何只讀回查、互判、排隊審核與判斷能否升級」的公開證據。 @@ -13,6 +13,33 @@ - API/service pytest:P2-107、P2-106、P2-105、public redaction 目標測試 `36 passed`。 - Web typecheck:`pnpm --filter @awoooi/web typecheck` 通過。 +**正式部署錨點**: +- Feature commit:`a5b1f355 feat(governance): 新增 owner approved result capture readback`。 +- 接續文案 / mirror commit:`6cf8d3ca fix(web): mirror en messages after governance update`。 +- Deploy markers:`2cc02f1c chore(cd): deploy 6cf8d3c [skip ci]`、`834ccdba chore(cd): deploy bf86017 [skip ci]`;最新正式驗證以 `834ccdba` image / API / Browser readback 為準。 +- P2-107 原 feature CD `#2846` 被後續 main push 取代取消;`bf860177` 補跑 CD 最終回推 `834ccdba`,正式站 API / UI 均已確認 P2-107 可見。 + +**正式站 API readback**: +- `GET /api/v1/health` 回 `status=healthy`、`environment=prod`、`mock_mode=false`。 +- `GET /api/v1/agents/agent-owner-approved-result-capture-readback` 回 `schema_version=ai_agent_owner_approved_result_capture_readback_v1`、`current_task_id=P2-107`、`next_task_id=P2-108`、`overall_completion_percent=100`。 +- 正式 API rollup:readback digest `5`、promotion review `5`、failure lane `4`、reviewer queue preview `4`、operator action `5`。 +- 正式 API 0 / false 邊界:owner approval received、runtime readback generated、promotion approved、reviewer queue write、score write、result capture write、learning write、PlayBook trust write、Gateway queue write、Telegram send、production write、secret value read 與 destructive action 全部維持 `0 / false`。 +- 正式 API 可見值紅線掃描:`工作視窗`、`對話內容`、`批准!繼續`、`In app browser`、`My request for Codex`、`work window transcript`、`internal collaboration transcript`、`raw prompt`、`private reasoning`、`chain of thought`、`authorization header`、`browser context` 全部為 `false`。 +- API evidence:`/tmp/awoooi-p2-107-api-readback-834ccdba.json`。 + +**正式站 Browser smoke**: +- In-app browser mobile URL:`https://awoooi.wooo.work/zh-TW/governance?tab=automation-inventory&_v=834ccdba-p2-107-prod-iab`。 +- viewport readback:`390x844`,`clientWidth=384`、`scrollWidth=384`、`horizontalOverflow=false`。 +- 必要文案可見:`AI Agent 自動化盤點`、`P2-107`、`P2-108`、`P2-107 結果捕捉 readback / promotion readiness`、`readback digest`、`promotion review`、`reviewer queue`、`正式寫入`、`100%`。 +- P2-107 區塊顯示:readback digest `5`、promotion review `5`、failure lane `4`、reviewer queue `4`、操作選項 `5`、已收批准 `0`、runtime 產出 `0`、promotion 核准 `0`、queue 寫入 `0`、正式寫入 `0`。 +- 頁面危險操作控制 `0`;禁用內部協作 / 未脫敏 payload / secret / private reasoning 類字串命中 `0`。 +- Browser evidence:`/tmp/awoooi-p2-107-readback-prod-iab-834ccdba.json`、`/tmp/awoooi-p2-107-readback-prod-iab-834ccdba.png`。 + +**完成度同步**: +- P2-107:本地 `100%`,正式站 `100%`。 +- AI Agent 自動化工作包維持 `93%`;P2-107 完成不代表 runtime learning loop、Telegram receipt、reviewer queue write 或 live writer 已啟用。 +- 下一步仍是 `P2-108` runtime readback approval package;未通過前不得讀 canonical runtime target 或寫入任何 runtime / queue / learning / trust / Telegram。 + **安全邊界**: - P2-107 仍是只讀契約;不讀 canonical runtime target、不寫 reviewer queue、不寫 score、不寫 result capture、不寫 learning、不更新 PlayBook trust、不送 Telegram、不呼叫 Bot API、不啟動 runtime worker、不讀 secret、不執行 destructive action。 - 前端只顯示公開摘要、hash、count、gate 與狀態,不顯示內部協作逐字內容。 diff --git a/docs/ai/AI_AGENT_AUTOMATION_WORKLIST_2026-06-04.md b/docs/ai/AI_AGENT_AUTOMATION_WORKLIST_2026-06-04.md index 873d08a3..f4cf6362 100644 --- a/docs/ai/AI_AGENT_AUTOMATION_WORKLIST_2026-06-04.md +++ b/docs/ai/AI_AGENT_AUTOMATION_WORKLIST_2026-06-04.md @@ -12,7 +12,7 @@ | Nemotron 實際整合應用 | 30% | 完整回放前仍被關卡擋下 | `blocked_needs_evidence`,下一關是 `refresh_source_evidence_then_5_record_smoke_only` | | 工具 / 服務 / 套件 AI 自動化 | 92% | P0 已完成;P1 服務 / runtime / 監控 / provider / service health / 備份 / DR / 套件與供應鏈只讀基線已完成;P1-007 失敗限定通知合約與前端 redaction 合約已完成;下一主線是 P2-004 依賴 / 供應鏈漂移監控 | 狀態分類、盤點 schema、權限矩陣、靜態盤點種子、只讀 API、UI 骨架、驗證、自動化待辦 schema / 快照 / API / 分組 UI、Backup / DR 目標盤點、準備度矩陣、備份通知政策、Backup / DR 證據 UI、復原演練批准包模板、異地 / escrow 準備度狀態、任務批准邊界、確定性進度彙總、Python 套件 / 供應鏈只讀基線、JS pnpm/npm 只讀基線、Docker build surface 只讀基線、CVE / license / drift 嚴重度政策、定期依賴漂移與外部資料來源檢查設計、依賴升級批准包模板、runtime_surface_inventory_v1 schema / snapshot / API / UI、gitea_workflow_runner_health_v1 schema / snapshot / API / UI、observability_contract_matrix_v1 schema / snapshot / API / UI、ai_provider_route_matrix_v1 schema / snapshot / API / UI、service_health_gap_matrix_v1 schema / snapshot / API / UI、service health evidence cards UI、service_health_failure_notification_policy_v1 schema / snapshot / API / UI 已完成 | | OpenClaw / Hermes / NemoTron 佈建布局 | 45% | P1-401 / P1-402 已完成;仍是只讀 layout 與治理頁顯示,不是 runtime deploy | `ai_agent_deployment_layout_v1` schema、`ai_agent_deployment_layout_2026-06-11.json`、`GET /api/v1/agents/agent-deployment-layout`、治理頁自動化盤點 UI、`AI_AGENT_DEPLOYMENT_LAYOUT_2026-06-11.md` | -| OpenClaw / Hermes / NemoTron 主動溝通、學習與成長證據 | 100% | P2-401A 已完成只讀 contract;P2-403A 已完成互動 / 接手 / 學習 / 成長證據面板;P2-403B 已完成 AgentSession / Redis Streams live read model gate;P2-403C 已完成 Redis Streams consumer group dry-run、handoff envelope、ack / dead-letter / replay gate;P2-403D 已完成 learning writeback approval package;P2-403E 已完成 Telegram receipt approval package;P2-403F 已完成 owner-approved learning dry-run preview、人工操作選項與 fixture-only dry-run 總包;P2-403G 已完成 runtime write gate review;P2-403H 已完成 post-write verifier implementation package;P2-403I 已完成 runtime verifier evidence implementation review;P2-403J 已完成報表真相、告警有效性、日週月報、Agent 工作量、圖表化報告、AI 建議與風險自動化政策審查;P2-403K / L / M / N 已把 SRE 戰情室路由、報表派送啟動前閘門、no-write dry-run 與 fixture/readback/verifier dry-run 固定;P2-404 已完成 runtime worker shadow / no-write evidence;P2-101 已完成操作類別權限模型;P2-102 已完成 13 類候選操作 dry-run 證據;P2-103 已完成任務結果稽核軌跡;P2-104 已完成 matched PlayBook 學習缺口回查;P2-105 已完成 critic / reviewer 評分與 result capture 契約;P2-106 已完成 owner-approved result capture dry-run;P2-107 已完成 owner-approved result capture readback / promotion readiness,固定 5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview 與 5 個 operator action。runtime worker、DB migration、production Redis consumer group、canonical runtime readback、runtime score、result capture write、Telegram 實發、delivery receipt E2E、report delivery、reviewer queue write、Gateway queue write、AI analysis runtime、中低風險 auto worker、KM / LOGBOOK / audit DB / timeline / PlayBook trust 寫入、SDK / 付費服務仍未開 gate | `ai_agent_communication_learning_contract_v1`、`ai_agent_interaction_learning_proof_v1`、`ai_agent_operation_permission_model_v1`、`ai_agent_candidate_operation_dry_run_evidence_v1`、`ai_agent_task_result_audit_trail_v1`、`ai_agent_matched_playbook_learning_gap_v1`、`ai_agent_critic_reviewer_result_capture_v1`、`ai_agent_owner_approved_result_capture_dry_run_v1`、`ai_agent_owner_approved_result_capture_readback_v1`、`GET /api/v1/agents/agent-operation-permission-model`、`GET /api/v1/agents/agent-candidate-operation-dry-run-evidence`、`GET /api/v1/agents/agent-task-result-audit-trail`、`GET /api/v1/agents/agent-matched-playbook-learning-gap`、`GET /api/v1/agents/agent-critic-reviewer-result-capture`、`GET /api/v1/agents/agent-owner-approved-result-capture-dry-run`、`GET /api/v1/agents/agent-owner-approved-result-capture-readback`、`/zh-TW/governance?tab=automation-inventory`、MASTER §3.2.1b / §3.2.1d / §3.4.3 | +| OpenClaw / Hermes / NemoTron 主動溝通、學習與成長證據 | 100% | P2-401A 已完成只讀 contract;P2-403A 已完成互動 / 接手 / 學習 / 成長證據面板;P2-403B 已完成 AgentSession / Redis Streams live read model gate;P2-403C 已完成 Redis Streams consumer group dry-run、handoff envelope、ack / dead-letter / replay gate;P2-403D 已完成 learning writeback approval package;P2-403E 已完成 Telegram receipt approval package;P2-403F 已完成 owner-approved learning dry-run preview、人工操作選項與 fixture-only dry-run 總包;P2-403G 已完成 runtime write gate review;P2-403H 已完成 post-write verifier implementation package;P2-403I 已完成 runtime verifier evidence implementation review;P2-403J 已完成報表真相 / 告警有效性 / 日週月報 / Agent 工作量 / 圖表化報告 / AI 建議 / 風險自動化政策審查;P2-403K / L / M / N 已把 SRE 戰情室路由、報表派送啟動前閘門、no-write dry-run 與 fixture/readback/verifier dry-run 固定;P2-404 已完成 runtime worker shadow / no-write evidence;P2-101 已完成操作類別權限模型;P2-102 已完成 13 類候選操作 dry-run 證據;P2-103 已完成任務結果稽核軌跡;P2-104 已完成 matched PlayBook 學習缺口回查;P2-105 已完成 critic / reviewer 評分與 result capture 契約;P2-106 已完成 owner-approved result capture dry-run;P2-107 已完成 owner-approved result capture readback / promotion readiness,固定 5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview 與 5 個 operator action,正式站 deploy marker `834ccdba` 已驗證 API / UI。runtime worker、DB migration、production Redis consumer group、canonical runtime readback、runtime score、result capture write、Telegram 實發、delivery receipt E2E、report delivery、reviewer queue write、Gateway queue write、AI analysis runtime、中低風險 auto worker、KM / LOGBOOK / audit DB / timeline / PlayBook trust 寫入、SDK / 付費服務仍未開 gate | `ai_agent_communication_learning_contract_v1`、`ai_agent_interaction_learning_proof_v1`、`ai_agent_operation_permission_model_v1`、`ai_agent_candidate_operation_dry_run_evidence_v1`、`ai_agent_task_result_audit_trail_v1`、`ai_agent_matched_playbook_learning_gap_v1`、`ai_agent_critic_reviewer_result_capture_v1`、`ai_agent_owner_approved_result_capture_dry_run_v1`、`ai_agent_owner_approved_result_capture_readback_v1`、`GET /api/v1/agents/agent-operation-permission-model`、`GET /api/v1/agents/agent-candidate-operation-dry-run-evidence`、`GET /api/v1/agents/agent-task-result-audit-trail`、`GET /api/v1/agents/agent-matched-playbook-learning-gap`、`GET /api/v1/agents/agent-critic-reviewer-result-capture`、`GET /api/v1/agents/agent-owner-approved-result-capture-dry-run`、`GET /api/v1/agents/agent-owner-approved-result-capture-readback`、`/zh-TW/governance?tab=automation-inventory`、MASTER §3.2.1b / §3.2.1d / §3.4.3 | | AI Agent 主動營運委派與版本生命週期 | 100% | P2-402A / P2-402B / P2-402C / P2-402D / P2-402E / P2-402F / P2-402G 已完成;已建立 repo-only 版本新鮮度快照、工具採用批准包、Telegram action-required digest policy、Gitea PR 草案 lane、host / K3s / stateful 版本只讀盤點、API 與 governance UI。定期排程、外部版本查詢、工具安裝、CI 變更、套件升級、主機更新、container pull、實際 PR creation、auto merge、Telegram 實發、SSH、kubectl、重啟仍未開 gate | `ai_agent_proactive_operations_contract_v1`、`ai_agent_version_freshness_snapshot_v1`、`ai_agent_tool_adoption_approval_package_v1`、`ai_agent_telegram_action_required_digest_policy_v1`、`ai_agent_gitea_pr_draft_lane_v1`、`ai_agent_host_stateful_version_inventory_v1`、`GET /api/v1/agents/agent-proactive-operations-contract`、`GET /api/v1/agents/agent-version-freshness-snapshot`、`GET /api/v1/agents/agent-tool-adoption-approval-package`、`GET /api/v1/agents/agent-telegram-action-required-digest-policy`、`GET /api/v1/agents/agent-gitea-pr-draft-lane`、`GET /api/v1/agents/agent-host-stateful-version-inventory`、`/zh-TW/governance?tab=automation-inventory`、MASTER §3.2.1c | | 本工作清單與分析報告 | 100% | 已完成 | 本 MD 文件 | @@ -20,7 +20,7 @@ AI Agent 自動化工作包目前完成度:**93%**。本工作清單文件本 三 Agent 佈建布局目前完成度:**45%**。第一波已完成只讀 schema / snapshot / API / 測試 / 報告,第二波已接入治理頁自動化盤點 UI;正式 runtime 佈署、Telegram E2E 發送與 AgentSession 工作流仍需逐項 gate。 -三 Agent 主動溝通、學習與成長證據目前完成度:**100%**。已完成只讀契約、互動 / 接手 / 學習 / 成長證據面板、P2-403B live read model gate、P2-403C Redis dry-run gate、P2-403D learning writeback approval package、P2-403E Telegram receipt approval package、P2-403F owner-approved learning dry-run preview、P2-403G runtime write gate review、P2-403H post-write verifier implementation package、P2-403I runtime verifier evidence implementation review、P2-403J 報表真相 / 告警有效性 / 日週月報 / Agent 工作量 / 圖表化報告 / AI 建議 / 風險自動化政策審查、P2-403K/L/M/N 報表與 SRE 戰情室 dry-run 鏈、P2-404 runtime worker shadow / no-write execution evidence gate、P2-101 操作類別權限模型、P2-102 候選操作 dry-run 證據、P2-103 任務結果稽核軌跡、P2-104 matched PlayBook 學習缺口回查、P2-105 critic / reviewer 評分與 result capture 契約、P2-106 owner-approved result capture dry-run,以及 P2-107 owner-approved result capture readback / promotion readiness;目前 live AgentSession、Agent message、handoff、canonical runtime readback、runtime score、result capture write、learning write、Telegram receipt、Gateway queue write、reviewer queue write、runtime verifier execution、report delivery、AI analysis runtime、中低風險 auto worker、Telegram 實發、shadow worker live、delivery receipt E2E、KM / LOGBOOK / audit DB / timeline / PlayBook trust runtime 寫入仍全部為 `0`。P2-107 已固定 5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview 與 5 個 operator action;真正下一步是 `P2-108`。 +三 Agent 主動溝通、學習與成長證據目前完成度:**100%**。已完成只讀契約、互動 / 接手 / 學習 / 成長證據面板、P2-403B live read model gate、P2-403C Redis dry-run gate、P2-403D learning writeback approval package、P2-403E Telegram receipt approval package、P2-403F owner-approved learning dry-run preview、P2-403G runtime write gate review、P2-403H post-write verifier implementation package、P2-403I runtime verifier evidence implementation review、P2-403J 報表真相 / 告警有效性 / 日週月報 / Agent 工作量 / 圖表化報告 / AI 建議 / 風險自動化政策審查、P2-403K/L/M/N 報表與 SRE 戰情室 dry-run 鏈、P2-404 runtime worker shadow / no-write execution evidence gate、P2-101 操作類別權限模型、P2-102 候選操作 dry-run 證據、P2-103 任務結果稽核軌跡、P2-104 matched PlayBook 學習缺口回查、P2-105 critic / reviewer 評分與 result capture 契約、P2-106 owner-approved result capture dry-run,以及 P2-107 owner-approved result capture readback / promotion readiness;P2-107 正式站已由 deploy marker `834ccdba` 驗證 API / UI。目前 live AgentSession、Agent message、handoff、canonical runtime readback、runtime score、result capture write、learning write、Telegram receipt、Gateway queue write、reviewer queue write、runtime verifier execution、report delivery、AI analysis runtime、中低風險 auto worker、Telegram 實發、shadow worker live、delivery receipt E2E、KM / LOGBOOK / audit DB / timeline / PlayBook trust runtime 寫入仍全部為 `0`。P2-107 已固定 5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview 與 5 個 operator action;真正下一步是 `P2-108`。 AI Agent 主動營運委派與版本生命週期目前完成度:**100%**。已完成 12 類版本 domain、24 類可委派能力、5 種 cadence、8 類 MCP、4 類 RAG memory、只讀 API、`P2-402B` repo-only daily version freshness snapshot、`P2-402C` Renovate / OSV-Scanner / Trivy / Syft / Grype 工具採用批准包、`P2-402D` Telegram action-required digest policy、`P2-402E` Gitea PR 草案 lane、`P2-402F` host OS / K3s / stateful services 版本只讀盤點,以及 `P2-402G` governance UI 顯示可委派能力;`P2-403A` 到 `P2-107` 已補互動、學習證據面、live read model gate、Redis dry-run gate、learning writeback approval package、Telegram receipt approval package、owner-approved learning dry-run preview、runtime write gate review、post-write verifier package、runtime verifier evidence review、報表真相、TG 戰情室收斂、日週月報、Agent 工作量、圖表化報告、風險自動化政策、報表 runtime 啟動前閘門、no-write dry-run 證據包、fixture/readback/verifier dry-run 證據包、shadow/no-write execution gate、操作類別權限模型、13 類候選操作 dry-run 證據、任務結果稽核軌跡、matched PlayBook 學習缺口、critic / reviewer result capture、owner-approved result capture dry-run 與 owner-approved result capture readback / promotion readiness。下一步是 `P2-108`;外部 registry / package source / host probe / SSH / kubectl / 工具安裝 / CI 變更 / 實際 PR creation / Telegram 實發與 learning write 仍需 gate。 @@ -979,7 +979,7 @@ UI: | P2-104 | 完成 | 100 | OpenClaw + Hermes + NemoTron | 修復 `matched_playbook_id` 學習缺口 | `ai_agent_matched_playbook_learning_gap_v1` / snapshot / 只讀 API / governance UI;正式 DB 只讀回查確認 24h approval `66`、matched `66`、matched rate `100%`、approved without execution meta `63`、pending matched `2`、execution failed matched `1`、PlayBook updated_24h `0`;5 條 gap lane、5 個 learning gate、4 個 writeback candidate | 已由 P2-105 承接;不寫 learning、不更新 PlayBook trust、不送 Telegram、不寫 Gateway queue、不讀 secret | | P2-105 | 完成 | 100 | OpenClaw + Hermes + NemoTron | 批准前加入 critic / reviewer 評分 | `ai_agent_critic_reviewer_result_capture_v1` / snapshot / 只讀 API / governance UI;5 張 Agent scorecard、5 個 result capture contract、6 個 promotion gate、4 條 candidate route;approved gap `63`、failed candidate `1`;runtime score / result capture write / learning / trust / queue / Telegram 全為 `0` | 已由 P2-106 承接;不寫 score、不寫 result capture、不寫 learning、不更新 PlayBook trust、不送 Telegram | | P2-106 | 完成 | 100 | OpenClaw + Hermes + NemoTron | owner-approved result capture dry-run | `ai_agent_owner_approved_result_capture_dry_run_v1` / schema / snapshot / 只讀 API / governance UI;5 個 no-write result capture template、5 個 score fixture、7 個 dry-run gate、5 個 operator action;owner approval received、preview generated、score / result capture / learning / trust / queue / Telegram 全部 `0` | 已由 P2-107 承接;不啟動 live write、不送 Telegram、不更新 PlayBook trust | -| P2-107 | 完成 | 100 | OpenClaw + Hermes + NemoTron | owner-approved result capture readback / promotion readiness | `ai_agent_owner_approved_result_capture_readback_v1` / schema / snapshot / 只讀 API / governance UI;5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview、5 個 operator action;owner approval received、readback generated、promotion approved、reviewer queue write、score / result capture / learning / trust / queue / Telegram 全部 `0` | 下一步 P2-108;不讀 canonical runtime target、不寫 reviewer queue、不啟動 live writer | +| P2-107 | 完成 | 100 | OpenClaw + Hermes + NemoTron | owner-approved result capture readback / promotion readiness | `ai_agent_owner_approved_result_capture_readback_v1` / schema / snapshot / 只讀 API / governance UI;正式站 deploy marker `834ccdba` 已驗證;5 個 readback digest、5 個 promotion review、4 條 failure lane、4 個 reviewer queue preview、5 個 operator action;owner approval received、readback generated、promotion approved、reviewer queue write、score / result capture / learning / trust / queue / Telegram 全部 `0` | 下一步 P2-108;不讀 canonical runtime target、不寫 reviewer queue、不啟動 live writer | ### P3 - 候選 Agent 擴展