Some checks failed
Code Review / ai-code-review (push) Successful in 13s
CD Pipeline / tests (push) Successful in 1m39s
CD Pipeline / build-and-deploy (push) Successful in 4m35s
CD Pipeline / post-deploy-checks (push) Successful in 1m51s
Ansible / Reboot Recovery Contract / validate (push) Has been cancelled
71 lines
4.8 KiB
Markdown
71 lines
4.8 KiB
Markdown
# AI 技術雷達與滾動更新讀回
|
||
|
||
- 產生時間:`2026-06-25T03:56:51.751955+00:00`
|
||
- 整體治理完成度:`42.2%`
|
||
- AI 技術雷達來源成功率:`100.0%`
|
||
- 監控技術項目:`20`
|
||
- 技術領域:`6`
|
||
- 官方 / primary sources:`47`
|
||
- 來源失敗:`0`
|
||
- 需要審核變更:`0`
|
||
- 高優先級項目:`14`
|
||
- 滾動更新狀態:`near_real_time_watch_ready_integration_gated`
|
||
|
||
## 技術領域覆蓋
|
||
|
||
| 技術領域 | 技術數 | 高優先級 | 需要審核 | 代表技術 |
|
||
|---|---:|---:|---:|---|
|
||
| `agent_frameworks` | `6` | `5` | `0` | OpenAI Agents SDK, NVIDIA Nemotron + NeMo Agent Toolkit, LangGraph, Google Agent Development Kit |
|
||
| `evaluation_and_observability` | `2` | `2` | `0` | Ragas, Langfuse |
|
||
| `mcp_and_a2a` | `2` | `2` | `0` | Model Context Protocol SDK, Agent2Agent Protocol |
|
||
| `model_providers` | `3` | `3` | `0` | OpenAI Model Platform, Anthropic Claude Platform, Google Gemini Platform |
|
||
| `model_serving` | `2` | `0` | `0` | Hugging Face Text Generation Inference, vLLM |
|
||
| `rag_and_vector` | `5` | `2` | `0` | LlamaIndex, LangChain, pgvector, Qdrant |
|
||
|
||
## 高優先級審核佇列
|
||
|
||
| 技術 | 領域 | 優先級 | Gate | 下一步 |
|
||
|---|---|---|---|---|
|
||
|
||
## Agent 專業分工
|
||
|
||
| Agent | 專業角色 | 自動化範圍 | 需要審核的邊界 |
|
||
|---|---|---|---|
|
||
| OpenClaw | 生產決策仲裁者、風險分級與最後 policy guard | 維持現有 production baseline、讀取 replay / shadow 評分、拒絕無證據替換 | 任何取代、降級、生產路由切換都必須通過 replay / shadow / canary 與人工批准。 |
|
||
| NemoTron | 離線回放評估者、模型能力比較、合約輸出 smoke gate | 只讀 request pack、比對候選輸出、產生 replay scorecard 草稿 | 不得自行呼叫外部 NIM/API、不得讀 labels 作答、不得進生產路由。 |
|
||
| Hermes | 知識管理、RAG 整理、報告草稿與長期技能庫維護 | 整理 primary source 摘要、建立 no-send 日週月報、準備人審包 | 不得同步 raw chat history、不得保存 secret、不得直接發 Telegram live report。 |
|
||
| MarketRadar | AI 技術市場雷達、版本監控、來源失敗偵測 | 每 6 小時只讀 primary sources、產生 freshness / review queue | 不得自動新增 SDK、不得自動修改 provider route 或 workflow 行為。 |
|
||
| Critic / Reviewer | 獨立審核、反例檢查、整合風險評分 | 檢查政策旗標、來源可靠性、成本與資安風險 | 只能輸出 blocked / candidate / owner_review,不得直接執行寫入。 |
|
||
|
||
## 滾動更新控制
|
||
|
||
| 節奏 | Agent 可自動做什麼 | 輸出 | Gate |
|
||
|---|---|---|---|
|
||
| 每 6 小時 | 讀取官方文件、PyPI、npm、GitHub release、primary source hash。 | AI 技術 watch report、來源失敗清單、review queue。 | `read_only_only` |
|
||
| 每日 | 依 business applicability、成本、依賴、資安、AWOOOI fit 分類。 | 日報摘要與中低風險自動處理建議。 | `no_send_report_until_delivery_gate` |
|
||
| 每週 | 刷新 scorecard,決定 sandbox / replay / adapter design 優先級。 | 週報、優先序、候選整合審查包。 | `scorecard_required_before_replay` |
|
||
| 每月 | 彙整趨勢,提出 roadmap / watch-only / retire 建議。 | 月報與策略審核包。 | `human_review_for_strategy_or_production_change` |
|
||
|
||
## 優先工作清單
|
||
|
||
| 順序 | 工作 | 優先級 | 自動化模式 | 完成定義 |
|
||
|---:|---|---|---|---|
|
||
| 1 | AI 技術雷達 primary source 監控產品化 | `P0` | `agent_auto_read_only` | API、snapshot、Markdown、schema、測試與 production readback 都能顯示技術領域、來源與 Gate。 |
|
||
| 2 | 近即時版本 / release / docs 變更偵測 | `P0` | `agent_auto_schedule_read_only` | 每 6 小時可跑 watch;失敗來源會進日報,不會自動整合。 |
|
||
| 3 | OpenClaw / Hermes / NemoTron / MarketRadar 專業分工與成長紀錄 | `P0` | `agent_auto_read_model_human_review_for_write` | 每個 Agent 的角色、輸出、學習寫回與限制都能被前端讀回。 |
|
||
| 4 | AI 技術 scorecard 與 sandbox / replay 優先級 | `P1` | `agent_propose_owner_review` | 高優先級變更先進 scorecard,再進 no-cost/no-write sandbox 或 replay 計畫。 |
|
||
| 5 | Telegram Bot 報告與高風險審核橋接 | `P1` | `blocked_until_telegram_send_gate` | 低中風險只告警回報;高風險需 owner approval 後才可發送或執行。 |
|
||
| 6 | 新 AI 技術探索與 watchlist 擴充 | `P2` | `agent_auto_discover_human_classify` | GitHub topic / package registry / 官方 blog 可提出候選,但加入正式 watchlist 前需審核。 |
|
||
|
||
## 仍被 Gate 擋下
|
||
|
||
- `sdk_installation_approved=false`
|
||
- `paid_api_calls_approved=false`
|
||
- `production_routing_approved=false`
|
||
- `telegram_send_approved=false`
|
||
- `model_provider_switch_approved=false`
|
||
- `host_write_approved=false`
|
||
- `openclaw_replacement_approved=false`
|
||
- `replay_shadow_canary_gate_required=true`
|
||
- `cost_and_data_boundary_review_required=true`
|