2026 年 4 月 8 日,Anthropic 正式推出 Claude Managed Agents 公開測試版。 企業不需要自建基礎架構,就能在 Anthropic 的雲端上部署可連續執行數小時的自主 AI Agent。官方宣稱開發時程從「數月壓縮到數週」——而 Notion、Rakuten、Asana 已經在生產環境裡跑了。
這不只是又一個 API 更新,而是 Anthropic 在 Agentic AI 浪潮 中搶下「Agent 基礎架構」入口的戰略佈局。
🔑 5 個關鍵重點
- Claude Managed Agents 是 Anthropic 的全託管 Agent 平台——沙箱、工具編排、錯誤復原、session 管理全包
- 用自然語言或 YAML 定義 Agent,不需要自建 agent loop 或執行環境
- 架構將 Brain(推理)、Hands(執行)、Session(狀態) 三層解耦,靈感來自作業系統虛擬化
- Notion、Rakuten、Asana、Sentry、Vibecode 已投入生產使用
- 定價:標準 API token 費 + $0.08 / 每 session 小時(毫秒計費),網頁搜尋 $10 / 千次
🤔 什麼是 Claude Managed Agents?先搞懂「Agent」和「託管」
AI Agent 是什麼?(給完全沒接觸過的人)
傳統的 ChatGPT、Claude 對話是「你問一句,AI 答一句」。AI Agent 不一樣——你給它一個目標,它自己決定要用哪些工具、按什麼順序執行、遇到錯誤怎麼處理。
舉例:你說「幫我分析這份 CSV 報表,找出異常值,畫成圖表,寫一份摘要 email 給老闆」。
- ❌ 傳統 AI:你得自己一步一步餵資料、調提示、複製貼上
- ✅ AI Agent:它自動讀檔、跑 Python 分析、用 matplotlib 畫圖、生成 email——全部自主完成
那「Managed」是什麼意思?
過去你要讓 AI Agent 跑起來,需要自己處理一大堆基礎架構:
| 你要自己蓋的東西 | 難度 | 說明 |
|---|---|---|
| 沙箱隔離 | 🔴 高 | Agent 會執行程式碼,你得確保它不會搞壞你的伺服器 |
| Agent 迴圈 | 🟡 中 | 推理 → 呼叫工具 → 取得結果 → 再推理⋯⋯這個迴圈要自己寫 |
| Session 管理 | 🟡 中 | Agent 跑到一半斷線怎麼辦?狀態存哪裡? |
| 錯誤復原 | 🟡 中 | 工具呼叫失敗、API 逾時、token 超量——每種都要處理 |
| 認證與安全 | 🔴 高 | Agent 需要存取外部服務,但 API key 不能外洩 |
Managed Agents 把上面全部包辦了。 開發者只需要定義:
- Agent 的角色和指令(system prompt)
- 它可以用哪些工具
- 環境設定(要裝什麼套件、能不能連網)
💡 一句話理解 如果 Messages API 是「自己組裝電腦」,Managed Agents 就是「買一台預裝好的工作站,插電就能用」。你放棄了一些客製化彈性,但換到的是幾週內上線,而不是幾個月。
🏗️ 核心架構深度解析:Brain / Hands / Session 三層解耦
這是 Managed Agents 最值得技術人員關注的設計。Anthropic 工程團隊(Lance Martin、Gabe Cemaj、Michael Cohen)在技術文章中揭示了架構哲學——靈感來自作業系統的硬體虛擬化。
三層是什麼?
| 層級 | 角色 | 技術細節 |
|---|---|---|
| 🧠 Brain | 推理層 | Claude 模型 + harness,無狀態設計,可水平擴展。介面:execute(name, input) → string |
| 🤲 Hands | 執行層 | 沙箱容器、MCP 伺服器、外部工具。按需啟動,未使用不佔資源。介面:provision({resources}) |
| 📋 Session | 狀態層 | append-only 事件日誌,獨立於 Claude 的 context window。介面:wake(sessionId), getEvents() |
為什麼要解耦?三個關鍵好處
1. 獨立容錯
Brain 掛了?Session 日誌還在。系統自動喚醒一個新的 Brain 實例,從事件日誌中恢復上下文,繼續執行。使用者完全無感。
傳統做法是 Brain 和 Hands 綁在一起——一個掛了全部重來。
2. 彈性擴展
- 一個 Brain 可以操作多個 Hands(同時讀檔案 + 跑程式 + 查網頁)
- 多個 Agent 可以共用同一個 Hand(節省容器資源)
- Brain 和 Hands 可以在不同機器上,不假設位置
3. 延遲大幅降低
Anthropic 公布的數據:
| 指標 | 改善幅度 |
|---|---|
| p50 首 token 回應時間(TTFT) | ~60% 改善 |
| p95 首 token 回應時間(TTFT) | >90% 改善 |
原因:容器只在工具呼叫時才啟動,不需要預先配置。大多數推理請求根本不碰容器,直接省掉了啟動延遲。
🔧 技術觀點 Session 的 append-only 事件日誌設計特別聰明——它讓 context window 管理變成一個可組合的問題。harness 可以對事件流做正向、反向、切片查詢,在送給 Claude 之前先做轉換(例如壓縮舊事件、移除冗餘工具輸出)。這意味著 Managed Agents 可以跑遠超 context window 限制的長任務,而不需要開發者自己實作 context 管理。
🔧 四大核心概念:Agent、Environment、Session、Events
1. Agent(代理人定義)
定義模型版本、system prompt、可用工具、MCP 伺服器和技能。建立一次,透過 ID 跨 session 重複使用。
這解決了一個常見痛點:過去每次啟動 agent 都要重新傳完整設定,現在是一次定義、到處引用。
2. Environment(執行環境)
設定雲端容器模板:
- 預裝語言和套件(Python、Node.js、Go 等)
- 網路存取規則(白名單 / 黑名單)
- 掛載檔案(專案程式碼、資料集)
3. Session(工作階段)
啟動一個 session,指定要用哪個 Agent 和 Environment。Session 擁有:
- 持久化檔案系統——Agent 建立的檔案不會消失
- 完整對話歷史——中斷後可從斷點繼續
- 事件日誌——所有操作可追溯
4. Events(事件通訊)
你的應用和 Agent 之間透過事件溝通:
- 送出使用者訊息(user turn)
- 接收工具執行結果和狀態更新
- 透過 SSE(Server-Sent Events) 即時串流回應
- 可中途介入——送新的 user event 修正方向,或直接中斷 Agent
💡 這對開發者意味著什麼? 你不用再寫
while True: response = claude.send(); if response.tool_call: result = execute(tool); claude.send(result)這種 agent loop 了。Managed Agents 的 harness 內建了整個迴圈,包括 prompt caching、context compaction 等效能優化。
🛡️ 安全機制:為什麼企業敢把 API Key 交給 AI Agent?
安全性是企業導入 AI Agent 最大的顧慮。Managed Agents 的安全設計是產品核心,不是事後加的:
Credential 永遠不碰生成的程式碼
這是最關鍵的設計決策:
- Git 憑證:在沙箱初始化時注入,Agent 產生的程式碼看不到
- OAuth Token:存在安全保管庫(vault),透過 proxy 存取——Agent 只能「使用」token,不能「讀取」token
- Session 級別綁定:每個 token 只在對應的 session 中有效
其他安全機制
| 機制 | 說明 |
|---|---|
| 沙箱隔離 | 每個 session 在獨立容器中執行,互不影響 |
| Scoped 權限 | 每個 Agent 的權限範圍明確定義,最小權限原則 |
| 執行追蹤 | 所有工具呼叫和操作記錄可供稽核 |
| Checkpoint | 中斷後可從斷點復原,不遺失進度也不重複執行 |
| 網路管控 | Environment 層級控制 Agent 能存取哪些外部服務 |
💼 誰在用?五大早期導入企業與應用場景
| 企業 | 產業 | 應用場景 | 為什麼用 Managed Agents |
|---|---|---|---|
| Notion | 生產力軟體 | 內容自動化、知識庫管理 | Agent 需要長時間處理大量文件 |
| Rakuten | 電商 | 商務流程自動化 | 跨系統整合需要持久 session |
| Asana | 專案管理 | 工作流自動化 | Agent 需要追蹤複雜的任務依賴 |
| Sentry | 開發工具 | 程式碼自動修復、錯誤分析 | 需要沙箱環境安全執行程式碼 |
| Vibecode | 開發平台 | AI 輔助開發 | 需要 MCP 整合多種開發工具 |
實測效能
Anthropic 公布的數據顯示:
- 在結構化檔案生成任務上,Managed Agents 的成功率比標準 prompting 方式提升多達 10 個百分點
- 從概念到生產部署的時間壓縮 10 倍
💰 定價完整拆解:一個 Agent 跑一小時花多少錢?
計費項目
| 項目 | 費用 | 說明 |
|---|---|---|
| 模型 token | 依標準 API 定價 | Claude Opus 4.6:$15/M input, $75/M output |
| Agent 執行時間 | $0.08 / session 小時 | 以毫秒為單位計費,閒置不收費 |
| 網頁搜尋 | $10 / 1,000 次搜尋 | Agent 使用 web search 工具時觸發 |
實際成本試算
假設一個 Agent 執行以下任務:「分析一份 50 頁報告,擷取關鍵數據,生成摘要,產出 3 份格式不同的輸出檔案」
| 項目 | 預估用量 | 費用 |
|---|---|---|
| 執行時間 | ~15 分鐘(0.25 小時) | $0.02 |
| Input token | ~100K tokens | $1.50(Opus 4.6) |
| Output token | ~20K tokens | $1.50(Opus 4.6) |
| 網頁搜尋 | 0 次 | $0 |
| 合計 | ~$3.02 |
💡 成本觀點 毫秒計費是關鍵差異。Agent 等待工具回應的閒置時間不收錢。相比之下,如果你自己在 AWS 上跑 agent 容器,EC2 是按小時計費的——閒置一樣燒錢。
⚡ Messages API vs. Managed Agents:技術選型指南
| 考量 | Messages API | Managed Agents |
|---|---|---|
| 控制粒度 | 完全掌控每一步 | 交給 harness 自動處理 |
| 適合場景 | 自建 agent loop、即時互動 | 長時間任務、批次處理、非同步工作 |
| 基礎架構 | 自己處理 | Anthropic 全包 |
| Session 管理 | 自己實作 | 內建持久化 + checkpoint |
| 工具執行 | 自己串接 | 內建 Bash、檔案操作、網頁搜尋、MCP |
| Context 管理 | 自己處理 compaction | 內建 prompt caching + compaction |
| 開發時間 | 數週到數月 | 數天到數週 |
| 適合團隊 | 有 AI infra 經驗的工程團隊 | 想快速驗證 agent 應用的團隊 |
選擇建議:
- 你的 Agent 需要跑超過幾分鐘 → Managed Agents
- 你需要沙箱環境安全執行程式碼 → Managed Agents
- 你的團隊沒有 DevOps 資源蓋 agent 基礎架構 → Managed Agents
- 你需要每一步都精準控制、或做即時聊天 → Messages API
- 你已經有自己的 agent framework(LangChain、CrewAI) → Messages API
🔮 研究預覽功能:Multi-Agent 協調、Outcomes、Memory
以下功能目前為 research preview,需要另外申請存取:
Multi-Agent 協調
一個「主 Agent」可以啟動多個「子 Agent」,各自負責不同子任務。例如:
- 主 Agent:接收「產出市場分析報告」的指令
- 子 Agent A:蒐集產業數據
- 子 Agent B:分析競爭對手
- 子 Agent C:生成圖表和視覺化
- 主 Agent:整合所有結果,產出最終報告
這和 MCP(Model Context Protocol) 的「工具標準化」思路一脈相承——先標準化單一 Agent 的工具介面,再標準化 Agent 之間的協作介面。
Outcomes(預期結果定義)
讓 Agent 有更明確的成功標準——不只是「做完」,而是「做對」。
Memory(跨 Session 記憶)
Agent 可以記住之前 session 的上下文。想像一個 code review Agent,它記得這個 repo 的 coding style、過去 review 過的模式——每次 review 品質會越來越好。
🌍 2026 Agent 平台戰:Anthropic vs. OpenAI vs. Google
Claude Managed Agents 不是在真空中推出的。2026 年是「Agent 平台」元年,三巨頭同時佈局:
| Claude Managed Agents | OpenAI Codex / Agents SDK | Google ADK + Vertex AI Agent Engine | |
|---|---|---|---|
| 推出時間 | 2026 年 4 月(公測) | 2026 年 4 月(Codex 公測) | 2026 年 3 月(ADK GA) |
| 核心定位 | 全託管 Agent 執行平台 | 程式碼任務 + 輕量 Agent 框架 | 企業級多語言 Agent 平台 |
| 基礎架構 | Anthropic 雲端全託管 | OpenAI 託管(Codex)/ 自建(SDK) | Google Cloud 全託管 |
| 獨特優勢 | 三層解耦架構、Credential 隔離 | 語音支援、模型可切換 | 多語言 SDK(Python/TS/Java/Go)、A2A Agent Cards |
| MCP 支援 | ✅ 原生支援 | ✅ 支援 | ✅ 支援 |
| 最適合 | 需要安全沙箱的長時間 Agent 任務 | 程式碼生成、開發者生產力 | 已在 Google Cloud 的企業 |
| 計費方式 | token + $0.08/hr runtime | token + runtime(Codex) | token + Vertex AI 資源費 |
各平台的戰略意圖
- Anthropic:用安全性和架構設計差異化,吸引對安全要求高的企業(金融、醫療、法律)
- OpenAI:用 Codex 延伸 ChatGPT 的開發者生態系,用 Agents SDK 的輕量級吸引想自建的團隊
- Google:用 GCP 生態系鎖定(Vertex AI + BigQuery + Cloud Run),多語言 SDK 降低遷移成本
🧭 產業觀察 這場 Agent 平台戰的本質是**「誰來當 AI Agent 時代的 AWS」**。正如 2000 年代 AWS 定義了雲端運算的基礎架構,2026 年的 Agent 平台商正在定義 AI Agent 的基礎架構。Gartner 預測 2026 底 40% 企業整合 AI Agent——平台供應商要搶的就是這 40% 的入口。
📊 這會對產業造成什麼影響?
對開發者的影響
| 變化 | 以前 | 以後 |
|---|---|---|
| 部署 Agent | 需要 DevOps 團隊蓋容器、管安全 | 定義 YAML + 按下啟動 |
| Agent 迴圈 | 自己寫幾百行 orchestration 程式碼 | 平台內建 |
| 長時間任務 | 自己處理斷線重連、state 管理 | Session 自動持久化 |
白話說: 以前「會做 AI Agent」需要同時懂 ML、後端、DevOps 三種技能。現在只要懂怎麼寫好的 prompt 和選對工具,就能部署生產級 Agent。
對企業的影響
- 自動化範圍擴大:以前只有技術團隊能用 AI Agent,現在 HR、財務、法務都可以透過自然語言定義自己的 Agent
- 安全合規更容易:Credential 隔離、執行追蹤、scoped 權限——這些原本要自己蓋的安全機制現在是內建的
- 供應商鎖定風險:選了 Anthropic 就綁定了它的 Agent 平台。MCP 的開放標準能緩解部分風險,但 Session 管理和 Environment 配置仍是專有的
對就業市場的影響
- 新崛起:「Agent 架構師」——設計 Agent 的行為、工具組合和安全策略
- 需求降低:純 DevOps / 基礎架構工程師(Agent 平台吃掉了一部分工作)
- 需求不變:理解業務邏輯的人——AI Agent 能自動執行,但「要它做什麼」仍需人類判斷
對 AI 產業的影響
Agent 平台的出現代表 AI 產業正式進入「基礎建設層」競爭。這和過去幾年的「模型效能競賽」(誰的 benchmark 高)是不同層級的戰爭:
- 模型層:Claude vs. GPT vs. Gemini(比誰聰明)
- 平台層:Managed Agents vs. Codex vs. Vertex AI Agent Engine(比誰好用、誰更安全、誰的生態系更完整)
平台層的贏家不一定是模型層的贏家。 AWS 不是做晶片最好的公司,但它定義了雲端時代的規則。
❓ FAQ
Claude Managed Agents 和 Claude Code 有什麼不同?
Claude Code 是面向開發者的 CLI / IDE 工具,在本機或 IDE 中互動式運行,適合即時的程式碼編寫與除錯。
Managed Agents 是雲端託管的 Agent 執行平台,適合長時間運行的非同步任務和企業級自動化部署。
兩者可以互補:用 Claude Code 互動開發 → 驗證可行後 → 用 Managed Agents 部署成自動化工作流。Anthropic 也明確要求合作夥伴不得將 Managed Agents 品牌化為「Claude Code」。
需要寫程式才能用 Claude Managed Agents 嗎?
目前主要透過 API 和 Claude Console 操作,需要基本的技術能力。但 Agent 可以用自然語言定義(不一定要寫 YAML),這大幅降低了入門門檻。
未來 Console 的 UI 預計會更完善,讓非技術人員也能建立簡單的 Agent。
Managed Agents 的資料安全性如何?企業能信任嗎?
三層安全保障:
- 沙箱隔離:每個 session 在獨立容器中執行
- Credential 隔離:API key、OAuth token 透過 vault + proxy 機制保護,Agent 產生的程式碼永遠碰不到原始 token
- 權限管控:scoped permissions + 執行追蹤,所有操作可稽核
對於受監管產業(金融、醫療),執行追蹤功能特別重要——可以完整回溯 Agent 做了什麼、為什麼這樣做。
Multi-Agent 協調功能什麼時候正式推出?
目前為 research preview 階段,需要另外申請存取。Anthropic 尚未公布正式推出日期。根據 beta header 的命名(managed-agents-2026-04-01),預計在 2026 年下半年進入穩定版本。
Claude Managed Agents 和 OpenAI Codex 怎麼選?
- Codex 偏重程式碼任務(自動修 bug、實作功能),更像是一個「雲端的 AI 工程師」
- Managed Agents 是通用 Agent 平台,不限於程式碼——HR 流程、資料分析、文件處理都適用
- 如果你的主要需求是程式碼自動化 → Codex
- 如果你需要一個通用的 Agent 基礎架構 → Managed Agents
- 如果你已經在 Google Cloud → 考慮 Vertex AI Agent Engine
Managed Agents 支援哪些內建工具?
目前支援的內建工具:
- Bash:在容器中執行 shell 命令
- 檔案操作:讀取、寫入、編輯、glob 搜尋、grep 搜尋
- Web search / fetch:搜尋網頁和擷取網頁內容
- MCP 伺服器:連接外部工具提供者(資料庫、API、第三方服務等)
透過 MCP 的開放標準,理論上可以對接任何外部工具和服務。
Managed Agents 有速率限制嗎?
有,以組織為單位限制:
- 建立操作(建 Agent、建 Session 等):每分鐘 60 次
- 讀取操作(查詢、列表、串流等):每分鐘 600 次
此外,組織級別的 spend limit 和 tier-based rate limit 也適用。
現在就能用嗎?怎麼開始?
是的,目前已進入公開測試版。你需要:
- 一組 Claude API key
- 在所有請求中加上 beta header:
managed-agents-2026-04-01(SDK 會自動設定) - 所有 API 帳戶預設已啟用 Managed Agents 存取
進階功能(Outcomes、Multi-Agent、Memory)需要另外申請。
延伸閱讀: