Cloudflare Agents SDK 與 Flue：agent 上線前要補的恢復、沙盒與工作流

Cloudflare 2026-06-17 宣布 Flue 1.0 Beta 與 Agents SDK 生產級原語。整理代理控制層、持久執行、沙盒、Workflow 對開發團隊的取捨。

發佈於： 2026-05-31 | 更新於： 2026-06-18

內容查核： 2026-06-18 價格查核： 2026-06-18 來源查核： 2026-06-18

⚡ 重點摘要（TL;DR）

Cloudflare 2026-06-17 宣布把 Agents SDK 的平台原語開放給更多 agent harness 與 agent framework，Flue 1.0 Beta 是第一個明確示範。
新的判斷重點是三層分工：Flue 負責專案結構與開發體驗，Pi 或 Project Think 這類 harness 負責代理迴圈，Agents SDK 負責狀態、運算、儲存與恢復。
Flue 採用宣告式設定：描述模型、技能、沙盒與指令，再把 agent 放到 Slack、GitHub、Linear、Discord 或前端介面。
Cloudflare target 會把 Flue agent 映射到 Durable Object，搭配 runFiber、stash、onFiberRecovered、@cloudflare/codemode、@cloudflare/shell 與 Workflows。
開發團隊導入前，應先驗證任務中斷恢復、工具權限、沙盒邊界、檔案狀態、成本上限與人工批准流程。

如果你的 agent 還停在本機 terminal，Flue 的重點可能只是「更好開發」。一旦你想把 agent 放進 Slack、GitHub、Linear 或背景任務裡，問題會立刻變成：模型呼叫中斷怎麼辦？工具執行要跑在哪裡？檔案狀態如何保存？人類批准與重試要怎麼接回同一個任務？

Cloudflare 2026 年 6 月 17 日的更新，把這些問題拆成更清楚的三層：代理框架（agent framework）、代理控制層（agent harness）與執行平台（runtime/platform）。Flue 1.0 Beta 是框架層，Pi 或 Project Think 這類 harness 管代理迴圈，Cloudflare Agents SDK 則提供持久執行、狀態、儲存、沙盒與工作流。

這篇原本追蹤 Cloudflare Agents SDK v0.12.4 的聊天恢復（chat recovery）與 Durable Think。現在更適合把它當成「Cloudflare agent runtime 上線檢查」來看：Flue 讓開發者更快包裝 agent，但真正影響 production 成敗的是恢復能力、沙盒邊界、工具權限與成本治理。

如果你還在整理 Cloudflare AI Platform 的整體定位，可以先看站內的 Cloudflare AI Platform 推論效率與成本治理。這篇聚焦 Flue 與 Agents SDK 對 agent 開發者的直接影響。

先回答：Flue 和 Agents SDK 這次改了什麼？

Cloudflare 這次把 agent starter 的討論往下推到平台層。官方公告的核心是：Agents SDK 要成為任何 agent harness 或 agent framework 可共用的底層平台，Flue 是第一個明確站上這層平台的開源框架。

層級	代表	負責解決的問題
代理框架（agent framework）	Flue	專案結構、CLI、整合通路、React hooks、開發者體驗。
代理控制層（agent harness）	Pi、Project Think	代理迴圈、工具呼叫、上下文管理、任務持續執行。
執行平台（runtime/platform）	Cloudflare Agents SDK	Durable Object、持久執行、沙盒程式執行、檔案狀態、Workflow、綁定外部能力。

對開發團隊來說，這個分層比「Cloudflare 又推了一個 agent 工具」更重要。你可以用 Flue 取得框架與整合體驗，也可以自己做 harness，但只要 agent 要跑在雲端，就要回答同一批平台問題：狀態、恢復、隔離、觀測、成本與權限。

Flue 適合解決什麼？

Flue 1.0 Beta 採用宣告式模型。你描述 agent 需要的模型、技能、沙盒與指令，讓 harness 去處理任務，而不是自己手寫一整套 orchestration loop。官方範例把 bug triage agent 壓到很短的設定與程式碼：攔截 bug report、在 sandbox 重現、診斷問題，再回到使用者所在的通路。

它的實用價值主要在三個地方：

通路整合：官方提到 Slack、GitHub、Linear、Discord 等 Channels，可處理事件驗證與 dispatch 樣板。
前端可見性：@flue/react 提供 hooks，把 agent 狀態、工具執行與即時訊息串進前端，不必從零做 realtime plumbing。
生態整合：例如 flue add channel slack 這類命令會產生 Markdown blueprint，讓團隊或 coding agent 能接著修改與整合。

如果你的需求只是一次性批次腳本，Flue 可能太重。若你的 agent 要常駐在使用者工作流裡，或要同時支援背景任務與 UI 顯示，Flue 的框架層價值會更明顯。

真正要測的是 durable runtime

Agent 上線後最常見的失敗，不一定來自模型答錯，而是流程在半路消失。使用者關掉頁面、LLM provider timeout、部署重啟、工具呼叫卡住、等待人類批准，任何一件事都可能讓 agent 忘記自己做到哪裡。

Cloudflare 在 Agents SDK 裡主打的持久執行（durable execution）正是為了這種場景。官方公告說，Flue 在 Cloudflare target 上會把每個 agent 放進自己的 Durable Object，並使用 runFiber()、stash()、onFiberRecovered() 來 checkpoint 與恢復任務。這讓 harness 可以在新的 agent instance 啟動後知道：哪個任務中斷、上一個 checkpoint 在哪裡、接下來該重跑、接續或要求人工介入。

這也呼應 Cloudflare 5 月的 Agents SDK v0.12.4 更新紀錄。當時官方已經把聊天恢復（chat recovery）、durable Think submissions、語音連線控制（Voice connection control）與路由重試（routing retry）放進 SDK。6 月的 Flue 更新，等於把同一組能力推到更高層的框架與 harness 生態。

沙盒與檔案狀態：不要讓工具清單越長越難控

很多 agent demo 會把外部能力做成大量 tools。工具越多，模型越容易選錯，也越難控權限。Cloudflare 這次的說法是：在許多情境下，讓模型寫一段 TypeScript function，由受控 sandbox 執行，會比塞一長串 tool definitions 更容易管理。

Cloudflare 公告提到 @cloudflare/codemode 會透過 Dynamic Workers 執行 LLM 產生的程式碼，只提供你允許的 bindings。官方同時宣稱 isolate 啟動低於 10ms，並在公告中給出每次 load 的成本描述；這類成本數字需要以 Cloudflare 最新方案與帳務頁為準，本文只把它當成架構選項的訊號。

檔案狀態則由 @cloudflare/shell 補上。對 code review、文件整理、搜尋、diff、patch 這類任務，agent 多半需要讀寫文字檔，不一定每次都要啟動完整 Linux container。Cloudflare 的方向是先用 Durable Object 裡的虛擬檔案系統處理輕量 workspace；真的需要 npm install、git、compiler 或完整 OS 時，再接 Cloudflare Containers。

這個取捨對台灣或中小型團隊很實際：先確認你的 agent 工作是不是大量文字與 API 操作，再決定是否真的要為每一步工具呼叫付出 container 成本與啟動延遲。

Dynamic Workflows 適合哪種任務？

單次工具執行解決不了所有問題。當 agent 要把 code review、資料清理、研究流程或客戶工單處理變成可重複的長流程，就需要工作流引擎保存每一步、重試失敗、等待外部事件或人類批准。

Cloudflare 在公告中提到 @cloudflare/dynamic-workflows 與 runWorkflow()：agent 可以在 runtime 產生 workflow，交給 Workflows engine 持久執行；workflow 再用 RPC 回報進度、更新 state 或請求批准。這對「每天跑、會睡眠、會等待、要可追蹤」的 agent 比較有價值。

不過，dynamic workflow 也會提高治理難度。團隊至少要限制三件事：

agent 可以產生哪些 workflow；
workflow 能使用哪些資料與 bindings；
失敗、重試、人工批准與取消是否都有 audit trail。

如果沒有這些邊界，長任務 agent 會從「省人力」變成「看不懂它為什麼一直跑」。

實務判斷：先測恢復，再談大規模導入

Flue 讓 agent framework 看起來更接近一般 app framework，但導入順序不該從通路數量開始。更安全的做法，是先挑一個低風險流程，把 runtime 可靠性測完。

建議用這張檢查表做第一輪評估：

恢復：使用者關頁、部署重啟、provider timeout 後，任務能否接續或清楚失敗？
狀態：對話、工具結果、檔案變更、人工批准記錄存在同一個可追蹤邊界內嗎？
沙盒：LLM 產生的程式碼只能碰到被允許的 bindings 嗎？有沒有 secrets 外洩風險？
檔案系統：文字 workspace 用 Durable Object 內的虛擬檔案系統即可，還是需要完整 container？
成本：AI Gateway、模型供應商（model provider）、Dynamic Workers、Containers 的支出能不能按 agent 或任務設上限？
觀測：你看得到每一步 tool call、workflow step、latency、retry 與人類批准嗎？
退出機制：任務跑錯時，使用者或管理員能否取消、回滾或交給人處理？

如果這些問題還答不出來，先別把 Flue 接到高權限 GitHub repo、客戶資料或付款流程。可以從 Slack triage、內部文件整理、低敏感 issue 分流開始；若要盤點更完整的組織條件，再對照 Cloudflare Agent Readiness 五層檢查。

和其他 agent 平台怎麼比較？

Cloudflare 這次更新的差異化不在模型能力，而在平台原語。OpenAI Agents SDK、Vercel 的 durable AI workflow、各家雲端 agent platform 都在處理相似問題：工具怎麼執行、狀態怎麼保存、長任務怎麼恢復、沙盒與成本怎麼控。

Cloudflare 的優勢是 Workers、Durable Objects、Workflows、AI Gateway、Browser Rendering、Email Service、Containers 等能力原本就在同一個開發平台（developer platform）裡。若你的團隊已經在 Cloudflare 上跑 Workers 或 AI Gateway，Flue/Agents SDK 的導入成本會低一些。若你的 agent 需要重度本機建置（build）、複雜作業系統相依或大型資料處理，仍要評估 Containers、其他雲端執行環境，或專門的 coding agent sandbox。

延伸閱讀可以看 OpenAI Agents SDK sandbox 的安全邊界與 Vercel durable AI code agent workflow，用同一組問題比較不同平台的狀態、沙盒與工作流設計。

來源與仍需追蹤的限制

本文主要採信 Cloudflare 2026-06-17 官方公告、Cloudflare Agents 文件、Cloudflare 2026-05-13 Agents SDK v0.12.4 更新紀錄、Flue 官網、npm 套件後設資料與 withastro/flue GitHub repo 後設資料。

截至 2026-06-18 查閱時，@flue/runtime 與 @flue/react 的 npm latest 版本為 1.0.0-beta.1，授權為 Apache-2.0，repository 指向 withastro/flue。Beta 版本代表 API、整合方式與文件仍可能調整；導入前要看最新 release notes，不要只照本文日期的狀態實作。

重點整理

Cloudflare Agents SDK 與 Flue 的組合，適合用來判斷 agent 能不能離開 demo：框架層負責讓開發變快，harness 層負責代理迴圈，runtime 層負責中斷恢復、沙盒、檔案狀態、工作流與平台 bindings。

短期最值得做的事，是選一個低風險流程跑完整測試：讓任務中斷、重啟、重試、等待批准、執行程式碼、讀寫檔案，再確認成本與觀測資料能不能被管理。這比急著把 agent 放進所有通路更能降低上線風險。

參考資料

№ · further reading