回到頂部
Mason AI Lab tech article hero for Cloudflare AI Platform 怎麼定位?Workers、AI Gateway、Vectorize 與 agents 的完整拼圖

Cloudflare AI Platform 怎麼定位?Workers、AI Gateway、Vectorize 與 agents 的完整拼圖

Cloudflare AI Platform 把 Workers、AI Gateway、Vectorize、Workers AI、Browser Rendering、R2 與 Workflows 放在同一套架構中,目標是讓 AI 應用和 agents 更容易上線。

Cloudflare AI Platform 的核心不是「Cloudflare 也有 AI 模型」。比較準確的理解是:Cloudflare 想把 AI 應用與 agents 的基礎設施做成平台。

AI 應用真正上線後,通常會遇到一整串問題:模型要怎麼選、流量要怎麼控、向量資料放哪裡、檔案放哪裡、使用者狀態怎麼保存、成本怎麼看、agent 任務怎麼重試、瀏覽器自動化怎麼做。

Cloudflare 的策略,是用既有 edge 與 developer platform 把這些問題串起來。

Cloudflare AI Platform 包含哪些能力?

可以把它拆成幾塊:

能力代表服務用途
執行層WorkersAPI、前後端邏輯、工具調用
模型層Workers AI在 Cloudflare 平台上使用模型
模型治理AI Gateway管理模型請求、快取、log、rate limit、成本
資料層R2、KV、D1檔案、低延遲 key-value、結構化資料
語意搜尋VectorizeRAG、embedding search、知識庫查詢
狀態協調Durable Objectssession、多人協作、agent state
長流程Workflows多步驟任務、重試、等待與恢復
網頁操作Browser Rendering截圖、讀頁面、browser automation

這些不是單點功能,而是一個 AI 應用 stack。

為什麼只接模型 API 不夠?

早期 AI app 可以很簡單:

  1. 前端送 prompt。
  2. 後端呼叫模型 API。
  3. 把答案回傳。

但只要產品稍微成熟,就會多出很多需求:

  • 要支援多模型 fallback。
  • 要看每個使用者花了多少 token。
  • 要把文件切 chunk 做 embedding。
  • 要限制某些資料只能特定角色查詢。
  • 要快取相同問題。
  • 要保存 conversation state。
  • 要讓 agent 等待外部事件。
  • 要把錯誤請求追蹤回來源。

這些問題和模型本身無關,卻決定 AI 產品能不能穩定運行。

AI Gateway 的角色

AI Gateway 很像模型流量的控制塔。

它能幫開發者處理:

  • request logging。
  • caching。
  • rate limiting。
  • cost tracking。
  • provider routing。
  • failure visibility。

企業導入 AI 後,常見痛點是看不到模型使用細節。哪個產品線最耗 token?哪個 prompt 最容易失敗?哪個模型供應商延遲最高?如果沒有 gateway 層,這些問題會分散在各個應用裡。

AI Gateway 的價值,是把模型使用變成可管理的 infrastructure。

Vectorize 與資料層的角色

大多數企業 AI 應用都離不開 retrieval。

原因很簡單:模型本身不知道你的公司文件、客戶資料、內部流程、最新產品規格。這些都需要從資料層取回。

Vectorize 負責語意搜尋,R2 可以放文件與大型物件,D1 可以放結構化資料,KV 可以放低延遲狀態。搭配 Workers,就能建立常見的 RAG 應用:

  1. 文件上傳到 R2。
  2. 文件切段後建立 embedding。
  3. embedding 存進 Vectorize。
  4. 使用者提問時檢索相關段落。
  5. Workers 組合 prompt 並呼叫模型。
  6. AI Gateway 追蹤請求與成本。

這種架構比單純把文件塞進 prompt 更可靠,也更容易控管權限。

為什麼 agents 需要 Workflows 和 Durable Objects?

Agent 和一般 AI app 最大差別,是 agent 通常不是一次請求就結束。

例如一個網站 QA agent 可能要:

  1. 打開頁面。
  2. 截圖。
  3. 檢查按鈕。
  4. 填表。
  5. 等待結果。
  6. 比對預期畫面。
  7. 產生報告。

這是一段流程,不是一個 prompt。

Durable Objects 可以保存狀態,Workflows 可以管理步驟、重試、等待與恢復。Browser Rendering 則讓 agent 能和真實網頁互動。

這些能力加起來,才比較接近可上線的 agent infrastructure。

什麼團隊適合用這種架構?

適合:

  • 已經使用 Cloudflare Workers 的工程團隊。
  • 想快速部署 AI API、RAG、agent workflow。
  • 需要全球分散式低延遲。
  • 希望統一觀測模型成本。
  • 不想自行管理太多伺服器。
  • 要把 AI 功能嵌進既有網站或 SaaS。

不一定適合:

  • 主要需求是模型訓練。
  • 需要重度 GPU batch processing。
  • 公司所有資料都在封閉內網。
  • 只想用現成 no-code chatbot。
  • 沒有人負責權限與觀測設計。

官方來源

  • Cloudflare Blog,Building the Cloudflare AI Platform,2026-04-16。

結論

Cloudflare AI Platform 的關鍵,是把 AI 應用從「呼叫模型」推到「完整平台」。

當 AI 功能變成正式產品的一部分,開發者需要的不只是模型 API,而是資料、狀態、流程、瀏覽器、自動化、觀測與成本治理。Cloudflare 的拼圖顯示,下一階段 AI infrastructure 會更像 web infrastructure:分散、可部署、可監控,也能支援大量小型 agents。

№ · further reading

延伸閱讀