AI 瀏覽器自動化工具正在變成 agent 開發的重要基礎。Playwright MCP、Browserbase、Stagehand 都和「讓 AI 操作網頁」有關,但定位不同。
選型前先問:你只是要讓 AI assistant 幫你操作本機頁面,還是要把瀏覽器 agent 部署成產品?
快速選擇
| 需求 | 建議工具 |
|---|---|
| 本機開發、UI 檢查、AI coding assistant 控瀏覽器 | Playwright MCP |
| 雲端瀏覽器、session、併發、部署、代理 | Browserbase |
| LLM-native browser automation SDK | Stagehand |
| 既有 Playwright 測試流程 | 先用 Playwright,再評估 MCP 或 Browserbase |
| 生產級 agent 產品 | Browserbase 加 Stagehand 或既有自動化框架 |
三個工具差異
| 工具 | 核心定位 | 最適合 |
|---|---|---|
| Playwright MCP | MCP browser automation server | AI assistant 本機操作與驗證 |
| Browserbase | Cloud browser platform | 生產化 browser agents |
| Stagehand | SDK for developers and LLMs | AI-driven workflows 與自然語言操作 |
選型指標
任務是否需要雲端?
如果只是本機測試,Playwright MCP 很直接。如果要併發、排程、長 session、代理、部署、監控,就要看 Browserbase。
任務是否固定?
固定流程適合 Playwright 腳本。半固定、頁面容易變、需要語意理解的流程,可以評估 Stagehand。
是否需要可審計?
瀏覽器 agent 會真的點擊、輸入、提交。產品化前要有 log、截圖、重播、權限、失敗處理與人審節點。
是否涉及敏感資料?
登入後台、客戶資料、付款、醫療、財務、法務流程都不能只靠 prompt 約束。要用權限、沙盒、測試帳號與人工確認保護。
結論
Playwright MCP 是好入口,適合開發者理解 AI 如何控制瀏覽器。Browserbase 是更偏基礎設施的選擇,適合把 browser agent 產品化。Stagehand 則適合想把 LLM 與瀏覽器自動化寫進工程工作流的人。