回到頂部
Playwright MCP 瀏覽器自動化示意

Playwright MCP 指南:AI agent 如何控制瀏覽器?

Playwright MCP 是什麼?本文整理 Playwright MCP 的用途、適合情境、安裝概念、瀏覽器自動化能力與 AI agent 使用限制。

Playwright MCP 是 Playwright 官方提供的 MCP server,讓 AI assistant 可以透過 Playwright 操作瀏覽器。它適合開發者把瀏覽器操作交給 AI agent,例如測試表單、檢查頁面、操作後台、驗證 UI、抓取公開頁面資訊。

它和一般「截圖給 AI 看」不同。Playwright MCP 可以提供結構化頁面快照,讓模型知道頁面上有哪些按鈕、連結、輸入框與文字。

適合誰用?

使用者適合原因
前端工程師讓 AI 幫忙操作頁面、檢查 UI、重現問題
QA 團隊用自然語言描述流程,交給 agent 操作
AI coding assistant 使用者讓 Claude Code、Cursor、Windsurf、VS Code 等工具控制瀏覽器
內部工具開發者驗證表單、流程、權限與狀態變化
MCP 學習者理解 agent 如何透過工具和真實網頁互動

Playwright MCP 可以做什麼?

能力用途
Browser navigation開頁、返回、重新整理、切換頁面
Element interaction點擊、輸入、選取、提交表單
Accessibility snapshot讓 LLM 讀取結構化頁面狀態
Screenshots必要時輔助視覺檢查
Dev workflow搭配本機網站、測試頁與 AI coding assistant
MCP integration透過標準 MCP 接到支援的客戶端

使用時要注意

它不是搜尋引擎

Playwright MCP 是瀏覽器自動化工具,不是自動搜尋資料庫。若任務是「找最新資訊」,還是要搭配搜尋工具或明確的 URL。

不要讓 agent 直接操作高風險帳號

付款、刪除資料、修改正式設定、寄信、提交訂單,都需要人工確認。瀏覽器 agent 的權限越高,出錯成本越高。

本機驗證與雲端規模是兩件事

Playwright MCP 很適合本機與開發流程。若需要大規模併發、長連線瀏覽器、代理、雲端 session 或生產級瀏覽任務,Browserbase 這類平台更適合。

參考來源

№ · further reading

延伸閱讀