Stagehand 是面向 LLM 與開發者的瀏覽器自動化 SDK。它的目標是讓 AI-driven browser automation 更容易寫、測、維護,特別適合需要讓 agent 在網頁中完成多步驟任務的產品。
如果 Playwright 是偏明確 selector 與測試腳本,Stagehand 更偏「讓模型理解頁面並協助決定操作」。
適合誰用?
| 使用者 | 適合原因 |
|---|---|
| AI agent 工程師 | 把瀏覽器操作接進 LLM workflow |
| 自動化產品團隊 | 做網站操作、表單、資料讀取與任務執行 |
| 需要雲端瀏覽器的團隊 | 可搭配 Browserbase 部署 |
| 既有 Playwright 使用者 | 評估哪些步驟適合 AI 輔助 |
| RPA 與內部工具團隊 | 讓非固定頁面流程更有彈性 |
Stagehand 解決什麼問題?
| 問題 | Stagehand 的方向 |
|---|---|
| 網頁 selector 容易變 | 用 AI 輔助理解頁面與元素 |
| 任務不是固定腳本 | 讓 LLM 參與決策與操作 |
| 要結合自然語言指令 | 將 prompt 與瀏覽器動作放進同一流程 |
| 需要雲端部署 | 可搭配 Browserbase cloud browser |
| 傳統自動化太硬 | 對半結構化任務更有彈性 |
使用時要注意
不要把所有步驟都交給 AI
穩定的流程仍適合寫成明確程式碼。容易變、需要理解頁面語意、需要判斷的部分,才適合交給 AI 協助。
成本與可觀測性要先設計
AI-driven automation 會消耗模型成本,也需要紀錄每一步發生什麼。沒有 trace、log、screenshot 或 replay,除錯會很辛苦。
高風險操作要設人審
提交訂單、付款、刪除資料、更新帳號、寄送訊息等任務,都應該設計確認步驟與權限邊界。