Opera Browser CLI 值得注意,因為它把「AI agent 操作瀏覽器」從展示型功能往開發者工作流推進了一步。
過去常見做法是讓 agent 讀截圖、跑 Playwright,或透過一個受控的 browser sandbox 做任務。Opera 這次推出的 opera-browser-cli,重點是讓本機 AI agent 透過命令列驅動 Opera Neon,而且能在真實瀏覽器環境裡讀頁面、點擊、填表、截圖、檢查 console 與 network。
對一般讀者來說,這不只是「又一個 AI 瀏覽器功能」。更準確的說,它代表瀏覽器正在變成 agent 的執行層:AI 不只回答你網頁上有什麼,而是可以在你允許的範圍內,直接替你操作網頁。
Opera Browser CLI 是什麼?
Opera Browser CLI 是 Opera 官方釋出的命令列工具。它包裝 opera-devtools-mcp,讓本機工具或 AI agent 可以透過 CLI 操作瀏覽器。
最基本的安裝流程如下:
npm install -g opera-browser-cli
opera-browser-cli setup
opera-browser-cli open https://example.com
Opera 官方文件列出幾個核心用途:
| 能力 | 可以做什麼 |
|---|---|
| 開頁面與 snapshot | 打開 URL,取得可操作的頁面結構 |
| 點擊與填表 | 對頁面元素執行 click、fill、press、upload |
| 截圖與除錯 | 擷取 screenshot、console、network、performance |
| 多頁管理 | 開新分頁、切換分頁、關閉分頁 |
| Opera AI 指令 | 在 Opera Neon 裡呼叫 Do、Make、Research |
| 本機 agent 整合 | 讓 Claude Code 或其他本機工具透過命令列操作瀏覽器 |
它和一般瀏覽器自動化工具最大的不同,是它的目標使用者明顯不是只有人類工程師,也包含本機 AI agent。
和 MCP Connector 差在哪?
Opera 在 2026 年 3 月先推出 Neon MCP Connector,讓 Claude、ChatGPT、Lovable、n8n、OpenClaw 等 MCP 相容客戶端連到 Opera Neon。這比較像是把瀏覽器變成一個 MCP server,讓外部 AI client 可以讀取分頁、頁面內容、登入 session,並執行瀏覽器動作。
Opera Browser CLI 則更偏本機開發者工作流。它不是只等 MCP client 連進來,而是提供一組可以直接在 terminal 呼叫的命令。
| 比較項目 | Opera MCP Connector | Opera Browser CLI |
|---|---|---|
| 主要入口 | MCP client 連到瀏覽器 | 本機命令列呼叫 |
| 適合對象 | Claude、ChatGPT、n8n、Lovable 等外部工具 | Claude Code、本機 agent、開發者腳本 |
| 執行位置 | 可支援外部 AI client | 主要跑在本機 |
| 可用能力 | 連到瀏覽器 session,執行頁面操作 | 更完整的 DevTools、snapshot、console、network、Neon agent 指令 |
| 典型用途 | 讓 AI client 讀取你正在看的網頁 | 前端 QA、除錯、自動化測試、agent 工作流驗證 |
如果你只是想讓 AI 看目前分頁,MCP Connector 的概念比較直覺。若你想讓 Claude Code 在本機開發時打開頁面、檢查 console、截圖、點按鈕、驗證改版結果,CLI 的形狀更像工程工具。
它為什麼適合 Claude Code?
Claude Code、Codex CLI、Cursor agent 這類工具的瓶頸,常常不是「能不能寫程式」,而是「寫完以後怎麼看見結果」。
AI coding agent 可以修改檔案、跑測試、看 log,但前端畫面常常需要真實瀏覽器驗證。Opera Browser CLI 補上的正是這一段:
- agent 修改前端程式。
- 開啟本機 dev server。
- 用 CLI 打開頁面。
- 讀取 accessibility snapshot。
- 檢查 console 與 network。
- 截圖或跑互動步驟。
- 根據結果修正 UI 或 bug。
這會讓 agent 從「只會寫」更接近「能自己驗收」。尤其是表單流程、登入後頁面、dashboard、後台工具、RWD 版面,單靠靜態檔案很難判斷,必須進瀏覽器看。
適合拿來做哪些工作?
前端 QA
最直接的用途是前端驗證。你可以讓 agent 打開頁面,檢查主要按鈕是否存在、表單是否可填、mobile viewport 是否跑版、console 是否報錯。
這不是要完全取代 Playwright 測試,而是補一層「開發中即時巡檢」。Playwright 適合穩定測試腳本,Browser CLI 適合 agent 在工作過程中快速觀察頁面狀態。
Agentic browsing 原型
若你正在做 AI agent 產品,需要驗證「代理能不能理解頁面並完成任務」,Opera Browser CLI 可以當早期實驗工具。它提供頁面 snapshot、互動指令與 screenshot,能快速測試流程是否可行。
產品研究與資料整理
Browser agent 最常見的需求之一,是跨頁面蒐集資料、整理表格、比較價格或讀文件。CLI 可以讓本機 agent 把這些步驟接成工作流,但要注意網站條款、登入權限與資料合規。
AI coding agent 驗收
如果你已經在用 Claude Code 或 Codex 寫前端,最實用的場景是讓 agent 改完後自己開瀏覽器驗收,而不是每一步都叫人類截圖。
例如:
opera-browser-cli open http://localhost:4321
opera-browser-cli snapshot
opera-browser-cli console
opera-browser-cli screenshot ./qa-home.png
這類流程可以變成 AI coding agent 的「最後一哩路」。
導入前要注意的風險
Opera Browser CLI 的能力越接近真實瀏覽器,風險也越接近真實瀏覽器。
第一個風險是登入 session。若 agent 能在你已登入的瀏覽器裡操作,它就可能取得和你一樣的頁面權限。這對前端 QA 很方便,對財務後台、CRM、法務系統、雲端主控台就需要更嚴格限制。
第二個風險是 prompt injection。當 agent 讀網頁內容時,頁面裡的惡意文字、隱藏元素、廣告或第三方嵌入內容,都可能影響 agent 的下一步判斷。
第三個風險是自動化痕跡。Opera 文件提到 CLI 預設會設定 automation flags,讓網站知道瀏覽器正在被自動化驅動。這對透明性是好事,但也代表某些網站可能調整行為。
第四個風險是工具權限擴張。從「讀頁面」到「點按鈕」再到「送出表單」,風險不是線性增加,而是跨過了代替人類行動的門檻。
比較務實的導入方式是:
- 先用在本機開發站與測試環境。
- 不接高敏感正式帳號。
- 對送出、付款、刪除、邀請、改權限等動作設人工確認。
- 保存 agent 操作紀錄。
- 把可用網站、可用指令與可讀資料分級。
和 Playwright、Browser Use 有什麼不同?
Playwright 是成熟的瀏覽器自動化框架,適合寫穩定、可重複的測試。Browser Use、browser agent 類工具則偏向讓 LLM 理解頁面並完成任務。
Opera Browser CLI 的位置比較特殊:它一邊保留命令列與 DevTools 的工程感,一邊把 Opera Neon 的 AI agent 能力接進來。
| 工具 | 最適合 |
|---|---|
| Playwright | 自動化測試、CI、可重複驗證 |
| Browser Use 類工具 | LLM 驅動的通用瀏覽器任務 |
| Opera MCP Connector | 讓外部 AI client 連到瀏覽器 |
| Opera Browser CLI | 本機 agent、Claude Code、前端 QA、真實頁面驗收 |
因此它不是「誰取代誰」的問題,而是工作層級不同。正式測試仍該寫 Playwright;探索型、互動型、開發中驗收則可以交給 Browser CLI。
誰最該關注?
如果你是一般使用者,現在不用急著裝。AI 瀏覽器還在早期,能做的事很多,但權限與安全邊界也還在成形。
如果你是工程師、產品經理、AI agent builder,這個工具值得追。原因不是 Opera 市佔率,而是它示範了一種方向:未來 AI agent 不只接 API,也會接你的瀏覽器、IDE、terminal、文件與 SaaS。
真正重要的問題是:當 agent 能看見你的工作現場,它到底應該被允許做什麼?
常見問題
Opera Browser CLI 可以直接取代 Playwright 嗎?
不建議。Playwright 適合穩定測試與 CI,Opera Browser CLI 更適合本機 agent 的即時觀察、互動與驗收。正式產品仍應保留 Playwright、單元測試與端對端測試。
一定要用 Opera Neon 嗎?
基本瀏覽器操作可用 Opera browser,但 Opera Neon 才能使用 Do、Make、Research 等進階 AI 指令。若目標是 AI agent 工作流,Opera Neon 的意義更大。
這對非工程師有用嗎?
短期比較偏工程師與 agent builder。非工程師真正會感受到的是下一階段產品:AI 瀏覽器能幫你整理頁面、填表、比較資料、建立自動化流程,但前提是權限控制要成熟。
企業可以直接導入嗎?
可以先小範圍試用,但不應直接接正式高敏感帳號。建議先用在測試環境、內部文件、低風險 SaaS 與前端 QA,再評估 session、audit、DLP、RBAC、prompt injection 防護。
它和 MCP 有什麼關係?
Opera Browser CLI 包裝 opera-devtools-mcp,同時和 Opera Neon 的 MCP Connector 形成互補。MCP Connector 讓外部 AI client 連到瀏覽器,Browser CLI 則讓本機命令列與 agent 更容易操作瀏覽器。