AI 產業的價格戰,終於從「未來可能發生」變成「已經在發生」。
WSJ 在 2026 年 6 月 12 日報導,越來越多企業開始受不了快速增加的 AI 成本,改用便宜模型、開源模型,或透過模型路由把任務分給不同模型。這讓 OpenAI、Anthropic 這類 frontier model 公司面臨降價壓力。
這件事表面上是 OpenAI 和 Anthropic 的競爭,實際上是整個 AI 商業模式正在被重新定價。
過去企業問的是:「Claude 比 GPT 強嗎?Gemini 便宜嗎?DeepSeek 能不能用?」
現在更重要的問題變成:「這件任務到底需要多強的模型?」
發生了什麼?
WSJ 的報導指出,企業和新創正在用幾種方式壓低 AI 成本:
| 做法 | 代表意義 |
|---|---|
| 改用便宜模型 | 不再把每個任務都交給最貴的 GPT 或 Claude |
| 導入開源 / 中國模型 | DeepSeek、Alibaba、GLM、Qwen 等模型成為成本選項 |
| 建立模型路由 | 任務先被分類,再送到最適合的模型 |
| 自建小模型 | 高頻、固定格式、公司內部資料任務可被專用模型吸收 |
| 只在疑難任務升級 | 旗艦模型保留給複雜推理、coding、長任務與高風險場景 |
報導中提到,有些工具透過動態切換模型,讓部分 AI 輔助工作成本下降非常明顯。像 bug 分析、信件分類、行事曆處理、會議轉錄、客服 triage 這些任務,未必每一步都需要最強模型。
這正好接上我前面寫的 AI ROI 與 token 成本 和 OpenRouter 模型路由:AI 一旦進入真實工作流,企業就會從「多用 AI」變成「用對 AI」。
為什麼價格戰現在爆發?
1. AI 用量變大,帳單開始痛
一個人每月 20 美元訂閱 AI 工具,感覺不貴。
但公司級使用就不同了。客服系統、內部知識庫、coding agent、會議摘要、文件分析、銷售郵件、資料清洗、圖片生成、報表產生,全都開始呼叫模型後,成本會變成「用量乘上流程」。
尤其 agent 會連續做很多步。一次任務看起來只是「幫我整理客戶資料」,背後可能包含:
- 讀取 CRM
- 摘要對話紀錄
- 查找相似案例
- 產生回覆草稿
- 判斷風險
- 重新寫成指定格式
- 請更強模型覆核
如果每一步都用最貴模型,帳單會長得很快。
2. 開源與便宜模型已經夠用
AI 模型的能力差距沒有消失,但「很多日常任務已經不需要最頂級模型」。
分類、抽取欄位、改格式、短摘要、語氣改寫、簡單客服、初步搜尋、會議逐字稿整理,這些任務對模型的要求在於穩定、便宜、快速、可批次處理,不在極限推理。
這讓 DeepSeek、Qwen、GLM、Llama、Mistral、Nemotron 等模型有了切入點。它們不一定在所有高難度基準上贏過 GPT 或 Claude,但在高頻任務裡,只要品質達標,成本差距就很有殺傷力。
3. 企業開始學會算總成本
以前很多人看 AI 價格,只看每百萬 token 多少錢。
但真正該看的是 price per task。
| 指標 | 只看 price per token | 看 price per task |
|---|---|---|
| 比較方式 | 每百萬 token 價格 | 完成一件任務的總成本 |
| 容易忽略 | 失敗率、重試、人工修正、延遲 | 把成功率與返工成本算進去 |
| 常見誤判 | 便宜模型一定省錢,或貴模型一定浪費 | 要看任務難度與可驗證性 |
| 正確用法 | 適合粗略估算 | 適合企業採購與流程設計 |
這也是 Anthropic 對外常強調的方向:模型價格不能只看 token,要看一件任務從開始到完成的成本。
但這句話反過來也會變成壓力。當企業能用便宜模型完成 80% 的普通任務,旗艦模型就必須在剩下 20% 的困難任務證明自己值得更高價格。
OpenAI 和 Anthropic 壓力在哪裡?
OpenAI 和 Anthropic 都有很強的模型,也都有企業客戶、開發者生態與品牌信任。
但價格戰會讓它們同時面臨三個壓力。
1. 降價會壓縮毛利
frontier model 不是一般 SaaS。
它的成本來自資料中心、GPU、電力、網路、訓練、推理、模型安全、研究人員、企業支援。當使用量變大,推理成本不是零。這也是為什麼 NVIDIA 的 AI 基礎設施收入 會這麼誇張:模型公司和雲端公司都需要龐大算力支撐產品。
如果 OpenAI 或 Anthropic 降價,短期能守住客戶,長期卻會讓市場更嚴格檢查它們的虧損、毛利與 IPO 故事。
2. 不降價會被路由器抽走流量
如果模型公司不降價,企業就會用另一種方式降成本:把大量低難度任務從它們身上移走。
OpenRouter、Vercel AI Gateway、企業內部 LLM gateway、雲端模型平台,都會讓模型切換變得更容易。
當切換成本下降,模型公司就不再只和另一家 frontier lab 競爭,而是和整個模型市場競爭。
這對 OpenAI、Anthropic、Google 都一樣。
3. 旗艦模型會被迫往高價值任務集中
這不代表 GPT、Claude、Gemini 會失去價值。
相反地,它們會更像「高階專家」:
| 任務 | 可能用便宜模型 | 仍適合旗艦模型 |
|---|---|---|
| 客服 | 分類、摘要、套模板 | 高價客訴、複雜退款、法務風險 |
| 內容 | 標題變體、摘要、整理資料 | 深度分析、觀點建立、事實交叉檢查 |
| 程式 | lint、簡單修 bug、補測試 | 架構調整、跨檔 debug、資安修補 |
| 企業資料 | 欄位抽取、格式轉換 | 決策建議、異常判斷、複雜查詢 |
| 研究 | 文獻分類、重點摘錄 | 假設形成、推理鏈、實驗設計 |
真正的變化是:旗艦模型不再理所當然吃掉全部流量。
這會怎麼改變企業 AI 採購?
1. 從單一供應商走向多模型架構
很多企業一開始會選一個主供應商:OpenAI、Anthropic、Google 或 Microsoft。
但 2026 年以後,更合理的架構會長這樣:
| 層級 | 功能 |
|---|---|
| 應用層 | 客服、內容、coding、BI、內部搜尋 |
| 任務分類層 | 判斷任務難度、資料敏感度、延遲需求 |
| 模型路由層 | 選擇便宜模型、中階模型、旗艦模型或本地模型 |
| 評估層 | 追蹤成功率、重試率、人工修正率、使用者滿意度 |
| 治理層 | 權限、資料外流、供應商政策、審計紀錄 |
這也是為什麼模型路由已經成為 AI 採購、資安與財務都會關心的基礎設施。
如果路由層納入開源模型或本地模型,採購表不能只看價格。每個候選模型都要記錄參數規模、授權條款、商用限制、部署硬體/API 成本與資料邊界,再決定先用 API、內部部署或跳過。
2. CFO 會問更細的問題
以前 AI 專案常用「節省時間」當理由。
接下來 CFO 會問:
- 哪些任務每天真的被 AI 處理?
- 每個任務平均花多少 token?
- 便宜模型和旗艦模型的成功率差多少?
- 失敗後人工修正要花多少時間?
- 哪些任務可以 cache?
- 哪些任務可以用小模型或規則系統?
- 哪些任務不能送到外部模型?
AI 採購會變得更像雲端成本管理。不是不用;企業要知道錢花在哪裡。
3. 開發者會開始設計「模型升級路徑」
未來的 AI app 不會只寫死一個模型。
比較成熟的做法會是:
- 先用便宜模型處理
- 如果信心不足,要求模型標記不確定
- 需要時升級到更強模型
- 高風險任務加人工審核
- 把結果寫回 eval 系統,持續調整路由規則
這種設計會比「所有任務都用最貴模型」更像真正的產品工程。
對內容網站、個人創作者和小團隊有什麼影響?
這題和你做內容站其實很有關。
如果你只是偶爾用 AI 寫一篇文章,價格戰感覺很遠。但如果你每天用 AI 做選題、SERP 研究、圖片、草稿、翻譯、內部連結、程式修 bug、PageSpeed 優化,模型成本和品質差異就會變成日常決策。
我的看法是:
| 工作 | 不一定要用最貴模型 | 值得用強模型 |
|---|---|---|
| 找候選新聞 | 可以用便宜模型先篩 | 最後判斷是否值得寫 |
| 整理來源 | 可用中階模型摘要 | 需要交叉驗證時升級 |
| 寫初稿 | 看題目難度 | 深度觀點文要用強模型 |
| 補圖 | 生成品質比 token 價格更重要 | 圖片是流量入口時值得花 |
| 內部連結 | 可用規則 + 中階模型 | 跨主題策略再升級 |
| debug | 小錯可用便宜模型 | 跨框架、部署、資料錯誤用強模型 |
所以價格戰對小團隊反而是好事。你可以把強模型留給真正需要判斷力的工作,把大量整理型任務交給便宜模型或自動化工具。
這是不是代表 AI 模型會商品化?
一部分會。
格式轉換、摘要、分類、抽取、簡單問答,會越來越商品化。這些任務很難永遠支撐高溢價。
但 frontier model 不會立刻變成水電費。原因有三個:
- 高難度推理仍然有差距
- 企業更在意可靠性、資安、合規與支援
- 最強模型可以縮短高價值任務的時間
真正會被商品化的是「沒有任務分層的模型使用方式」。
也就是說,企業會更清楚知道哪些地方不值得用貴模型,這不代表所有模型都會變便宜。
Mason 的判斷
我覺得這波 AI 價格戰最重要的訊號是 企業開始從 AI 信仰期進入 AI 會計期。
信仰期看 demo。
會計期看任務、成本、成功率、返工時間和可持續性。
這會讓 AI 市場分成三層:
| 層級 | 代表產品 | 商業邏輯 |
|---|---|---|
| 旗艦模型 | GPT、Claude、Gemini 高階版本 | 用最高能力處理高價值任務 |
| 成本模型 | DeepSeek、Qwen、GLM、小模型、開源模型 | 用低成本吃掉大量高頻任務 |
| 路由與治理層 | OpenRouter、AI Gateway、企業內部平台 | 決定任務該去哪裡,並控制成本與風險 |
長期看,最有價值的不一定是「某一個模型」,而是能把任務、資料、模型、評估和成本接起來的系統。
OpenAI 和 Anthropic 當然還是很強。但如果它們要維持高估值,就不能只證明模型更聰明,還要證明客戶用它們完成任務的總成本更低、風險更小、結果更穩。
這也是 2026 年企業 AI 最現實的一句話:
不是每個問題都需要最強模型,但每個 AI 流程都需要成本意識。
常見問題
AI 價格戰是什麼?
AI 價格戰指的是模型公司在企業客戶與開發者市場上,因為開源模型、便宜模型與模型路由競爭,開始被迫降低 API 或產品價格。它不只是 OpenAI 和 Anthropic 之間的競爭,也包含 DeepSeek、Qwen、GLM、Meta、Mistral、Nvidia、Microsoft 等供應商的成本壓力。
企業應該直接改用最便宜模型嗎?
不一定。便宜模型適合高頻、低風險、容易驗證的任務;高風險、長流程、複雜推理、資安、法務、醫療、金融決策等任務,仍需要更強模型、嚴格評估與人工審核。重點是追求每個任務的合理總成本,不是追求最低價格。
price per token 和 price per task 差在哪裡?
price per token 是模型每處理多少文字單位收多少錢;price per task 則是完成一件任務的總成本,包含 token、重試、延遲、錯誤、人工修正與品質差異。企業真正該看的通常是 price per task。
模型路由會變成標配嗎?
我認為會。只要企業同時使用多個模型,並且 AI 流量開始變大,就需要模型路由來處理成本、品質、延遲、備援、資料政策與治理問題。它會像雲端成本管理一樣,從工程問題變成管理問題。
OpenAI 和 Anthropic 會因此失去優勢嗎?
短期不會。高階模型在複雜任務、coding、長上下文、企業支援與安全治理上仍有優勢。但它們會失去一部分低難度、高頻任務的流量,必須把價值更集中地證明在高價值場景上。
參考來源
- WSJ:The AI Price War Is Here, Piling Pressure on OpenAI and Anthropic
- NY Post:OpenAI weighs slashing prices in attempt to lure users from rival Anthropic
- Barron’s:OpenAI Mulls AI Price War With Anthropic
- arXiv:Tiered Super-Moore’s Law: Price Evolution, Production Frontiers, and Market Competition in Large Language Model Inference Services
- arXiv:State of AI: An Empirical 100 Trillion Token Study with OpenRouter
- Business Insider:Satya Nadella is trying to rein in the tokenmaxxers at Microsoft