回到頂部
AI API 月費試算器:7 家模型即時對比 — 封面

AI API 月費試算器:7 家模型即時對比

輸入呼叫量、輸入 / 輸出長度、語言,即時算出 Claude、GPT-5.4、Gemini 3、DeepSeek V4 等 7 家模型的月費,支援 prompt caching 折扣。

輸入你的用量,即時看 7 家主流模型一個月要花多少錢。 包含 Claude Opus 4.7、GPT-5.4、Gemini 3 Pro、DeepSeek V4、Qwen-Max 等——不用自己查單價、不用自己算 token 換算,也不用擔心 CJK 倍數——這裡全部處理好了。

🧮 馬上試算

💰 AI API 月費試算器

輸入你的用量,即時對比 7 家主流模型的月費。 CJK 語言倍數已自動套用(中文 ×1.3、日文 ×1.7,以 o200k_base 基準)。 實際 token 消耗請用 API 回傳的 usage 欄位校對。

計算中⋯
排名 模型 每月輸入 token 每月輸出 token 月費 (USD) 月費 (NTD)

💡 NTD 以 1 USD = 31 NTD 換算。實際匯率依當下市價。
📊 單價以 2026-04 各家官方公告為準,可能隨時調整——以 API provider 的計價頁面為最終依據。


📊 這個試算器怎麼算的?

單價來源

模型輸入($/M token)輸出($/M token)Cache 折扣
DeepSeek V4$0.28$0.4210%
Qwen-Max~$0.5~$225%
Gemini 3 Pro$2$1225%
GPT-4o$2.50$1050%
GPT-5.4$2.50$1550%
Claude Sonnet 4.6$3$1510%
Claude Opus 4.7$5$2510%

單價來自各家 2026/4 官方公告。可能會變,以 API provider 最新計價為準。

字元 → token 換算(CPT)

因為不同模型的 tokenizer 對各語言效率差異大,試算器用語言別的字元/token 比(CPT)計算實際消耗:

模型英文 CPT中文 CPT日文 CPT
DeepSeek V45.01.180.9
Qwen-Max4.81.20.9
GPT-4o / GPT-55.41.00.77
Gemini 3 Pro5.21.00.82
Claude Sonnet 4.65.51.00.9
Claude Opus 4.75.50.850.72

:貼 500 中文字當輸入、選 GPT-4o,CPT 是 1.0 → token 數約 500。選 Claude Opus 4.7,CPT 是 0.85 → token 數約 588(多 18%)。

Prompt caching 計算

勾選啟用時,假設輸入的 50% 是可快取的 system prompt(多數知識庫應用的實際比例)。這 50% 套用各家的 cache 折扣:

  • Claude:cached input 降至 10%(90% off)
  • GPT:cached input 降至 50%(50% off)
  • Gemini:cached input 降至 25%(75% off)

🎯 試算前你該想清楚的三件事

1. 你的 input / output 比例

多數應用「輸入長、輸出短」(例如客服:客戶問題 200 字、AI 回答 150 字)。輸出比輸入貴 3–5 倍——如果你能用 prompt 限制 AI 輸出長度,單月可省 30% 以上。

2. 你的 prompt 有沒有可快取部分

  • 如果你的 system prompt 每次都一樣(知識庫、角色設定、few-shot 範例)→ 勾選快取,試算反映實際情況
  • 如果每次呼叫的 input 都很不一樣 → 不勾,試算更保守

3. 你的任務是「即時」還是「批次」

  • 即時互動(聊天、即時客服)→ 用上面算出的數字
  • 批次任務(夜間跑報告、資料標註)→ 多數 API 提供 Batch API 再打 5 折,實際成本可以再砍半

💡 看完試算結果的常見疑問

Q: DeepSeek 為什麼這麼便宜?品質差很多嗎?

DeepSeek V4 單價比西方模型低 10–50 倍,主要因為:

  1. 中國訓練成本結構不同(電力、硬體、人力)
  2. 訓練方法更激進(強化學習佔比高、知識蒸餾)
  3. 商業策略是佔市場,不是最大化毛利

品質上 DeepSeek V4 在中文任務接近 Claude Opus 4.6,英文和推理任務略遜 GPT-5.4 / Claude Opus 4.7。對中文為主、品質要求中等的應用,性價比無敵。

Q: 為什麼 Claude Opus 4.7 比 Sonnet 4.6 還貴那麼多?

Opus 是 Claude 旗艦,定位是「我要最強,不計成本」。適合:複雜編碼、長時間 Agent、需要高可靠度的法律 / 金融分析。

如果你的任務不是這個等級的難度,用 Sonnet 4.6 或 Haiku 4.5 就夠——省 3–10 倍成本。

Q: 為什麼不列 GPT-5.4 mini / Gemini Flash 這些便宜款?

試算器專注旗艦模型對比,避免把「品質差距」當成「省錢優勢」。便宜款(mini / Flash / Haiku)另成一個比較維度,通常用於高流量低複雜度場景——那是另一類應用邏輯。

未來會考慮加入「跨層級對比」模式。


🔄 想更深入?

📚 延伸閱讀