輸入你的用量,即時看 7 家主流模型一個月要花多少錢。 包含 Claude Opus 4.7、GPT-5.4、Gemini 3 Pro、DeepSeek V4、Qwen-Max 等——不用自己查單價、不用自己算 token 換算,也不用擔心 CJK 倍數——這裡全部處理好了。
🧮 馬上試算
💰 AI API 月費試算器
輸入你的用量,即時對比 7 家主流模型的月費。
CJK 語言倍數已自動套用(中文 ×1.3、日文 ×1.7,以 o200k_base 基準)。
實際 token 消耗請用 API 回傳的 usage 欄位校對。
| 排名 | 模型 | 每月輸入 token | 每月輸出 token | 月費 (USD) | 月費 (NTD) |
|---|
💡 NTD 以 1 USD = 31 NTD 換算。實際匯率依當下市價。
📊 單價以 2026-04 各家官方公告為準,可能隨時調整——以 API provider 的計價頁面為最終依據。
📊 這個試算器怎麼算的?
單價來源
| 模型 | 輸入($/M token) | 輸出($/M token) | Cache 折扣 |
|---|---|---|---|
| DeepSeek V4 | $0.28 | $0.42 | 10% |
| Qwen-Max | ~$0.5 | ~$2 | 25% |
| Gemini 3 Pro | $2 | $12 | 25% |
| GPT-4o | $2.50 | $10 | 50% |
| GPT-5.4 | $2.50 | $15 | 50% |
| Claude Sonnet 4.6 | $3 | $15 | 10% |
| Claude Opus 4.7 | $5 | $25 | 10% |
單價來自各家 2026/4 官方公告。可能會變,以 API provider 最新計價為準。
字元 → token 換算(CPT)
因為不同模型的 tokenizer 對各語言效率差異大,試算器用語言別的字元/token 比(CPT)計算實際消耗:
| 模型 | 英文 CPT | 中文 CPT | 日文 CPT |
|---|---|---|---|
| DeepSeek V4 | 5.0 | 1.18 | 0.9 |
| Qwen-Max | 4.8 | 1.2 | 0.9 |
| GPT-4o / GPT-5 | 5.4 | 1.0 | 0.77 |
| Gemini 3 Pro | 5.2 | 1.0 | 0.82 |
| Claude Sonnet 4.6 | 5.5 | 1.0 | 0.9 |
| Claude Opus 4.7 | 5.5 | 0.85 | 0.72 |
例:貼 500 中文字當輸入、選 GPT-4o,CPT 是 1.0 → token 數約 500。選 Claude Opus 4.7,CPT 是 0.85 → token 數約 588(多 18%)。
Prompt caching 計算
勾選啟用時,假設輸入的 50% 是可快取的 system prompt(多數知識庫應用的實際比例)。這 50% 套用各家的 cache 折扣:
- Claude:cached input 降至 10%(90% off)
- GPT:cached input 降至 50%(50% off)
- Gemini:cached input 降至 25%(75% off)
🎯 試算前你該想清楚的三件事
1. 你的 input / output 比例
多數應用「輸入長、輸出短」(例如客服:客戶問題 200 字、AI 回答 150 字)。輸出比輸入貴 3–5 倍——如果你能用 prompt 限制 AI 輸出長度,單月可省 30% 以上。
2. 你的 prompt 有沒有可快取部分
- 如果你的 system prompt 每次都一樣(知識庫、角色設定、few-shot 範例)→ 勾選快取,試算反映實際情況
- 如果每次呼叫的 input 都很不一樣 → 不勾,試算更保守
3. 你的任務是「即時」還是「批次」
- 即時互動(聊天、即時客服)→ 用上面算出的數字
- 批次任務(夜間跑報告、資料標註)→ 多數 API 提供 Batch API 再打 5 折,實際成本可以再砍半
💡 看完試算結果的常見疑問
Q: DeepSeek 為什麼這麼便宜?品質差很多嗎?
DeepSeek V4 單價比西方模型低 10–50 倍,主要因為:
- 中國訓練成本結構不同(電力、硬體、人力)
- 訓練方法更激進(強化學習佔比高、知識蒸餾)
- 商業策略是佔市場,不是最大化毛利
品質上 DeepSeek V4 在中文任務接近 Claude Opus 4.6,英文和推理任務略遜 GPT-5.4 / Claude Opus 4.7。對中文為主、品質要求中等的應用,性價比無敵。
Q: 為什麼 Claude Opus 4.7 比 Sonnet 4.6 還貴那麼多?
Opus 是 Claude 旗艦,定位是「我要最強,不計成本」。適合:複雜編碼、長時間 Agent、需要高可靠度的法律 / 金融分析。
如果你的任務不是這個等級的難度,用 Sonnet 4.6 或 Haiku 4.5 就夠——省 3–10 倍成本。
Q: 為什麼不列 GPT-5.4 mini / Gemini Flash 這些便宜款?
試算器專注旗艦模型對比,避免把「品質差距」當成「省錢優勢」。便宜款(mini / Flash / Haiku)另成一個比較維度,通常用於高流量低複雜度場景——那是另一類應用邏輯。
未來會考慮加入「跨層級對比」模式。
🔄 想更深入?
- Token 是什麼?完整入門 — 先搞懂 token 的基礎
- 中文 token 比英文省? — 深入 CJK tokenizer 效率
- GPT vs Claude vs Gemini 三大模型比較 — 不只看價格
- Claude Opus 4.7 正式發布 — 旗艦模型細節