入門上手
從零開始跑自己的本地 AI
Mason AI Lab 的所有開源 AI 教學、模型評測、本地部署指南,一頁聚合。 從「什麼是開源 LLM」到「用 RAG + MCP 建完整 AI 系統」,不管你是想省錢、重隱私、還是想改模型,這裡都有答案。
模型跑在自己機器上,敏感資料不需要傳到任何雲端,醫療、法律、金融場景首選。
不按 token 計費,跑多少都一樣。高頻呼叫場景的成本可以從每月數千美元降到電費。
Fine-tune、量化、蒸餾、合併——開源模型你愛怎麼改就怎麼改,不受供應商限制。
Hugging Face 上每天數百個新模型,全球開發者共同推進,迭代速度比任何單一公司都快。
每條路徑 3-4 篇文章,照順序看完就能上手。
從零開始跑自己的本地 AI
2026 三大開源模型深度比較
從單一模型到完整 AI 系統
Qwen3.6 vs Gemma 4 vs MiniMax M2.7——一張表看懂差異。
| 項目 | Qwen3.6 | Gemma 4 | MiniMax M2.7 |
|---|---|---|---|
| 總參數 | 235B(MoE) | 27B(Dense) | 456B(MoE) |
| 激活參數 | ~22B | 27B(全量) | ~45.9B |
| SWE-bench | 65.4% | N/A | 56.1% |
| Agent 適用度 | ★★★★★ | ★★★☆☆ | ★★★★☆ |
| 多模態 | 文字 + 視覺 | 文字 + 視覺 + 音訊 | 文字 + 視覺 + 語音 |
| Context 長度 | 128K | 128K | 1M |
| 授權 | Apache 2.0 | Gemma License | MiniMax Open |
| 最低 VRAM | ~16 GB(Q4) | ~18 GB(BF16) | ~32 GB(Q4) |
👉 深度評測:Qwen3.6 · Gemma 4 · MiniMax M2.7
阿里 2026/4/16 開源 Qwen3.6-35B-A3B——35B 總參數每次只啟動 3B,SWE-bench 73.4 勝 Gemma 4,原生多模態 + 100 萬 token。第一輪整理架構、跑分、怎麼跑。
MiniMax M2.7 開源登場——230B 參數 MoE 架構、自主完成 30-50% 訓練流程、SWE-Pro 追平 GPT-5.3 Codex,API 價格卻只有 Opus 的五十分之一。初步拆解架構、跑分、定價與產業衝擊。
2026 年 4 月,Google 釋出開源大模型 Gemma 4!它帶來了 26B MoE 與 31B Dense 的驚人效能。究竟什麼是「本地模型」?它跟付費買 ChatGPT API 有何不同?一文看懂硬體門檻與實戰應用。
完全新手 → 看 開源 LLM 完全指南。
想馬上動手 → 直接跳 Ollama 本地部署教學。
想比模型 → 看 Qwen3.6 · Gemma 4 · MiniMax M2.7 三篇評測。