Meta Llama 家族繼任者「Avocado」延後發布到 5 月,內部測試表現介於 Google Gemini 2.5 與 3.0 之間。根據多家媒體披露,Meta AI 部門甚至討論過向死對頭 Google 授權 Gemini,暫時撐過產品空窗期。
🥑 事實是什麼
先把新聞稿看完:
- Avocado 原訂 3 月底發布,現延到 5 月,原因是內部 benchmark 落後 Gemini 3.0、OpenAI 與 Anthropic 最新世代模型
- Avocado 不是開源,會走閉源路線——這是 Meta 兩年來第一次偏離 Llama 的開源戰略
- Behemoth(Llama 4 頂規版)已經延宕數月,後續 Watermelon、Mango 影音生成也在排隊
- Meta 的 AI 資本支出今年估計 1,350 億美元,股價已反映壓力
重點不是「Meta 輸了」,而是Meta 已經判斷:在頂規基礎模型這個戰場,他們不可能只靠開源贏。
📉 對開源社群的真正衝擊
你可能看到其他文章寫「開源已死」——我不同意。
中小企業 90% 的場景根本不需要頂規模型。 Llama 3.1 70B、Mistral Large、Qwen 2.5 這些已上市模型,拿來做客服、文件摘要、內部知識庫,完全夠用。Avocado 延後影響的不是這些使用者,而是想用開源頂規模型跟 OpenAI/Anthropic 正面打的少數企業——這群本來就不多。
真正的訊號是另一件事:Meta 在下注「Scaling Law 已經撞牆」這個判斷。
過去三年,只要砸更多 GPU + 更多資料,模型就會變聰明。但 Avocado 明顯遇到邊際效益遞減。同產業其他實驗室心知肚明,只是沒人願意公開承認。當 Meta 被迫延後並傳出借 Gemini,這層紗就破了。
💡 Mason 的判斷
給企業主:
- 如果你原本等 Avocado 再做產品決策——別等了。今天拿 Llama 3.1 或 Mistral 就能做的東西,不會因為 Avocado 兩個月後發布而變得更值得。
- 不要綁單一基礎模型。設計一個可切換底層的應用架構(LiteLLM、OpenRouter 這類 router),讓你隨時換模型。這筆架構成本比你想像中低,比被單一模型卡住便宜得多。
給開發者:
- 開源頂規模型這條路長期看還是會有人做(Mistral、DeepSeek、Qwen 已在跟進),但短期賭 Meta 幫你撐場是很危險的策略。
- 社群蒸餾模型(把 Llama 3 能力壓到 3B-7B)這條路反而更值得關注——它追求「能在筆電跑」而不是「最聰明」,對大部分應用更實用。
給內容/觀察者:
- 如果你看到文章寫「Meta 和 Google 歷史和解」——那是誤讀。這只是停損採購,跟和解沒關係。Meta 在 Facebook/IG 後端的海量推論任務頂不住,短期租 Gemini 比讓產品停擺便宜。商業上純理性。
❓ FAQ
開源模型是不是被商業 API 徹底碾壓了?
沒有。Llama 3.1、Mistral、Qwen、DeepSeek 這些現有開源模型,能力足以涵蓋 90% 以上的商用需求。Avocado 延後影響的是「開源頂規模型對抗 GPT-5、Claude Opus 4」這個最激烈的戰場——但這戰場本來 Meta 就還沒贏過。中小企業繼續用現有開源模型,幾乎不受影響。
真正的分水嶺是:如果你的產品需要最頂尖的推理能力,開源可能永遠追不上。如果你的產品只需要「夠用」,開源一直都是好選擇。
Meta 向 Google 借 Gemini 是和解嗎?
不是。純商業停損。Facebook / IG 後端有大量即時廣告配對、社群內容審核任務,如果自家模型頂不住流量就會直接影響千億廣告營收。花錢租 Gemini 比讓核心業務卡住便宜得多。
這反而說明一件事:雲端基建商(Google Cloud、AWS、Azure)才是 AI 時代的穩賺贏家——你模型再強,算力還是跟他們租。
這件事對 Scaling Law 有什麼意義?
Scaling Law(縮放定律)主張:參數量、資料量、算力同步放大,模型能力就會同步提升。過去 3 年這個定律運作得很好。
Avocado 是第一個公開卡關的頂規模型。內部 benchmark 介於 Gemini 2.5 與 3.0 之間,代表「加大」帶來的智商增益正在衰減。Meta 的工程師不是業餘的,他們撞牆代表這是產業級問題。
未來 2 年的看點會從「誰砸最多錢訓練」轉向「誰能用數學和架構優化壓低推論成本」——蒸餾、量化、稀疏化這類「榨效率」的技術會比「堆參數」更值錢。