回到頂部
Karpathy 加入 Anthropic:OpenAI 靈魂人物跑去 Claude pre-training 團隊

Karpathy 加入 Anthropic:OpenAI 靈魂人物跑去 Claude pre-training 團隊

Andrej Karpathy 5/19 宣布加入 Anthropic pre-training 團隊。這不是普通跳槽,而是 Anthropic 從企業採用、算力、工具鏈之後,開始搶 OpenAI 早期研究文化的象徵。

Andrej Karpathy 加入 Anthropic,表面上是一則人才新聞,實際上是 AI 圈敘事權的轉移訊號。

Karpathy 不是普通研究員。他是 OpenAI 共同創辦人之一,曾在 Tesla 負責 AI、Autopilot 與 FSD,也靠 Neural Networks: Zero to Hero、YouTube 課程與一系列教學內容,成為許多工程師理解深度學習與 LLM 的入口。

所以這件事不能只看成「Anthropic 又挖了一個人」。它更像是 Anthropic 對市場說:Claude 不只會賣給企業,我們也要成為 frontier AI 研究者願意回去做 R&D 的地方。


發生了什麼?

5 月 19 日,Karpathy 在 X 上宣布加入 Anthropic,說未來幾年 frontier LLM 會特別關鍵,他很期待回到 R&D。

TechCrunch 報導,他本週開始在 Anthropic pre-training 團隊工作,team lead 是 Nick Joseph。Pre-training 是 frontier model 最核心、最昂貴、也最接近能力上限的階段:模型的世界知識、語言結構、基礎推理能力,很大一部分在這裡形成。

更有意思的是,Anthropic 表示 Karpathy 會建立一支團隊,專注於用 Claude 加速 pre-training research

這句話很關鍵。它不是「讓 Karpathy 訓練 Claude」,而是「讓 Claude 幫助研究 Claude 的下一代訓練方法」。

換句話說,Anthropic 在押一件事:下一輪 frontier 模型競爭,不只是誰有更多 GPU / TPU,而是誰能用 AI 加速 AI 研究本身。


為什麼 Karpathy 的象徵價值這麼高?

AI 圈有很多明星研究員,但 Karpathy 特別之處在於他跨過三個世界:

身份代表意義
OpenAI 共同創辦人早期 frontier AI 研究文化
Tesla AI 負責人大規模真實世界 AI 系統落地
教育者 / Eureka Labs把複雜 AI 概念講給工程師與大眾

這三個身份加在一起,使他不像一般「某某資深科學家加入某公司」。他代表的是一種研究氣質:從底層原理、訓練系統、工程落地到教學傳播都懂。

Anthropic 這幾個月其實已經在企業市場很強。Ramp AI Index 指出 Anthropic 在 4 月企業採用率首次超過 OpenAI;PwC、KPMG、金融業、大型顧問公司都在推 Claude;Google、AWS 也把算力與資本壓在 Anthropic 身上。

但企業採用和研究文化是兩回事。企業採用代表「客戶相信你」。Karpathy 加入代表「研究者願意把下一段時間押在你身上」。

這兩種訊號疊在一起,才是 Anthropic 真正想要的。


Pre-training 為什麼比 post-training 更敏感?

一般使用者最常感受到的是 post-training:模型比較有禮貌、比較會拒絕、比較會遵守格式、比較像好助理。

但 pre-training 才是模型的地基。

Pre-training 決定了:

  • 模型吸收什麼資料
  • 資料混合比例怎麼設計
  • 訓練過程如何穩定
  • 模型如何形成世界知識
  • 長程推理與知識遷移能力的底層上限
  • 同樣算力下能不能訓練出更有效率的模型

這就是為什麼 Karpathy 加入 pre-training 團隊比加入產品團隊更值得寫。產品團隊能讓 Claude 更好用;pre-training 團隊可能改變 Claude 下一代模型的能力天花板。


AI-assisted research:下一輪競爭的真戰場

TechCrunch 報導裡最值得注意的一句,是 Anthropic 要讓 Karpathy 建立「用 Claude 加速 pre-training research」的團隊。

這代表 Anthropic 的 thesis 可能是:

Frontier AI 不會只靠堆算力前進,而是靠 AI 協助研究員找到更好的訓練方法。

這聽起來有點玄,但實務上可以拆成幾件事:

  1. 自動讀 paper 與 codebase:整理新方法、重現結果、找失敗案例
  2. 分析訓練 log:找 loss spike、資料異常、訓練不穩定原因
  3. 產生實驗設計:提出 ablation、資料混合、架構調整方案
  4. 寫訓練與評估工具:減少研究員在 plumbing 上浪費時間
  5. 模型行為診斷:比較不同 checkpoint 的能力變化與風險變化

如果這條路走通,算力不是不重要,而是每一單位算力能產出的研究進展會變多

這正好是 Anthropic 需要的。它的算力很大,但未必能永遠跟 OpenAI、Google、Meta 硬拼總量。提高研究效率,是它比較合理的路。


這跟 OpenAI 有什麼關係?

Karpathy 曾是 OpenAI 共同創辦人,後來離開、回去、再離開。現在加入 Anthropic,很容易被寫成「OpenAI 人才流失」。

但我不建議只用八卦角度看。真正值得看的,是 OpenAI 與 Anthropic 代表的兩種吸引力正在分化。

OpenAI 的吸引力:

  • 產品規模最大
  • ChatGPT 心智最強
  • 消費者與企業入口都很強
  • 資本與基建動員能力驚人

Anthropic 的吸引力:

  • 企業信任度快速上升
  • Claude Code / Cowork / Security 產品線更聚焦知識工作
  • 安全研究與模型行為研究形象強
  • 研究者可能覺得這裡更像「還能做研究的 frontier lab」

這不是誰贏誰輸,而是 AI lab 的品牌正在分岔。OpenAI 越來越像 AI super app 公司;Anthropic 越來越像 frontier model + enterprise infrastructure 公司。

Karpathy 選 Anthropic,剛好讓這個分岔更清楚。


Mason 的判斷

Karpathy 加入 Anthropic,短期不會讓 Claude 明天突然變強;但它會改變市場對 Anthropic 的想像。

過去幾週 Anthropic 的故事是:

  • Google / AWS / Blackstone 用資本與算力綁定
  • PwC / KPMG / 金融業用企業部署綁定
  • Stainless 用 API / MCP 工具鏈綁定
  • Karpathy 用 pre-training 研究文化綁定

這四件事拼起來,Anthropic 已經不是「比較安全的 OpenAI 替代品」。它在建立一個完整敘事:我們有模型、有企業、有算力、有工具鏈,也有人才。

這對 OpenAI 真正的壓力不是少了一個人,而是 Anthropic 正在讓「嚴肅 AI 工作」這個標籤往 Claude 移動。


不同角色的建議

給開發者

  • 不用因為 Karpathy 跳槽立刻換模型
  • 但 Claude 下一代模型值得追,尤其是長程推理、程式碼、研究輔助、agent 任務
  • 如果你做 AI tooling,要注意 Anthropic 會更強化 Claude + MCP + SDK 這條線

給企業 AI 負責人

  • 這是 Anthropic 長期可信度加分,不是短期採購理由
  • 採購仍要看資料治理、成本、部署模式、供應商風險
  • 但如果你在押 2-3 年 AI 策略,Claude 已經不能只當備用模型看

給 AI 研究者 / 學生

  • Karpathy 的動向值得看,因為他常站在「哪裡還能做有趣基礎研究」的位置
  • AI-assisted AI research 會是未來 12-24 個月重要題目
  • 學會看 training dynamics、eval、資料品質,可能比只會調 prompt 更有價值

FAQ

Karpathy 加入 Anthropic 會讓 Claude 馬上變強嗎?

不會。Pre-training 研究影響的是下一輪或下下輪模型,不是當週產品更新。但如果 Anthropic 真把 AI-assisted pre-training research 做起來,影響會反映在未來模型的訓練效率、資料品質與能力上限。

這是否代表 OpenAI 人才流失嚴重?

單一跳槽不能直接下這個結論。比較準確的說法是:Anthropic 現在不只搶企業客戶,也在搶 frontier AI 研究文化的象徵人物。這會影響市場和人才對兩家公司定位的想像。

為什麼 pre-training 這麼重要?

因為 pre-training 是模型能力地基。Post-training 可以讓模型更像好助理,但 pre-training 決定模型吸收什麼知識、形成什麼能力、訓練效率如何,以及下一代模型能不能突破目前瓶頸。

Sources:

№ · further reading

延伸閱讀