Karpathy 加入 Anthropic：OpenAI 靈魂人物跑去 Claude pre-training 團隊

Andrej Karpathy 5/19 宣布加入 Anthropic pre-training 團隊。這不是普通跳槽，而是 Anthropic 從企業採用、算力、工具鏈之後，開始搶 OpenAI 早期研究文化的象徵。

發布：2026-05-20

⚡ 重點摘要 (TL;DR)

Andrej Karpathy 5/19 宣布加入 Anthropic，進入 Claude pre-training 團隊，負責與 frontier LLM 訓練核心能力相關的研究
Karpathy 曾是 OpenAI 共同創辦人、Tesla AI 負責人，也曾創辦 AI 教育新創 Eureka Labs；他的象徵價值比一般研究員跳槽大很多
TechCrunch 指出，他將在 Anthropic 建立一支用 Claude 加速 pre-training research 的團隊，這代表 Anthropic 押注 AI-assisted research
這件事和 Anthropic 近期企業採用超過 OpenAI、Google/AWS 算力綁定、收購 Stainless 工具鏈形成同一條線
Mason 判斷：Anthropic 不只在搶客戶，它也在搶「誰代表 frontier AI 研究文化」的敘事權
對使用者而言，短期不用因此換模型；但長期要注意 Claude 下一代模型是否會在訓練效率、資料品質與 AI 研究自動化上拉開差距

Andrej Karpathy 加入 Anthropic，表面上是一則人才新聞，實際上是 AI 圈敘事權的轉移訊號。

Karpathy 不是普通研究員。他是 OpenAI 共同創辦人之一，曾在 Tesla 負責 AI、Autopilot 與 FSD，也靠 Neural Networks: Zero to Hero、YouTube 課程與一系列教學內容，成為許多工程師理解深度學習與 LLM 的入口。

所以這件事不能只看成「Anthropic 又挖了一個人」。它更像是 Anthropic 對市場說：Claude 不只會賣給企業，我們也要成為 frontier AI 研究者願意回去做 R&D 的地方。

發生了什麼？

5 月 19 日，Karpathy 在 X 上宣布加入 Anthropic，說未來幾年 frontier LLM 會特別關鍵，他很期待回到 R&D。

TechCrunch 報導，他本週開始在 Anthropic pre-training 團隊工作，team lead 是 Nick Joseph。Pre-training 是 frontier model 最核心、最昂貴、也最接近能力上限的階段：模型的世界知識、語言結構、基礎推理能力，很大一部分在這裡形成。

更有意思的是，Anthropic 表示 Karpathy 會建立一支團隊，專注於用 Claude 加速 pre-training research。

這句話很關鍵。它不是「讓 Karpathy 訓練 Claude」，而是「讓 Claude 幫助研究 Claude 的下一代訓練方法」。

換句話說，Anthropic 在押一件事：下一輪 frontier 模型競爭，不只是誰有更多 GPU / TPU，而是誰能用 AI 加速 AI 研究本身。

為什麼 Karpathy 的象徵價值這麼高？

AI 圈有很多明星研究員，但 Karpathy 特別之處在於他跨過三個世界：

身份	代表意義
OpenAI 共同創辦人	早期 frontier AI 研究文化
Tesla AI 負責人	大規模真實世界 AI 系統落地
教育者 / Eureka Labs	把複雜 AI 概念講給工程師與大眾

這三個身份加在一起，使他不像一般「某某資深科學家加入某公司」。他代表的是一種研究氣質：從底層原理、訓練系統、工程落地到教學傳播都懂。

Anthropic 這幾個月其實已經在企業市場很強。Ramp AI Index 指出 Anthropic 在 4 月企業採用率首次超過 OpenAI；PwC、KPMG、金融業、大型顧問公司都在推 Claude；Google、AWS 也把算力與資本壓在 Anthropic 身上。

但企業採用和研究文化是兩回事。企業採用代表「客戶相信你」。Karpathy 加入代表「研究者願意把下一段時間押在你身上」。

這兩種訊號疊在一起，才是 Anthropic 真正想要的。

Pre-training 為什麼比 post-training 更敏感？

一般使用者最常感受到的是 post-training：模型比較有禮貌、比較會拒絕、比較會遵守格式、比較像好助理。

但 pre-training 才是模型的地基。

Pre-training 決定了：

模型吸收什麼資料
資料混合比例怎麼設計
訓練過程如何穩定
模型如何形成世界知識
長程推理與知識遷移能力的底層上限
同樣算力下能不能訓練出更有效率的模型

這就是為什麼 Karpathy 加入 pre-training 團隊比加入產品團隊更值得寫。產品團隊能讓 Claude 更好用；pre-training 團隊可能改變 Claude 下一代模型的能力天花板。

AI-assisted research：下一輪競爭的真戰場

TechCrunch 報導裡最值得注意的一句，是 Anthropic 要讓 Karpathy 建立「用 Claude 加速 pre-training research」的團隊。

這代表 Anthropic 的 thesis 可能是：

Frontier AI 不會只靠堆算力前進，而是靠 AI 協助研究員找到更好的訓練方法。

這聽起來有點玄，但實務上可以拆成幾件事：

自動讀 paper 與 codebase：整理新方法、重現結果、找失敗案例
分析訓練 log：找 loss spike、資料異常、訓練不穩定原因
產生實驗設計：提出 ablation、資料混合、架構調整方案
寫訓練與評估工具：減少研究員在 plumbing 上浪費時間
模型行為診斷：比較不同 checkpoint 的能力變化與風險變化

如果這條路走通，算力不是不重要，而是每一單位算力能產出的研究進展會變多。

這正好是 Anthropic 需要的。它的算力很大，但未必能永遠跟 OpenAI、Google、Meta 硬拼總量。提高研究效率，是它比較合理的路。

這跟 OpenAI 有什麼關係？

Karpathy 曾是 OpenAI 共同創辦人，後來離開、回去、再離開。現在加入 Anthropic，很容易被寫成「OpenAI 人才流失」。

但我不建議只用八卦角度看。真正值得看的，是 OpenAI 與 Anthropic 代表的兩種吸引力正在分化。

OpenAI 的吸引力：

產品規模最大
ChatGPT 心智最強
消費者與企業入口都很強
資本與基建動員能力驚人

Anthropic 的吸引力：

企業信任度快速上升
Claude Code / Cowork / Security 產品線更聚焦知識工作
安全研究與模型行為研究形象強
研究者可能覺得這裡更像「還能做研究的 frontier lab」

這不是誰贏誰輸，而是 AI lab 的品牌正在分岔。OpenAI 越來越像 AI super app 公司；Anthropic 越來越像 frontier model + enterprise infrastructure 公司。

Karpathy 選 Anthropic，剛好讓這個分岔更清楚。

Mason 的判斷

Karpathy 加入 Anthropic，短期不會讓 Claude 明天突然變強；但它會改變市場對 Anthropic 的想像。

過去幾週 Anthropic 的故事是：

Google / AWS / Blackstone 用資本與算力綁定
PwC / KPMG / 金融業用企業部署綁定
Stainless 用 API / MCP 工具鏈綁定
Karpathy 用 pre-training 研究文化綁定

這四件事拼起來，Anthropic 已經不是「比較安全的 OpenAI 替代品」。它在建立一個完整敘事：我們有模型、有企業、有算力、有工具鏈，也有人才。

這對 OpenAI 真正的壓力不是少了一個人，而是 Anthropic 正在讓「嚴肅 AI 工作」這個標籤往 Claude 移動。

不同角色的建議

給開發者：

不用因為 Karpathy 跳槽立刻換模型
但 Claude 下一代模型值得追，尤其是長程推理、程式碼、研究輔助、agent 任務
如果你做 AI tooling，要注意 Anthropic 會更強化 Claude + MCP + SDK 這條線

給企業 AI 負責人：

這是 Anthropic 長期可信度加分，不是短期採購理由
採購仍要看資料治理、成本、部署模式、供應商風險
但如果你在押 2-3 年 AI 策略，Claude 已經不能只當備用模型看

給 AI 研究者 / 學生：

Karpathy 的動向值得看，因為他常站在「哪裡還能做有趣基礎研究」的位置
AI-assisted AI research 會是未來 12-24 個月重要題目
學會看 training dynamics、eval、資料品質，可能比只會調 prompt 更有價值

FAQ

Karpathy 加入 Anthropic 會讓 Claude 馬上變強嗎？

不會。Pre-training 研究影響的是下一輪或下下輪模型，不是當週產品更新。但如果 Anthropic 真把 AI-assisted pre-training research 做起來，影響會反映在未來模型的訓練效率、資料品質與能力上限。

這是否代表 OpenAI 人才流失嚴重？

單一跳槽不能直接下這個結論。比較準確的說法是：Anthropic 現在不只搶企業客戶，也在搶 frontier AI 研究文化的象徵人物。這會影響市場和人才對兩家公司定位的想像。

為什麼 pre-training 這麼重要？

因為 pre-training 是模型能力地基。Post-training 可以讓模型更像好助理，但 pre-training 決定模型吸收什麼知識、形成什麼能力、訓練效率如何，以及下一代模型能不能突破目前瓶頸。

Sources:

№ · further reading