📰 封鎖越嚴,中國 AI 越強?
2022 年起,美國對中國實施了史上最嚴厲的晶片出口管制——禁止 NVIDIA、AMD 等公司向中國出售先進 AI 晶片。
目標很明確:掐住中國 AI 發展的脖子。
結果呢?
- DeepSeek V4 在多項基準測試中追平甚至超越 GPT-5.4,訓練成本卻只有 1/10
- 華為 Ascend 晶片成為中國企業的 NVIDIA 替代品,訂單暴增
- SMIC 在沒有 EUV 光刻機的情況下量產 7nm 晶片
💡 一句話理解 美國試圖用硬體封鎖阻止中國 AI 發展。中國的回應是:用更聰明的軟體繞過硬體限制,同時加速自製替代品。
🧠 DeepSeek:用效率打敗算力
核心策略
DeepSeek 面對的現實是:拿不到最好的 GPU,就想辦法讓現有的 GPU 做更多事。
| 比較 | OpenAI(GPT-5.4) | DeepSeek(V4) |
|---|---|---|
| GPU 資源 | 無限制取得最先進晶片 | 受出口管制限制 |
| 訓練成本 | 數億美元 | ~1/10 成本 |
| 參數量 | 未公開 | 1 兆(稀疏啟動) |
| 方法論 | 規模暴力堆疊 | 演算法創新 |
| 效果 | 業界最強之一 | 多項測試追平 |
三大技術突破
1. 稀疏專家混合(Mixture of Experts, MoE)
不是所有 1 兆參數都同時運作——每次推理只啟動其中一小部分「專家」。
白話解釋: 想像一家醫院有 100 位醫生,但每個病人只需要 3-5 位相關專科醫生看診。不需要 100 位同時工作,效率大幅提升。
2. 流形約束超連接(Manifold-Constrained Hyper-Connections)
2026 年 1 月發表的新技術,讓超大模型的訓練更穩定,不需要線性增加算力。
白話解釋: 傳統方法是「模型大 2 倍,需要的電腦也多 2 倍」。DeepSeek 找到了讓模型變大但不等比增加成本的方法。
3. 推論優化
在拿不到最強訓練晶片的情況下,DeepSeek 把重心放在「讓已訓練的模型跑得更快更省」:
- 稀疏注意力機制(不看全部資料,只看重要的部分)
- 量化壓縮(用更少的記憶體儲存模型)
- 自研推論框架
🔧 華為 Ascend:NVIDIA 的中國替代品
現狀
| 指標 | 數據 |
|---|---|
| 最新晶片 | Ascend 910C / 950PR |
| 主要客戶 | 字節跳動、阿里巴巴、百度 |
| 配套軟體 | MindSpore 框架 + CANN 運算架構 |
| 2026 年目標產量 | 數十萬顆 AI 晶片 |
| 對標產品 | NVIDIA H100 / H200 |
華為的 CUDA 替代之路
NVIDIA 的護城河不只是硬體,更是軟體生態系 CUDA——全球 AI 研究員都用 CUDA。華為的挑戰是建立自己的軟體生態:
| NVIDIA 生態系 | 華為替代方案 | 成熟度 |
|---|---|---|
| CUDA | CANN | 🟡 60-70% |
| cuDNN | MindSpore Lite | 🟡 50-60% |
| TensorRT | MindSpore Serving | 🟠 40-50% |
| 整體生態 | 快速追趕中 | 🟡 3-5 年落後 |
挑戰
- 互連能力 — 晶片間的通訊速度仍落後 NVIDIA
- HBM(高頻寬記憶體) — 中國的長鑫存儲(CXMT)正在開發,但還未量產
- 良率 — 使用 DUV 製程的成本和良率都不如 EUV
🏭 SMIC:沒有 EUV 也能造晶片
怎麼做到 7nm?
全球最先進的晶片製造需要 EUV 光刻機(極紫外光刻),而 ASML 被禁止出售給中國。
SMIC 的解法:用舊的 DUV 光刻機,透過多重曝光(Multi-patterning)實現 7nm 製程。
| 比較 | TSMC | SMIC |
|---|---|---|
| 最先進製程 | 2nm(量產中) | 7nm(量產)/ 5nm(試產) |
| 使用設備 | EUV + DUV | 僅 DUV |
| 良率 | 90%+ | 估計 50-70% |
| 成本 | 優勢 | 高 30-50% |
| 技術落後 | 領先 | 約 5-7 年 |
「十五五」AI 計畫
中國的第 15 個五年計畫(2026-2030)將 AI 列為最高優先:
- 要求新增產能至少 50% 使用國產設備
- 目標 2030 年前實現 AI 全產業鏈應用
- 大力扶植國產 EDA 工具和晶片設計軟體
⚔️ 美國的反制措施
2026 年的新動作
| 措施 | 內容 |
|---|---|
| 華為晶片禁令 | 明確禁止全球企業使用華為 Ascend 910 系列 |
| 晶片安全法案 | 要求晶片廠商追蹤和報告可能的違規轉售 |
| 走私查緝 | 加強對中間商和第三國轉口的監控 |
| NVIDIA 特別限制 | 即使部分弱化版晶片(如 H200 限制版)仍需許可 |
但效果如何?
短期有效,長期存疑:
- ✅ 確實減緩了中國取得最先進硬體的速度
- ✅ 增加了中國 AI 訓練的成本和時間
- ❌ 沒有阻止 DeepSeek 等公司透過演算法創新追上
- ❌ 反而加速了中國建立自主供應鏈的決心
- ❌ 走私和第三國轉口仍然存在
🌍 對全球的影響
供應鏈分裂
2020 年前:全球統一的半導體供應鏈
TSMC → 全世界
2026 年:正在分裂為兩條供應鏈
西方供應鏈:TSMC + ASML + NVIDIA → 美歐日韓
中國供應鏈:SMIC + 華為 + 國產設備 → 中國 + 友好國家
對台灣的特殊意義
台灣在這場對抗中處於最關鍵的位置:
| 角色 | 影響 |
|---|---|
| TSMC | 全球最先進晶片的唯一量產者 |
| 地緣政治 | 晶片戰的核心籌碼 |
| 經濟利益 | AI 晶片需求推動台灣半導體出口創新高 |
| 安全風險 | 成為大國博弈的焦點 |
🤔 你應該怎麼看?
如果你用 AI 工具
- 好消息:競爭帶來更好的產品 — DeepSeek 的開源模型免費使用,逼迫 OpenAI 降價
- 好消息:AI 成本持續下降 — 中國的效率創新間接讓全球 AI 變便宜
- 注意:數據主權 — 使用中國 AI 工具時要注意數據存儲和隱私政策
如果你是 AI 從業者
- 學習開源生態 — DeepSeek V4 是開源的,可以自由研究和部署
- 關注效率技術 — MoE、稀疏注意力等技術不只是中國在用
- 雙軌策略 — 了解中西方兩套 AI 生態系都有幫助
如果你關注地緣政治
- 晶片戰才剛開始,2026 年是中盤——不是結局
- 技術封鎖的效果正在遞減
- TSMC 和台灣的戰略地位短期內無人能取代
❓ FAQ
DeepSeek 真的比 GPT-5.4 強嗎?
在某些基準測試上是的(特別是數學和程式設計),但在其他領域(如創意寫作和多模態理解)GPT-5.4 仍然領先。更準確的說法是:DeepSeek 用遠少於 OpenAI 的資源,達到了「接近同級」的表現——這本身就是一個驚人的成就。參考 GPT-5.4 vs DeepSeek V4 完整比較。
中國真的能擺脫對 TSMC 的依賴嗎?
短期內不行。SMIC 在技術上落後 TSMC 5-7 年,而且沒有 EUV 光刻機這個差距很難短期彌補。但中國的策略不是「追上 TSMC」,而是「做出夠用的晶片」——對於大多數 AI 推論工作,7nm 製程已經足夠。
晶片禁令會讓中國 AI 落後嗎?
已經造成了 1-2 年的硬體落後,但 DeepSeek 證明了軟體創新可以部分彌補硬體差距。長期來看,禁令可能產生「疫苗效應」——短期帶來痛苦,但長期反而加速了中國建立自主能力的進程。這是否符合美國的長期利益,是一個開放性問題。
台灣人應該擔心嗎?
台灣的半導體產業短期內受益於 AI 需求暴增(TSMC 營收創新高)。但長期的地緣政治風險是真實的——當一個島的晶片產能攸關全球科技霸權,各方的關注度只會越來越高。對個人來說,了解這個格局、培養不依賴單一產業的能力是最穩健的策略。