過去一週 AI 版權戰三條前線同時開火,而且沒有一條是 AI 廠商贏的:
- 4 月 21 日(德國慕尼黑):法院判 OpenAI 在 GEMA 案敗訴——ChatGPT 重複生成歌詞被認定為侵權,不適用合理使用
- 4 月 25 日(美國 SDNY):Reddit 提交補充訴狀,首次有法院文件把 Perplexity 的 answer engine 描述成「壓平的爬蟲(flattened scraper)」
- 4 月 26 日(美國 SDNY):NYT v. OpenAI 案,OpenAI 駁回動議被否決,訴訟進入實質審理
三件事疊在一起,定義了一個結論:「我是 AI、我做合理使用」這個說詞,在法院已經不再自動成立。
📋 三案同週的關鍵裁定
| 案件 | 日期 | 裁定 | 為什麼重要 |
|---|---|---|---|
| GEMA v. OpenAI(慕尼黑) | 4/21 | OpenAI 敗訴 | 歐洲首例「AI 記憶內容 = 侵權」判例 |
| Reddit v. Perplexity(SDNY) | 4/25 | 訴狀補充 | answer engine 被首次法律定性為「爬蟲」 |
| NYT v. OpenAI(SDNY) | 4/26 | 駁回動議否決 | 進入實質討論 fair use,可能成判例 |
🇩🇪 GEMA 案:歐洲版權的紅線出現了
GEMA 是德國的音樂著作權集體管理組織。它告 OpenAI 的核心點不是「ChatGPT 用了訓練資料」(這個歐洲還在 EU AI Act 框架下處理),是「ChatGPT 會逐字重現歌詞」。
法官的判斷邏輯:
- ChatGPT 重複生成的歌詞,98% 與原文一致(法院實際做了測試)
- 這個現象不是「偶然」,是模型把歌詞完整記憶了
- 完整記憶 + 對使用者再現 = 複製權侵犯,不適用 TDM(text and data mining)例外
這個判例定義了歐洲版權的新紅線:訓練可以,逐字重現不行。
對所有 AI 廠商的後續壓力:必須在模型輸出端加「版權內容過濾器」。OpenAI 已經在做(Output Memorization Filter),但 Claude、Gemini、開源模型多數還沒。未來 12 個月,所有面向歐洲市場的 AI 都要加這個——否則風險不可控。
📊 Reddit v. Perplexity:answer engine 被當成「爬蟲」
這是真正讓我覺得「RAG 商業模式的根基動搖了」的案子。
Reddit 的訴狀邏輯是這樣的:
- Perplexity 與三家代理商(Oxylabs、AWMProxy、SerpApi)合作,繞過 Reddit 的 robots.txt 與 API 計價
- 抓下來的資料用於 RAG 即時生成「答案」,但答案保留 Reddit 內容的核心觀點
- 使用者得到答案就不再點到 Reddit——廣告、會員、UGC 生態被掏空
- 法院應將 Perplexity 的 answer engine 定性為「沒有創新的標準 RAG,本質上是壓平的爬蟲」
這個論述如果被採用,整個 RAG 商業模式會被重新定價:
- Perplexity、Phind、You.com 這類純 answer engine 必須付資料授權費,或被禁止抓取
- ChatGPT Search、Gemini 的 grounded 搜尋功能也會受影響
- 「RAG 是 fair use」這個矽谷共識,在法庭上沒這麼好說
更重要的是,Reddit 不是孤例。Stack Overflow、Quora、Yelp、TripAdvisor、各家新聞網站都會跟進——這個訴訟若 Reddit 勝訴,會打開接下來 18 個月的集體訴訟潮。
🗞️ NYT v. OpenAI:從程序戰進入實質戰
這個案打了一年半,過去都是 OpenAI 各種駁回動議拖延,4/26 法官明確裁定:「OpenAI 引用 fair use 抗辯需要在實質審理中證明,不能用駁回動議結束本案」。
代表的訊號:
- fair use 不再是 AI 公司的萬能盾牌,需要逐案證明 transformative use
- NYT 將獲得 discovery 權利,OpenAI 內部訓練資料、商業考量、付費協商記錄都要交出——這對 OpenAI 是商業祕密層級的災難
- 如果 NYT 勝訴,賠償金額傳出可能在 $1B-$2B 區間,並設定「未來必須付授權費」的判例
OpenAI 現在的兩條路:庭外和解(估計 $300-500M + 多年授權費)、或硬撐到判決(風險更高、且可能影響整個產業)。Sam Altman 過去 6 個月開始密集會見出版業大老闆,不是巧合。
💡 Mason 的判斷
「AI 版權戰」過去兩年是試水溫,2026 春是真開戰。 三件事同週宣判不是巧合——歐美法律圈經過 2024-2025 的醞釀,集體準備好了 AI 版權的判例框架。
接下來 12 個月會發生的事:
- AI 廠商必須開始付授權費——OpenAI 已經和 News Corp、AP、Axel Springer 簽,Anthropic 和 Reddit 簽;這個趨勢會擴散到所有 AI lab
- 訓練資料來源透明化會被強制——EU AI Act 已經要求,美國透過判例會跟進
- 小型開源模型反而最危險——大廠付得起授權費,小廠付不起,開源模型會因為訓練資料合規不確定性,在企業端使用受限
- RAG 商業模式會分裂——「自己有授權內容」(Bloomberg、Thomson Reuters)的 RAG 會贏,「靠抓公開內容」(Perplexity)的會變脆弱
對台灣 / 中文圈的延伸影響:台灣的 AI 訓練資料合規問題目前完全沒被討論。當美歐標準確立,台灣 AI 公司若想銷售到歐美,會面臨 retroactive(回溯)審查——現在訓練的模型,3 年後可能因為當年的資料來源被告。
🎯 不同角色的建議
給 AI 應用商:
- 不要再相信「我是 AI、fair use 沒事」這個說法。歐美判例正在積累,3 年後回看可能變大坑
- 訓練 / fine-tune 資料來源要做 provenance 追蹤(從哪裡來、有沒有授權)。這是 EU AI Act 後就會強制的合規項
- RAG 商業模式設計時,留授權費預算。靠抓公開資料零成本起家的時代,3-5 年內會結束
給內容創作者 / 媒體:
- 你的內容被 AI 用於訓練 / RAG 是有市場價值的——集體訴訟、集體授權比個人打官司有效
- Stack Overflow、Reddit、新聞媒體都已成立授權組織。台灣的內容業者目前沒有等同組織——這是 2026-2027 年該成立的東西
- 個人創作者可在 robots.txt、ai.txt 明確標記「不允許 AI 訓練」——這個聲明在歐洲已有法律效力,美國正在跟進
給律師 / 政策:
- GEMA 案是歐洲新判例,值得做台灣 / 日本的對照分析——歐陸法系國家若採類似邏輯,亞洲 AI 廠商面臨的是統一壓力
- Reddit v. Perplexity 的「壓平爬蟲」論述是訴狀策略創新,可以延伸到反壟斷、不正當競爭等多種法律框架——這是個方法論層級的進步
給普通使用者:
- 你用 ChatGPT、Perplexity 不會直接違法——責任在 AI 廠商。但意識到「這些工具的內容,有相當比例是別人的智慧財產被未經授權使用」是公民素養
- 越來越多 AI 工具會把「來源連結」做得明顯(因為法律壓力)——多點到原始來源,這對內容生態的存活有實質意義
❓ FAQ
這三案的判決會立即生效嗎?
不會,但影響已經在了。GEMA 案 OpenAI 已宣布上訴,終局可能拖到 2027-2028。NYT 案進入實質審理,2027 上半年可能判決。Reddit v. Perplexity 還在訴訟早期,1-2 年才會有結果。
但判例風險不需要終局判決才會影響商業決策——AI 公司、雲廠、企業客戶現在就要重新評估法律暴險。OpenAI、Anthropic 過去 12 個月已經明顯加速簽授權合約,就是預判風險。
Perplexity 真的會被禁掉嗎?
不會被禁,但商業模式會痛。最可能的結果:Perplexity 被迫對 Reddit、Stack Overflow、新聞媒體支付授權費,單位 query 成本上升 3-5 倍。
對使用者而言:Perplexity 仍可用,但價格會調整(目前 $20 / 月可能漲到 $40-60),或免費版功能縮水(限制查詢次數、限制資料來源)。對投資人而言:Perplexity 估值($14B)會修正,因為單位經濟學變差。
那 Claude / ChatGPT 算「壓平的爬蟲」嗎?
法律定性上,Claude 與 ChatGPT 的「Search」「Web 瀏覽」功能跟 Perplexity 性質類似,但有兩個區別:(1) 它們是大型多功能 AI,搜尋只是其中一部分功能,「目的轉化」(transformative purpose)比較容易主張。(2) Anthropic、OpenAI 已主動跟主要新聞 / 內容方簽授權——降低訴訟風險。
但長期看,Reddit 訴狀的邏輯也會被應用到所有 grounded AI 搜尋上。OpenAI 的 ChatGPT Search、Google 的 AI Overviews 都已被個別出版商起訴。RAG 不付錢的時代正在結束——這是底層共識。
Sources: