Grok 的風險爭議,從「AI 回答太衝」升級成「AI 公司要不要為產品設計負責」。
2026 年 6 月 11 日,The Guardian 報導,前 xAI 工程師 Devin Kim 在加州州法院提告,稱自己因為要求 Grok 加強安全機制而遭解雇。幾乎同一天,WIRED 也發布調查,指出 Grok Imagine 仍可產生並託管非自願性化深偽內容。
這兩件事放在一起看,焦點不該停在 Elon Musk 個人或 Grok 爭議八卦。
真正值得注意的是:AI 產品的責任邊界正在改變。
以前平台常見說法是:「內容是使用者上傳的,我們收到檢舉再處理。」
但生成式 AI 不一樣。當內容是你的模型產生、你的介面引導、你的平台託管、你的社群擴散時,責任就很難只推給使用者。
發生了什麼?
這一輪 Grok 爭議可以拆成三條線。
| 時間 | 事件 | 為什麼重要 |
|---|---|---|
| 2026/06/05 | The Guardian 報導,英國工黨議員 Jess Asato 對 xAI 提出測試案件,並有更多人準備跟進 | 法律焦點開始放在 AI 開發商的設計責任,而不只是個別使用者的惡意行為 |
| 2026/06/11 | 前 xAI 工程師 Devin Kim 提告,稱自己因推動 Grok 安全機制而被解雇 | 若指控成立,代表公司內部安全治理可能有工具,卻缺少阻止上線的權力 |
| 2026/06/11 | WIRED 調查指出,Grok.com 仍託管部分非自願性化深偽內容,且有內容被分享到 X | 說明「已加強限制」不等於風險已解決,平台還要證明防護有效 |
The Guardian 報導中,Kim 指稱他曾要求 xAI 在 Grok 開發上加入更完整的安全機制,但遭到管理層阻擋,並在原本要向公司高層簡報 AI 安全前被解雇。訴訟指控 xAI 與 SpaceX 涉及報復與違法解雇。xAI 和 SpaceX 尚未對該媒體的請求立即回應。
WIRED 的調查則指出,Grok Imagine 仍被用來生成與託管非自願性化深偽內容。WIRED 在公開 Grok.com 連結中找到數十個相關案例,並指出有些連結被分享到 X;在媒體聯絡 xAI 與 X 後,部分內容變成不可用或被下架。
這比「模型偶爾破防」更嚴重,因為風險串起了生成、託管、分享、下架到法律責任的完整鏈條。
這件事為什麼值得寫?
1. Grok 是 AI 安全治理的極端案例
Grok 的品牌本來就主打「敢講、不那麼保守」。這讓它在社群上有辨識度,也讓它更容易吸引想測試邊界的人。
問題是,生成式 AI 的「敢」不是只有語氣問題。當產品包含圖片、影片、聲音、真人肖像、公開社群與即時分享,風險會從文字冒犯升級成具體傷害。
在文字聊天裡,錯誤回答可能是誤導。
在影像生成裡,錯誤設計可能讓一個人的肖像被非自願加工、擴散,甚至被反覆搜尋與轉貼。
這也是為什麼 Grok 事件不該只被當成「xAI 比較激進」。更精準的說法是:它把生成式 AI 的產品責任問題提早炸出來了。
2. 法律焦點從「內容下架」移到「設計選擇」
過去平台治理常把焦點放在下架速度:
- 內容有沒有違規?
- 使用者有沒有檢舉?
- 平台多久內移除?
- 是否封鎖帳號?
但 AI 生成工具會多一層問題:
| 舊平台問題 | 生成式 AI 平台多出來的問題 |
|---|---|
| 使用者上傳了什麼? | 模型是否本來就能生成傷害內容? |
| 平台是否收到檢舉? | 產品是否預設把輸出公開或容易分享? |
| 下架是否及時? | 是否在生成前就能阻止高風險請求? |
| 使用者是否違規? | 公司是否知道風險卻仍選擇上線? |
Jess Asato 案中,律師的核心論點就是 AI 公司做了產品架構選擇。討論不能只停在「有人拿工具做壞事」,還要問工具為什麼那麼容易被用來做壞事。
這條線很重要,因為它可能影響所有 AI 影像工具、修圖工具、語音工具、社群平台與 AI app store 的責任判斷。
3. 內部安全團隊能不能說話,會變成投資風險
Devin Kim 的訴訟如果後續成立,會讓外界更關心一個問題:AI 公司內部的 safety team 到底有沒有實權?
很多 AI 公司都會說自己重視安全。真正關鍵在於當安全團隊說「不能上線」「要延後」「要加限制」時,公司是否真的會聽。
這件事卡在 SpaceX IPO 前夕,更讓問題從倫理爭議變成資本市場問題。
如果一個 AI 產品有大量潛在法律責任,投資人會問:
- 公司是否低估深偽與未成年人相關風險?
- 風險是否已經進入財報與上市文件?
- 內部是否有足夠安全審查流程?
- 是否保留 prompt、輸出、申訴與下架紀錄?
- 是否會因跨國監管而影響產品上線?
換句話說,AI 安全會從公關部門的形象工程,進入法務、財務與估值模型。
Grok 這次爭議和一般 deepfake 有什麼不同?
一般 deepfake 工具常是小網站、地下論壇、App Store 邊緣工具,平台可以說自己只是其中一個通路。
Grok 的特殊之處在於,它背後是 xAI、X 與 SpaceX 這個超大生態:
| 層級 | Grok 爭議的特殊性 |
|---|---|
| 模型 | 大型 AI 公司主力產品,風險可見度高於邊緣生成工具 |
| 介面 | 使用者可以用聊天方式提出要求,門檻極低 |
| 託管 | WIRED 指出部分生成內容存在 Grok.com 公開連結 |
| 擴散 | X 本身就是大型社群平台,內容容易被轉貼與放大 |
| 商業 | Grok 與 X Premium、SuperGrok、SpaceXAI 敘事連在一起 |
| 監管 | 涉及美國、英國、加拿大、歐盟等多地法規 |
這種「模型 + 社群 + 訂閱 + 公開分享」的組合,讓濫用速度遠高於傳統 deepfake 網站。
過去你可能要下載工具、找素材、學 prompt、找地方分享。現在使用者只要在平台內完成一連串操作,就可能從生成一路走到擴散。
這正是產品設計責任的核心:整個流程把危險變得太順,比單一功能缺陷更難處理。
為什麼「下架」不夠?
下架是必要的,但不是充分的。
因為在非自願深偽場景裡,傷害往往發生在內容生成和第一次曝光的瞬間。等到受害者看到、找到申訴管道、提交證明、等待平台處理,內容可能已經被截圖、備份、轉貼。
研究也支持這個方向。2026 年一篇 arXiv 論文分析非自願性化深偽內容在監管與平台衝擊後的變化,指出單靠關站或監管訊號,可能只是把活動轉移到其他平台,不一定真正降低總量。
另一篇針對雙用途 AI 換臉 app 的安全稽核則發現,研究者測試的 155 個符合條件 app 中,70% 沒有防止生成相關傷害內容的技術護欄。
這代表問題不能只歸咎於「有一兩個壞人繞過規則」;很多產品從設計階段就沒有把最嚴重濫用情境當成核心風險。
AI 公司應該怎麼做?
1. 高風險輸出不要只靠事後檢舉
對真人肖像、衣著改造、親密影像、未成年人、暴力與羞辱情境,平台應該在生成前就做攔截。
合理的做法包括:
- 對真人肖像做更嚴格的輸入與輸出分類
- 對「改衣著」「去衣物」「性化」「羞辱」類 prompt 直接拒絕
- 對影像生成結果做輸出端掃描,而不是只看文字 prompt
- 對公開分享加第二層審查
- 對多次嘗試繞過限制的帳號降權或封鎖
安全不能只寫在 ToS 裡。使用者不會因為條款存在就不濫用,尤其當產品介面讓濫用變得容易。
2. 預設不要公開生成結果
生成式 AI 的一個大坑是「公開連結」。
很多產品為了方便分享,會讓生成結果可以用連結直接存取。但在敏感影像場景,公開連結本身就是風險放大器。
比較合理的預設應該是:
| 內容類型 | 合理預設 |
|---|---|
| 純抽象圖、商品圖、一般插圖 | 可以分享 |
| 含真人肖像的生成圖 | 預設私密 |
| 人臉編輯、衣著改造、身體變形 | 預設私密且提高審查 |
| 涉及未成年人或疑似未成年人 | 禁止生成與分享 |
| 被檢舉的內容 | 暫停公開、保留證據、進入人工審查 |
這是產品基本防火牆。
3. 讓安全團隊有否決權
如果安全團隊只能寫報告,沒有上線否決權,那它只是公關素材。
成熟 AI 公司至少要有:
- launch review:高風險功能上線前要過安全審查
- red team:上線前模擬濫用
- incident response:出事後有明確處理流程
- audit log:保留 prompt、輸出、模型版本與處理紀錄
- escalation:重大風險可以直接升級到高層與董事會
- rollback:必要時能立刻關閉某類功能
這些東西聽起來無聊,但這才是 AI 產品能不能商業化的底層。
對一般使用者有什麼影響?
1. 不要把真人肖像丟給風險不明的工具
尤其是:
- 自己或家人的清晰正臉照
- 小孩照片
- 私密生活照
- 公司內部人物照
- 客戶、員工、病患、學生照片
你不知道工具是否會保存輸入、是否拿去訓練、是否產生公開連結,也不知道未來資料外洩或政策改變時會怎樣。
2. 看到疑似非自願深偽,不要轉傳
很多人以為轉傳是「譴責」。但對受害者來說,二次傳播仍然是傷害。
比較好的做法是:
- 截圖保留證據,但不要公開轉貼
- 向平台檢舉
- 若涉及自己或親友,盡快用平台正式申訴流程
- 在美國可查 TAKE IT DOWN Act 相關移除管道;其他地區則看當地隱私、性影像、兒少與人格權法規
- 若內容涉及未成年人,優先尋求正式法律與警方管道
3. 內容創作者更要保留同意紀錄
如果你做內容網站、社群圖、廣告圖、AI 影像素材,現在不能只問「這張圖好不好看」。
你還要問:
- 圖裡有沒有可識別真人?
- 有沒有取得肖像授權?
- 生成工具是否允許商用?
- 是否有敏感身體、衣著、年齡誤判風險?
- 圖片來源、prompt、授權條款是否留下紀錄?
我自己會建議內容站盡量用「非真人可識別」的插圖、資訊圖、抽象場景,除非真的有明確授權。這會少很多麻煩。
對 AI 開發者與產品經理的建議
如果你正在做 AI 圖片、語音、影片或 agent 產品,這次 Grok 事件很值得當成檢查表。
| 檢查項目 | 應該問的問題 |
|---|---|
| 濫用情境 | 最壞的 10 種用法是什麼?產品是否真的擋得住? |
| 預設分享 | 輸出是否預設公開?公開連結是否可被搜尋或轉貼? |
| 真人肖像 | 是否辨識真人、名人、未成年人與私人照片? |
| 拒答規則 | 是否同時看 prompt、輸入圖與輸出圖? |
| 稽核紀錄 | 出事後能不能還原誰生成、何時生成、用哪個模型版本? |
| 下架流程 | 受害者是否能不登入、不被羞辱地快速申訴? |
| 內部治理 | 安全團隊是否能阻止上線或要求 rollback? |
很多團隊會說「我們之後再補安全」。但對影像、聲音、真人身份相關產品來說,之後常常太晚。
Mason 的判斷
我覺得 Grok 這次真正的分水嶺在於:AI 公司不能再把自己包裝成單純平台。
傳統社群平台可以說:「使用者上傳內容,我們收到檢舉再處理。」
但生成式 AI 公司更像是把生產機器、操作介面、素材入口、分發渠道、託管空間全部綁在一起。當你把這些東西做得越順,越要承擔設計責任。
這也是為什麼 Grok 事件比一般內容審查爭議更重要。
它會逼整個產業回答幾個問題:
- 什麼功能一開始就不該預設開放?
- 哪些輸出必須先審再公開?
- AI 公司是否要為模型產生的內容承擔更高責任?
- 安全團隊在商業壓力前有沒有實權?
- 投資人是否該把 AI 濫用風險當成估值折價?
我不認為這會讓生成式 AI 影像工具停下來。相反,影像、語音、影片 AI 只會更強、更便宜、更普及。
但我認為「先上線、出事再補」這套玩法會越來越貴。以前貴的是公關危機,接下來貴的是訴訟、罰款、下架、App Store 風險、企業客戶流失和投資人信任。
生成式 AI 下一階段的競爭,會從模型能力延伸到高風險功能能否證明自己值得被信任。
常見問題
Grok 被告代表 xAI 已經違法嗎?
不代表。Devin Kim 的案件目前是訴訟指控,還要看法院後續程序與證據。比較保守的說法是:這起案件讓 xAI 的安全治理、內部決策與產品設計被放到法律顯微鏡下檢查。
WIRED 調查代表 Grok 沒有任何安全機制嗎?
不是。WIRED 報導中也提到 xAI 曾表示已加入限制與防護。問題在於,調查發現仍有內容被生成、託管或分享,代表外界會要求 xAI 證明防護「有效」,而不是只宣稱有做。
非自願深偽和一般 AI 圖有什麼差別?
差別在於是否使用可識別真人、是否取得同意、是否造成羞辱、性化、冒用、威脅或其他人格權侵害。一般風格化插圖和取得授權的人像生成,風險完全不同。
AI 公司只要快速下架就夠了嗎?
不夠。下架是必要的,但非自願深偽的傷害常在第一次生成與擴散時就發生。平台需要在生成前、分享前、公開託管前就設計防線。
我做內容網站要怎麼避開這類風險?
盡量使用非真人可識別的資訊圖、產品截圖、授權素材或自己生成的抽象插圖。不要把真人照片丟進風險不明的 AI 修圖工具,也不要用 AI 生成看起來像真實人物的敏感情境圖。
參考來源
- The Guardian:Musk’s xAI fired engineer for raising concerns about Grok chatbot, lawsuit claims
- WIRED:Grok Is Still Hosting Sexualized Deepfakes of Famous Women
- The Guardian:New claimants seek to sue Elon Musk’s xAI after Labour MP’s test case
- arXiv:Dual-Use AI Face Swap Apps Are Mostly Unsafe
- arXiv:Deepfake Pornography is Resilient to Regulatory and Platform Shocks
- arXiv:The Deepfakes We Missed
- GovInfo:TAKE IT DOWN Act