選對工具比選最強工具更重要。 我看過太多人把「AI 修圖」當成一件事——所有需求都丟 Canva、都丟 Photoshop,結果去背留下毛邊、移除文字留下鬼影、改 UI 截圖只能貼字上去。AI 修圖其實是四種完全不同的任務,每種任務都有專屬的工具生態,而且線上與本地方案的取捨邏輯完全不同。這篇會用四種任務情境把整張地圖攤開給你,讀完你會知道自己現在的需求該搜哪個工具、什麼時候值得搞本地、什麼時候線上就夠。
🎯 為什麼你需要先分清楚任務,而不是先挑工具
很多人一開口就問「AI 修圖哪個最強」,這問題的預設本身就錯了。去背跟修補是兩回事、修補跟改 UI 又是兩回事、改 UI 跟擴圖更是完全不同的技術路線。沒有一個工具在四個任務都是第一名,硬要選一個通用工具,就是四個任務都拿 C+。
先看這張任務 × 工具對照:
| 任務類型 | 線上首選 | 本地首選 | 誰會用錯 |
|---|---|---|---|
| 去背與透明素材 | Photoroom / Adobe Firefly | ComfyUI + LayerDiffusion | 用 Canva 處理髮絲或玻璃 |
| 移除物件與修補 | Cleanup.pictures | IOPaint(原 Lama Cleaner) | 用 Canva Magic Eraser 處理複雜紋理 |
| UI 與圖表重製 | Figma / Motiff | Penpot | 把 NotebookLM 圖表丟進 Canva |
| 擴圖與重繪 | Adobe Firefly / Ideogram | ComfyUI / Fooocus | 用 Canva Magic Expand 做品牌主視覺 |
下面每個任務都會展開:情境、線上怎麼選、本地怎麼選、以及判斷界線。
🔲 任務一:去背與透明素材生成
情境:你要一張背景透明的產品圖、人物剪影、素材圖,未來可隨意換底。電商賣家、社群小編、簡報設計師幾乎天天碰到。
線上首選:Photoroom / remove.bg
拖拉即用,三秒出圖。優點是快、不挑電腦、手機也能用;缺點是每月有免費額度上限,而且處理髮絲、半透明玻璃、煙霧、白色物件在白背景這類邊緣時,會明顯留下毛邊或吃掉主體邊緣。
日常社群貼文、電商商品白底圖夠用。不適合高精度合成。
線上進階:Adobe Firefly 的「產生透明 PNG」
Firefly 在 2024 年底新增了直接生成透明背景圖的選項,這不是事後去背,而是模型直接輸出帶 alpha 通道的 PNG。品質比事後去背乾淨,但免費額度有限,且風格偏寫實、可控性不如本地方案。
本地終極:ComfyUI + LayerDiffusion
這是技術分水嶺。LayerDiffusion(論文作者 Lvmin Zhang,2024)用的是 latent transparency 技術——背景、主體、透明度在生成階段就分開,不是事後用遮罩切出來的。
差別有多大?舉幾個線上工具永遠做不好的場景:
- 半透明玻璃杯:裡面能透出背景、杯緣有正確折射
- 煙霧、火焰、水花:柔和漸變的透明度,不是硬邊切割
- 髮絲、毛邊、網紗:逐絲的透明度,而不是「整團抓走」
- 自發光物件(螢光、霓虹):光暈可以自然疊到新背景上
代價:需要 12GB+ 顯存的 NVIDIA 顯卡、ComfyUI 基本操作熟練、workflow 調整經驗。裝設到能跑起來大概 2–4 小時。
判斷界線
| 你的狀況 | 建議 |
|---|---|
| 每月去背 < 50 張,都是單純白底產品 | Photoroom 免費版 |
| 需要生成透明素材,量不大 | Adobe Firefly |
| 做廣告合成、品牌主視覺、複雜邊緣 | ComfyUI + LayerDiffusion |
| 每月產 > 100 張透明素材 | 本地划算 |
🧽 任務二:移除物件與修補(去 Logo、去路人、去文字)
情境:已經有一張圖,想把畫面裡某個東西消失——路過的行人、商店招牌、浮水印、舊文字——而且背景要自然補回來,不留痕跡。
線上首選:Canva Magic Eraser / Cleanup.pictures
簡單物件都能處理:純色背景上的文字、天空裡的電線、草地上的垃圾桶。Cleanup.pictures 免費版修補品質在線上工具裡算相對好。
但兩個工具在遇到複雜紋理時都會露出馬腳:
- 磁磚、木紋、花布背景上疊著文字
- 人臉、手部、髮絲旁邊的雜物
- 半透明疊加的浮水印
這類場景你會看到模糊補丁、鬼影、或是周圍紋理被扭曲。
本地王者:IOPaint(原名 Lama Cleaner)
重要提醒:Lama Cleaner 已在 2024 年改名為 IOPaint,舊 repo 已 archive。很多中文教學文還在用舊名,會誤導你搜到停更的版本。
IOPaint 是開源、本地、免費的 inpainting 工具,內建多個修補模型(LaMa、ZITS、MAT、FcF 等),其中 LaMa 模型的紋理連續性在開源圈公認最強。你塗抹要消失的區域,模型會看懂周圍紋理(磁磚走向、木紋方向、草地顆粒)然後延續下去,而不是單純模糊填補。
實測優勢:
- 重複性紋理(磁磚、磚牆、格紋)修補近乎看不出痕跡
- 去浮水印、去字幕、去 Logo 品質遠勝 Canva
- 無修改張數上限、不上傳雲端(適合敏感內容)
代價:裝設門檻比 Canva 高,但比 ComfyUI 低很多。有 GPU 更快,CPU 也能跑(慢)。
判斷界線
| 情境 | 建議 |
|---|---|
| 單色或漸層背景(天空、純牆) | 線上工具就夠 |
| 複雜紋理、大量內容、敏感圖片 | IOPaint 本地跑 |
| 一個月修 > 20 張帶紋理的圖 | 值得裝 IOPaint |
🖼️ 任務三:UI 截圖與資訊圖表重製
情境:你從 NotebookLM、簡報、網頁、競品、App 截了一張圖,想改文字、改排版、改顏色、重新配色、轉成品牌風格。
這是多數人選錯工具的重災區。 把 UI 截圖丟進 Canva 或 Photoshop,得到的是「一張貼了文字的扁平圖」——你無法拉伸按鈕、改列表項目、調整間距。因為 Canva 把它當圖片處理,不是當介面處理。
線上首選:Figma(含 AI 外掛)/ Motiff
Figma 不是修圖工具,是 UI 設計工具。 這一點決定了它處理結構化圖像的能力。搭配 AI 外掛(如 Magician、Builder.io、Figma AI 原生功能),可以把截圖辨識成可編輯元件:這是標題、這是按鈕、這是列表、這是卡片。
Motiff 是中國團隊做的 Figma 替代方案,主打 AI 辨識「容器」與「Auto Layout」。把資訊圖表丟進去,它會嘗試識別餅圖、長條圖、標題階層,重建成可以拉伸的向量組件。對於處理 NotebookLM、PPT、Notion 生成的結構化圖表,體驗比 Canva 像在用真的設計軟體。
線上補充:Recraft
偏向向量插畫與資訊圖表風格。如果你是做內容行銷用的資訊圖(infographic)而不是 UI,Recraft 的預設風格系統比 Figma 上手快。
本地路線:Penpot
開源的 Figma 替代品,可自架、可本地跑、資料完全自有。但目前的 AI 功能生態跟 Figma / Motiff 有明顯落差,多數人還是用雲端版。真的在意資料主權再考慮。
判斷界線
| 你在做的事 | 建議 |
|---|---|
| 改 App / 網頁 UI 截圖 | Figma + AI 外掛 |
| 重製 NotebookLM / PPT 圖表 | Motiff |
| 做內容行銷用 infographic | Recraft |
| 所有 UI 設計需要本地化 | Penpot(心裡有數它較弱) |
| 只是想貼幾個字上去 | Canva 就好 |
🔭 任務四:擴圖、重繪、風格轉換
情境:原圖構圖太緊想延伸背景、尺寸太小要放大、想把同一張圖換成另一種風格(水彩、動漫、油畫)、或把直式圖變成橫幅。
線上首選:Adobe Firefly Generative Expand / Ideogram / Midjourney Vary Region
- Firefly Generative Expand:補畫布最自然,適合把社群直圖改成橫幅廣告。
- Ideogram:處理帶文字的圖片最強(Logo 延伸、含字廣告擴圖)。
- Midjourney Vary Region:局部重繪,風格統一度最高。
共同限制:訂閱費、出圖次數上限、風格受平台訓練資料影響。
本地王者:ComfyUI / Fooocus / InvokeAI
- ComfyUI:極致可控,workflow 可複用,同一 LoRA 可保證系列圖風格一致。適合品牌需要「100 張產品圖都是同一種風格」。
- Fooocus:ComfyUI 的簡化版,介面接近 Midjourney,學習曲線友善很多。
- InvokeAI:介面最像 Photoshop,適合設計師過渡。
本地方案真正的價值不是單張畫質贏線上——而是:
- 不限量:出圖不花錢、不數次數
- 風格鎖定:訓練自己的 LoRA,100 張產品圖視覺完全一致
- 資料私密:不上傳客戶圖、不上傳未發佈的品牌素材
判斷界線
| 使用頻率 / 需求 | 建議 |
|---|---|
| 偶爾擴圖、每月 < 20 張 | Firefly 線上 |
| 帶文字圖片擴展 | Ideogram |
| 每天產圖、品牌視覺一致性強 | ComfyUI + 訓練 LoRA |
| 想要本地但怕 ComfyUI 太難 | Fooocus 起手 |
💰 線上 vs 本地:一句話判斷
這是整篇最重要的一段。所有工具攤開後,真正的問題是你該投資到哪一側。
線上的代價
- 訂閱費堆疊:Canva Pro + Adobe Firefly + Figma + Midjourney 加起來容易破台幣 2,000/月
- 出圖上限:每個平台都有次數、儲存、解析度限制
- 資料上雲:敏感客戶素材、未發佈品牌視覺、個人肖像都會上傳
- 風格受限:平台訓練資料決定了可生成的風格範圍
本地的代價
- 硬體門檻:12GB+ 顯存 NVIDIA 顯卡(RTX 3060 12GB / RTX 4070 以上),Mac 走 MPS 速度普遍較慢
- 學習曲線:ComfyUI workflow 概念、SD / Flux 模型差異、LoRA 訓練,認真學大約 20 小時
- 初期裝設:ComfyUI 從零到能跑,Windows 約 2–4 小時,遇坑可能一整天
判斷門檻(直接看這個)
| 你的使用強度 | 建議路線 |
|---|---|
| 每月修圖 / 生圖 < 50 張 | 純線上(Canva Pro 為核心) |
| 每月 50–200 張 | 線上為主,IOPaint 補修補缺口 |
| 每月 > 200 張 或 有品牌一致性要求 | 本地 ComfyUI 為主,線上補快速任務 |
| 有敏感資料顧慮(客戶圖、法務圖、個人肖像) | 本地優先,不管量多少 |
🧭 一張決策流程圖:我現在該用哪個?
-
我要做的是哪一種任務?
- 去背 → 任務一
- 移除畫面上某個東西 → 任務二
- 改 UI 截圖 / 資訊圖表 → 任務三
- 擴大、重繪、換風格 → 任務四
-
邊緣複雜度 / 紋理複雜度高嗎?
- 低(純色背景、簡單物件)→ 線上工具直接搞定
- 高(髮絲、玻璃、磁磚、複雜紋理)→ 本地工具
-
我一個月會做幾次?
- < 20 次 → 線上
- 20–100 次 → 線上 + 單一本地工具(IOPaint 最超值)
- > 100 次 → 本地為主
-
資料敏感嗎?
- 任何一個「是」→ 本地,不再討論
❓ FAQ
沒有 NVIDIA 顯卡,是不是完全不能跑本地 AI 修圖?
不是完全不能,但體驗會打很大折扣。IOPaint 的 CPU 模式可以用(慢),Apple Silicon Mac 走 MPS 跑 Stable Diffusion 類模型可行(中速)。但 ComfyUI + LayerDiffusion 類重度 workflow,沒有 12GB+ VRAM 的 NVIDIA 卡基本上放棄——不是跑不動,是跑一張要 3 分鐘以上,完全沒有實用價值。預算有限又想走本地,建議先從 IOPaint 開始,它對硬體最寬容。
Lama Cleaner 跟 IOPaint 是同一個工具嗎?為什麼很多教學還叫 Lama Cleaner?
是同一個工具,2024 年初作者把專案改名為 IOPaint,原 Lama Cleaner repo 已標記 archived。中文內容普遍落後 6–12 個月,很多 2024 中後期以前寫的教學還在用舊名,如果你搜 Lama Cleaner 找到的安裝指令通常已經過期。直接搜「IOPaint」找 GitHub 上的 Sanster/IOPaint 才是現在維護中的版本。
LayerDiffusion 跟一般的 AI 去背有什麼本質差別?
一般的 AI 去背(Photoroom、remove.bg、Canva)是事後處理——先生成或拿到完整圖,再用分割模型判斷哪裡是前景、哪裡是背景,然後把背景挖掉。這種作法碰到半透明物體、髮絲、煙霧時一定會出錯,因為這些區域本來就不是非黑即白的「前景 / 背景」。LayerDiffusion 是生成時就分層,模型直接輸出「主體層」與「透明度資訊」,半透明區域的 alpha 值是模型計算出來的,不是硬切。這也是為什麼它處理玻璃杯、火焰、髮絲時品質完全不在同一個檔次。
Figma AI、Motiff、Canva 到底差在哪?都不是做 UI 設計嗎?
Canva 根本不是 UI 設計工具,它是行銷素材設計工具。把 UI 截圖丟進 Canva,它會當成一張圖片處理,你只能在上面貼新元素,不能「編輯裡面的按鈕」。Figma 和 Motiff 才是真的 UI 設計工具,它們理解「這是一個容器、裡面有子元素、子元素之間有 Auto Layout 規則」。所以當你想改 NotebookLM 生成的結構化圖表、改 App 截圖、改 Dashboard 視覺,Figma / Motiff 才能把它重建成可編輯的向量元件。Canva 就只能貼新文字蓋掉舊文字,結果看起來像 PowerPoint 小抄。
ComfyUI 學習曲線到底多陡?值得投入嗎?
ComfyUI 的陡峭度不在於「會不會用」,而在於「看不看得懂 workflow」。介面是節點式連線,第一次看會暈。但你不需要從零學——社群裡有大量 workflow 模板可以直接下載載入。真正的投入是20 小時左右學會:看懂節點連線、調基本參數、換模型、載入 LoRA。如果你每月修圖量 > 100 張、或有品牌一致性需求、或想訓練自己的風格 LoRA,20 小時絕對值得。如果你一個月就做幾張社群圖,ComfyUI 是殺雞用牛刀,Canva 就夠。
Fooocus 跟 ComfyUI 差在哪?兩個都是本地,要選哪個?
Fooocus 是 ComfyUI 的「簡化套殼版」,介面接近 Midjourney——輸入提示詞、按生成、出圖。它把 ComfyUI 那套 workflow 藏起來,用預設好的管線給你用。優點是 10 分鐘就能上手;缺點是可控性打骨折,做不到精細的 inpainting、ControlNet 組合、LoRA 疊加。選擇邏輯很清楚:只想快速生成好圖 → Fooocus;想精細控制 / 訓練自己風格 / 產業務導向的系列圖 → ComfyUI。也有人先用 Fooocus 試水溫,確定本地路線走得下去再升級到 ComfyUI。
IOPaint 跟 Photoshop 的生成式填充(Generative Fill)比,哪個強?
Photoshop Generative Fill 在大面積重繪跟複雜場景理解上贏(它會看懂「這裡應該有一棵樹」、「這裡該延伸天空」)。IOPaint 在紋理延續跟小範圍修補上贏(磁磚、木紋、重複圖案勝出)。另外 IOPaint 是免費本地,Photoshop 要訂閱而且上傳雲端處理。實務上很多人兩個都用:大範圍構圖重繪用 Photoshop,小範圍精細修補、敏感圖片、大量重複工作用 IOPaint。兩者沒有取代關係,反而互補。
我是完全沒本地經驗的人,第一個要裝的本地工具該選什麼?
選 IOPaint。理由:(1)硬體門檻最低,CPU 也能跑,有顯卡更快;(2)用途具體——就是把圖上的東西消掉,學完立刻用得到;(3)安裝步驟最少,一行 pip 指令搞定;(4)不用學 workflow、不用學模型、不用學提示詞工程。IOPaint 適合當作「本地 AI 的第一把鑰匙」,感受一下本地工具的爽度(無限次、不上雲、免費)。用順了再考慮 Fooocus 或 ComfyUI。反過來,第一個就硬上 ComfyUI 的人,有 60% 會在前三小時放棄。
📌 一句話總結 + 延伸閱讀
工具不是越強越好,是越匹配任務越好。 Canva 沒有輸,它只是不該拿來做所有事。把任務先分清楚,你省下的不只是時間,是每個月 2,000 元以上的訂閱費、以及永遠做不乾淨的挫折感。
延伸閱讀:
- Canva Magic Studio 完全指南——線上輕量路線的核心工具
- AI 工具總覽與比較——不確定方向時先看這篇
- 免費 AI 工具推薦——預算緊繃的最佳組合
- AI 工具推薦器——依你的角色與需求自動推薦
- Ollama 本地 AI 指南——想走本地路線的下一步