回到頂部
2026 AI 修圖去背工具選型指南:線上與本地工具對照

2026 AI 修圖去背工具選型指南:四種任務、線上本地怎麼挑

選對工具比選最強工具更重要。用四種任務情境(去背、修補、UI 重製、擴圖)拆解線上與本地 AI 修圖工具,教你怎麼判斷該用 Canva、Photoroom、IOPaint 還是 ComfyUI。

選對工具比選最強工具更重要。 我看過太多人把「AI 修圖」當成一件事——所有需求都丟 Canva、都丟 Photoshop,結果去背留下毛邊、移除文字留下鬼影、改 UI 截圖只能貼字上去。AI 修圖其實是四種完全不同的任務,每種任務都有專屬的工具生態,而且線上與本地方案的取捨邏輯完全不同。這篇會用四種任務情境把整張地圖攤開給你,讀完你會知道自己現在的需求該搜哪個工具、什麼時候值得搞本地、什麼時候線上就夠。

🎯 為什麼你需要先分清楚任務,而不是先挑工具

很多人一開口就問「AI 修圖哪個最強」,這問題的預設本身就錯了。去背跟修補是兩回事、修補跟改 UI 又是兩回事、改 UI 跟擴圖更是完全不同的技術路線。沒有一個工具在四個任務都是第一名,硬要選一個通用工具,就是四個任務都拿 C+。

先看這張任務 × 工具對照:

任務類型線上首選本地首選誰會用錯
去背與透明素材Photoroom / Adobe FireflyComfyUI + LayerDiffusion用 Canva 處理髮絲或玻璃
移除物件與修補Cleanup.picturesIOPaint(原 Lama Cleaner)用 Canva Magic Eraser 處理複雜紋理
UI 與圖表重製Figma / MotiffPenpot把 NotebookLM 圖表丟進 Canva
擴圖與重繪Adobe Firefly / IdeogramComfyUI / Fooocus用 Canva Magic Expand 做品牌主視覺

下面每個任務都會展開:情境、線上怎麼選、本地怎麼選、以及判斷界線。


🔲 任務一:去背與透明素材生成

情境:你要一張背景透明的產品圖、人物剪影、素材圖,未來可隨意換底。電商賣家、社群小編、簡報設計師幾乎天天碰到。

線上首選:Photoroom / remove.bg

拖拉即用,三秒出圖。優點是快、不挑電腦、手機也能用;缺點是每月有免費額度上限,而且處理髮絲、半透明玻璃、煙霧、白色物件在白背景這類邊緣時,會明顯留下毛邊或吃掉主體邊緣。

日常社群貼文、電商商品白底圖夠用。不適合高精度合成。

線上進階:Adobe Firefly 的「產生透明 PNG」

Firefly 在 2024 年底新增了直接生成透明背景圖的選項,這不是事後去背,而是模型直接輸出帶 alpha 通道的 PNG。品質比事後去背乾淨,但免費額度有限,且風格偏寫實、可控性不如本地方案。

本地終極:ComfyUI + LayerDiffusion

這是技術分水嶺。LayerDiffusion(論文作者 Lvmin Zhang,2024)用的是 latent transparency 技術——背景、主體、透明度在生成階段就分開,不是事後用遮罩切出來的。

差別有多大?舉幾個線上工具永遠做不好的場景:

  • 半透明玻璃杯:裡面能透出背景、杯緣有正確折射
  • 煙霧、火焰、水花:柔和漸變的透明度,不是硬邊切割
  • 髮絲、毛邊、網紗:逐絲的透明度,而不是「整團抓走」
  • 自發光物件(螢光、霓虹):光暈可以自然疊到新背景上

代價:需要 12GB+ 顯存的 NVIDIA 顯卡、ComfyUI 基本操作熟練、workflow 調整經驗。裝設到能跑起來大概 2–4 小時。

判斷界線

你的狀況建議
每月去背 < 50 張,都是單純白底產品Photoroom 免費版
需要生成透明素材,量不大Adobe Firefly
做廣告合成、品牌主視覺、複雜邊緣ComfyUI + LayerDiffusion
每月產 > 100 張透明素材本地划算

🧽 任務二:移除物件與修補(去 Logo、去路人、去文字)

情境:已經有一張圖,想把畫面裡某個東西消失——路過的行人、商店招牌、浮水印、舊文字——而且背景要自然補回來,不留痕跡。

線上首選:Canva Magic Eraser / Cleanup.pictures

簡單物件都能處理:純色背景上的文字、天空裡的電線、草地上的垃圾桶。Cleanup.pictures 免費版修補品質在線上工具裡算相對好。

但兩個工具在遇到複雜紋理時都會露出馬腳:

  • 磁磚、木紋、花布背景上疊著文字
  • 人臉、手部、髮絲旁邊的雜物
  • 半透明疊加的浮水印

這類場景你會看到模糊補丁、鬼影、或是周圍紋理被扭曲。

本地王者:IOPaint(原名 Lama Cleaner)

重要提醒:Lama Cleaner 已在 2024 年改名為 IOPaint,舊 repo 已 archive。很多中文教學文還在用舊名,會誤導你搜到停更的版本。

IOPaint 是開源、本地、免費的 inpainting 工具,內建多個修補模型(LaMa、ZITS、MAT、FcF 等),其中 LaMa 模型的紋理連續性在開源圈公認最強。你塗抹要消失的區域,模型會看懂周圍紋理(磁磚走向、木紋方向、草地顆粒)然後延續下去,而不是單純模糊填補。

實測優勢:

  • 重複性紋理(磁磚、磚牆、格紋)修補近乎看不出痕跡
  • 去浮水印、去字幕、去 Logo 品質遠勝 Canva
  • 無修改張數上限、不上傳雲端(適合敏感內容)

代價:裝設門檻比 Canva 高,但比 ComfyUI 低很多。有 GPU 更快,CPU 也能跑(慢)。

判斷界線

情境建議
單色或漸層背景(天空、純牆)線上工具就夠
複雜紋理、大量內容、敏感圖片IOPaint 本地跑
一個月修 > 20 張帶紋理的圖值得裝 IOPaint

🖼️ 任務三:UI 截圖與資訊圖表重製

情境:你從 NotebookLM、簡報、網頁、競品、App 截了一張圖,想改文字、改排版、改顏色、重新配色、轉成品牌風格。

這是多數人選錯工具的重災區。 把 UI 截圖丟進 Canva 或 Photoshop,得到的是「一張貼了文字的扁平圖」——你無法拉伸按鈕、改列表項目、調整間距。因為 Canva 把它當圖片處理,不是當介面處理。

線上首選:Figma(含 AI 外掛)/ Motiff

Figma 不是修圖工具,是 UI 設計工具。 這一點決定了它處理結構化圖像的能力。搭配 AI 外掛(如 Magician、Builder.io、Figma AI 原生功能),可以把截圖辨識成可編輯元件:這是標題、這是按鈕、這是列表、這是卡片。

Motiff 是中國團隊做的 Figma 替代方案,主打 AI 辨識「容器」與「Auto Layout」。把資訊圖表丟進去,它會嘗試識別餅圖、長條圖、標題階層,重建成可以拉伸的向量組件。對於處理 NotebookLM、PPT、Notion 生成的結構化圖表,體驗比 Canva 像在用真的設計軟體。

線上補充:Recraft

偏向向量插畫與資訊圖表風格。如果你是做內容行銷用的資訊圖(infographic)而不是 UI,Recraft 的預設風格系統比 Figma 上手快。

本地路線:Penpot

開源的 Figma 替代品,可自架、可本地跑、資料完全自有。但目前的 AI 功能生態跟 Figma / Motiff 有明顯落差,多數人還是用雲端版。真的在意資料主權再考慮。

判斷界線

你在做的事建議
改 App / 網頁 UI 截圖Figma + AI 外掛
重製 NotebookLM / PPT 圖表Motiff
做內容行銷用 infographicRecraft
所有 UI 設計需要本地化Penpot(心裡有數它較弱)
只是想貼幾個字上去Canva 就好

🔭 任務四:擴圖、重繪、風格轉換

情境:原圖構圖太緊想延伸背景、尺寸太小要放大、想把同一張圖換成另一種風格(水彩、動漫、油畫)、或把直式圖變成橫幅。

線上首選:Adobe Firefly Generative Expand / Ideogram / Midjourney Vary Region

  • Firefly Generative Expand:補畫布最自然,適合把社群直圖改成橫幅廣告。
  • Ideogram:處理帶文字的圖片最強(Logo 延伸、含字廣告擴圖)。
  • Midjourney Vary Region:局部重繪,風格統一度最高。

共同限制:訂閱費、出圖次數上限、風格受平台訓練資料影響。

本地王者:ComfyUI / Fooocus / InvokeAI

  • ComfyUI:極致可控,workflow 可複用,同一 LoRA 可保證系列圖風格一致。適合品牌需要「100 張產品圖都是同一種風格」。
  • Fooocus:ComfyUI 的簡化版,介面接近 Midjourney,學習曲線友善很多。
  • InvokeAI:介面最像 Photoshop,適合設計師過渡。

本地方案真正的價值不是單張畫質贏線上——而是:

  1. 不限量:出圖不花錢、不數次數
  2. 風格鎖定:訓練自己的 LoRA,100 張產品圖視覺完全一致
  3. 資料私密:不上傳客戶圖、不上傳未發佈的品牌素材

判斷界線

使用頻率 / 需求建議
偶爾擴圖、每月 < 20 張Firefly 線上
帶文字圖片擴展Ideogram
每天產圖、品牌視覺一致性強ComfyUI + 訓練 LoRA
想要本地但怕 ComfyUI 太難Fooocus 起手

💰 線上 vs 本地:一句話判斷

這是整篇最重要的一段。所有工具攤開後,真正的問題是你該投資到哪一側

線上的代價

  • 訂閱費堆疊:Canva Pro + Adobe Firefly + Figma + Midjourney 加起來容易破台幣 2,000/月
  • 出圖上限:每個平台都有次數、儲存、解析度限制
  • 資料上雲:敏感客戶素材、未發佈品牌視覺、個人肖像都會上傳
  • 風格受限:平台訓練資料決定了可生成的風格範圍

本地的代價

  • 硬體門檻:12GB+ 顯存 NVIDIA 顯卡(RTX 3060 12GB / RTX 4070 以上),Mac 走 MPS 速度普遍較慢
  • 學習曲線:ComfyUI workflow 概念、SD / Flux 模型差異、LoRA 訓練,認真學大約 20 小時
  • 初期裝設:ComfyUI 從零到能跑,Windows 約 2–4 小時,遇坑可能一整天

判斷門檻(直接看這個)

你的使用強度建議路線
每月修圖 / 生圖 < 50 張純線上(Canva Pro 為核心)
每月 50–200 張線上為主,IOPaint 補修補缺口
每月 > 200 張 或 有品牌一致性要求本地 ComfyUI 為主,線上補快速任務
有敏感資料顧慮(客戶圖、法務圖、個人肖像)本地優先,不管量多少

🧭 一張決策流程圖:我現在該用哪個?

  1. 我要做的是哪一種任務?

    • 去背 → 任務一
    • 移除畫面上某個東西 → 任務二
    • 改 UI 截圖 / 資訊圖表 → 任務三
    • 擴大、重繪、換風格 → 任務四
  2. 邊緣複雜度 / 紋理複雜度高嗎?

    • 低(純色背景、簡單物件)→ 線上工具直接搞定
    • 高(髮絲、玻璃、磁磚、複雜紋理)→ 本地工具
  3. 我一個月會做幾次?

    • < 20 次 → 線上
    • 20–100 次 → 線上 + 單一本地工具(IOPaint 最超值)
    • > 100 次 → 本地為主
  4. 資料敏感嗎?

    • 任何一個「是」→ 本地,不再討論

❓ FAQ

沒有 NVIDIA 顯卡,是不是完全不能跑本地 AI 修圖?

不是完全不能,但體驗會打很大折扣。IOPaint 的 CPU 模式可以用(慢),Apple Silicon Mac 走 MPS 跑 Stable Diffusion 類模型可行(中速)。但 ComfyUI + LayerDiffusion 類重度 workflow,沒有 12GB+ VRAM 的 NVIDIA 卡基本上放棄——不是跑不動,是跑一張要 3 分鐘以上,完全沒有實用價值。預算有限又想走本地,建議先從 IOPaint 開始,它對硬體最寬容。

Lama Cleaner 跟 IOPaint 是同一個工具嗎?為什麼很多教學還叫 Lama Cleaner?

是同一個工具,2024 年初作者把專案改名為 IOPaint,原 Lama Cleaner repo 已標記 archived。中文內容普遍落後 6–12 個月,很多 2024 中後期以前寫的教學還在用舊名,如果你搜 Lama Cleaner 找到的安裝指令通常已經過期。直接搜「IOPaint」找 GitHub 上的 Sanster/IOPaint 才是現在維護中的版本。

LayerDiffusion 跟一般的 AI 去背有什麼本質差別?

一般的 AI 去背(Photoroom、remove.bg、Canva)是事後處理——先生成或拿到完整圖,再用分割模型判斷哪裡是前景、哪裡是背景,然後把背景挖掉。這種作法碰到半透明物體、髮絲、煙霧時一定會出錯,因為這些區域本來就不是非黑即白的「前景 / 背景」。LayerDiffusion 是生成時就分層,模型直接輸出「主體層」與「透明度資訊」,半透明區域的 alpha 值是模型計算出來的,不是硬切。這也是為什麼它處理玻璃杯、火焰、髮絲時品質完全不在同一個檔次。

Figma AI、Motiff、Canva 到底差在哪?都不是做 UI 設計嗎?

Canva 根本不是 UI 設計工具,它是行銷素材設計工具。把 UI 截圖丟進 Canva,它會當成一張圖片處理,你只能在上面貼新元素,不能「編輯裡面的按鈕」。Figma 和 Motiff 才是真的 UI 設計工具,它們理解「這是一個容器、裡面有子元素、子元素之間有 Auto Layout 規則」。所以當你想改 NotebookLM 生成的結構化圖表、改 App 截圖、改 Dashboard 視覺,Figma / Motiff 才能把它重建成可編輯的向量元件。Canva 就只能貼新文字蓋掉舊文字,結果看起來像 PowerPoint 小抄。

ComfyUI 學習曲線到底多陡?值得投入嗎?

ComfyUI 的陡峭度不在於「會不會用」,而在於「看不看得懂 workflow」。介面是節點式連線,第一次看會暈。但你不需要從零學——社群裡有大量 workflow 模板可以直接下載載入。真正的投入是20 小時左右學會:看懂節點連線、調基本參數、換模型、載入 LoRA。如果你每月修圖量 > 100 張、或有品牌一致性需求、或想訓練自己的風格 LoRA,20 小時絕對值得。如果你一個月就做幾張社群圖,ComfyUI 是殺雞用牛刀,Canva 就夠。

Fooocus 跟 ComfyUI 差在哪?兩個都是本地,要選哪個?

Fooocus 是 ComfyUI 的「簡化套殼版」,介面接近 Midjourney——輸入提示詞、按生成、出圖。它把 ComfyUI 那套 workflow 藏起來,用預設好的管線給你用。優點是 10 分鐘就能上手;缺點是可控性打骨折,做不到精細的 inpainting、ControlNet 組合、LoRA 疊加。選擇邏輯很清楚:只想快速生成好圖 → Fooocus;想精細控制 / 訓練自己風格 / 產業務導向的系列圖 → ComfyUI。也有人先用 Fooocus 試水溫,確定本地路線走得下去再升級到 ComfyUI。

IOPaint 跟 Photoshop 的生成式填充(Generative Fill)比,哪個強?

Photoshop Generative Fill 在大面積重繪複雜場景理解上贏(它會看懂「這裡應該有一棵樹」、「這裡該延伸天空」)。IOPaint 在紋理延續小範圍修補上贏(磁磚、木紋、重複圖案勝出)。另外 IOPaint 是免費本地,Photoshop 要訂閱而且上傳雲端處理。實務上很多人兩個都用:大範圍構圖重繪用 Photoshop,小範圍精細修補、敏感圖片、大量重複工作用 IOPaint。兩者沒有取代關係,反而互補。

我是完全沒本地經驗的人,第一個要裝的本地工具該選什麼?

選 IOPaint。理由:(1)硬體門檻最低,CPU 也能跑,有顯卡更快;(2)用途具體——就是把圖上的東西消掉,學完立刻用得到;(3)安裝步驟最少,一行 pip 指令搞定;(4)不用學 workflow、不用學模型、不用學提示詞工程。IOPaint 適合當作「本地 AI 的第一把鑰匙」,感受一下本地工具的爽度(無限次、不上雲、免費)。用順了再考慮 Fooocus 或 ComfyUI。反過來,第一個就硬上 ComfyUI 的人,有 60% 會在前三小時放棄。

📌 一句話總結 + 延伸閱讀

工具不是越強越好,是越匹配任務越好。 Canva 沒有輸,它只是不該拿來做所有事。把任務先分清楚,你省下的不只是時間,是每個月 2,000 元以上的訂閱費、以及永遠做不乾淨的挫折感。

延伸閱讀:

📚 延伸閱讀