阿里巴巴旗下的 AI 團隊 Qwen 近期發佈了一款全新的圖像編輯模型 Qwen-Image-Layered。這項技術能將照片分解成多個獨立且可編輯的組成部分,並將圖像分割為具備透明背景的 RGBA 圖層。使用者可以獨立編輯每個圖層,而不會影響圖像的其他部分,從而大幅提升編輯的靈活性。
重點文章
支援多層拆解與精確編輯
該模型能夠處理各種基礎編輯任務,例如調整大小、重新定位以及為特定元素重新著色。使用者可以輕鬆更換背景、替換人物、修改文字,或者刪除、移動與放大物體。目前圖像可選擇分割為 3 個或 8 個圖層,且此過程具備重複性,每個圖層視需求可進一步細分為更多子圖層。
開源程式碼與技術報告
Qwen 團隊將此方法視為標準圖像與結構化編輯表示方式之間的橋樑。目前該模型的程式碼已在 GitHub 上公開,並可在 Hugging Face 與 ModelScope 平台上獲取。團隊也同步在官方網誌與技術報告中提供了詳細資訊,有興趣的使用者可以在相關平台上進行實際測試與展示。
