Qwen-Image-Layered:图像生成迈向新高度
2025年12月19日 — Alibaba Cloud 揭晓了 Qwen-Image-Layered,这是一款具有原生图层分解功能的图像生成模型,完全开源。
该模型标志着 AI 图像生成领域的重大进步,提供了以前仅限于 Photoshop 等专业软件的功能:独立 RGBA 图层的管理。
主要功能
| 功能 | 描述 |
|---|---|
| 隔离的 RGBA 图层 | 每个图层物理分离,具有原生透明度 |
| Prompt 控制 | 显式指定 3 到 10 个图层 |
| 灵活的结构 | 从粗略布局到精细细节 |
| 原生可编辑性 | 单独修改每个图层 |
技术架构
Qwen-Image-Layered 基于 VLD-MMDiT (Variable Layers Decomposition MMDiT) 架构,并使用 RGBA-VAE 编码器生成具有原生 Alpha 通道的图层。
该模型允许图像的无限分解,为创作者提供了对每个视觉元素的精细控制。
可用集成
生态系统迅速做出反应,从发布之日起即可使用集成:
| 平台 | 集成 | 日期 |
|---|---|---|
| fal.ai | API 可用 | 12月19日 |
| ComfyUI | 官方插件 | 12月19日 |
| PrunaAI | 速度优化 | 12月20日 |
Qwen Image Layered is live on fal!
🇨🇳 Qwen Image Layered 已在 fal 上线! — @Alibaba_Qwen 在 X 上
用例
- 平面设计:使用可编辑元素创建构图
- 游戏美术:生成具有背景/角色分离的资产
- 营销:用于多渠道营销活动的模块化视觉效果
- 原型设计:使用可重新定位的元素进行快速模型制作
可用性
| 资源 | 链接 |
|---|---|
| 源代码 | GitHub QwenLM |
| 模型 | Hugging Face Qwen |
| fal.ai 演示 | fal.ai |
该模型在开源许可下发布,允许商业和学术用途。
这意味着什么
凭借 Qwen-Image-Layered,Alibaba 将 Qwen 定位为图像生成领域的主要参与者,免费提供以前无法获得的专业能力。这种开源方法加速了创意生态系统中的采用和创新。