Qwen-Image-Layered: 이미지 생성, 한 단계 더 도약하다
2025년 12월 19일 — Alibaba Cloud는 레이어 네이티브 분해 기능을 갖춘 이미지 생성 모델인 Qwen-Image-Layered를 완전 오픈 소스로 공개했습니다.
이 모델은 AI 이미지 생성 분야에서 중요한 진전을 의미하며, 지금까지 Photoshop과 같은 전문 소프트웨어에서만 가능했던 독립적인 RGBA 레이어 관리 기능을 제공합니다.
주요 기능
| 기능 | 설명 |
|---|---|
| 분리된 RGBA 레이어 | 각 레이어는 네이티브 투명도와 함께 물리적으로 분리됨 |
| 프롬프트 제어 | 3~10개의 레이어를 명시적으로 지정 가능 |
| 유연한 구조 | 대략적인 레이아웃부터 미세한 디테일까지 처리 |
| 네이티브 편집 가능성 | 각 레이어를 개별적으로 수정 가능 |
기술 아키텍처
Qwen-Image-Layered는 VLD-MMDiT (Variable Layers Decomposition MMDiT) 아키텍처를 기반으로 하며, RGBA-VAE 인코더를 사용하여 네이티브 알파 채널이 있는 레이어를 생성합니다.
이 모델은 이미지의 무한한 분해를 가능하게 하여 창작자가 각 시각적 요소에 대해 세밀한 제어를 할 수 있도록 합니다.
사용 가능한 통합
생태계는 출시 당일부터 사용 가능한 통합 기능으로 빠르게 반응했습니다:
| 플랫폼 | 통합 | 날짜 |
|---|---|---|
| fal.ai | API 사용 가능 | 12월 19일 |
| ComfyUI | 공식 플러그인 | 12월 19일 |
| PrunaAI | 속도 최적화 | 12월 20일 |
Qwen Image Layered is live on fal!
🇰🇷 Qwen Image Layered가 fal에 출시되었습니다! — @Alibaba_Qwen X에서
활용 사례
- 그래픽 디자인: 편집 가능한 요소로 구성 만들기
- 게임 아트: 배경/캐릭터 분리가 가능한 에셋 생성
- 마케팅: 다채널 캠페인을 위한 모듈식 비주얼
- 프로토타이핑: 재배치 가능한 요소를 사용한 빠른 목업
가용성
| 리소스 | 링크 |
|---|---|
| 소스 코드 | GitHub QwenLM |
| 모델 | Hugging Face Qwen |
| fal.ai 데모 | fal.ai |
이 모델은 오픈 소스 라이선스로 게시되어 상업적 및 학술적 사용이 가능합니다.
이것이 의미하는 바
Qwen-Image-Layered를 통해 Alibaba는 Qwen을 이미지 생성 분야의 주요 플레이어로 자리매김하고, 이전에는 접근할 수 없었던 전문적인 기능을 무료로 제공합니다. 이러한 오픈 소스 접근 방식은 창의적 생태계에서의 채택과 혁신을 가속화합니다.