Qwen-Image-Layered:画像生成は次のレベルへ
2025年12月19日 — Alibaba Cloudは、レイヤーへのネイティブな分解機能を備えた画像生成モデル、Qwen-Image-Layeredを完全オープンソースで公開しました。
このモデルは、AI画像生成の分野において重要な進歩を示すものであり、これまでPhotoshopのようなプロフェッショナル向けソフトウェアに限定されていた機能、すなわち独立したRGBAレイヤーの管理を提供します。
主な機能
| 機能 | 説明 |
|---|---|
| 分離されたRGBAレイヤー | 各レイヤーは物理的に分離されており、ネイティブな透過性を持つ |
| プロンプトによる制御 | 3〜10層のレイヤーを明示的に指定可能 |
| 柔軟な構造 | 大まかなレイアウトから微細なディテールまで対応 |
| ネイティブな編集性 | 各レイヤーを個別に修正可能 |
技術アーキテクチャ
Qwen-Image-Layeredは、VLD-MMDiT(Variable Layers Decomposition MMDiT)アーキテクチャに基づいており、RGBA-VAEエンコーダーを使用してネイティブなアルファチャンネルを持つレイヤーを生成します。
このモデルは画像の無限の分解を可能にし、クリエイターに各視覚要素に対する詳細な制御を提供します。
利用可能な統合
エコシステムは迅速に反応し、ローンチ当日から統合が利用可能になりました:
| プラットフォーム | 統合 | 日付 |
|---|---|---|
| fal.ai | API利用可能 | 12月19日 |
| ComfyUI | 公式プラグイン | 12月19日 |
| PrunaAI | 速度最適化 | 12月20日 |
Qwen Image Layered is live on fal!
🇯🇵 Qwen Image Layeredがfalで公開されました! — @Alibaba_Qwen Xで
ユースケース
- グラフィックデザイン:編集可能な要素を使用した構成の作成
- ゲームアート:背景とキャラクターを分離したアセット生成
- マーケティング:マルチチャネルキャンペーン向けのモジュール式ビジュアル
- プロトタイピング:再配置可能な要素を使用した迅速なモックアップ
利用可能性
| リソース | リンク |
|---|---|
| ソースコード | GitHub QwenLM |
| モデル | Hugging Face Qwen |
| fal.aiデモ | fal.ai |
モデルはオープンソースライセンスの下で公開されており、商用および学術利用が可能です。
これが意味すること
Qwen-Image-Layeredにより、AlibabaはQwenを画像生成における主要なプレイヤーとして位置づけ、これまでアクセスできなかったプロフェッショナルな機能を無料で提供します。このオープンソースのアプローチは、クリエイティブエコシステムにおける採用と革新を加速させます。