検索

Qwen 2025年12月:Qwen-Image-Layeredが画像生成に革命をもたらす

Qwen 2025年12月:Qwen-Image-Layeredが画像生成に革命をもたらす

Qwen-Image-Layered:画像生成は次のレベルへ

2025年12月19日 — Alibaba Cloudは、レイヤーへのネイティブな分解機能を備えた画像生成モデル、Qwen-Image-Layeredを完全オープンソースで公開しました。

このモデルは、AI画像生成の分野において重要な進歩を示すものであり、これまでPhotoshopのようなプロフェッショナル向けソフトウェアに限定されていた機能、すなわち独立したRGBAレイヤーの管理を提供します。


主な機能

機能説明
分離されたRGBAレイヤー各レイヤーは物理的に分離されており、ネイティブな透過性を持つ
プロンプトによる制御3〜10層のレイヤーを明示的に指定可能
柔軟な構造大まかなレイアウトから微細なディテールまで対応
ネイティブな編集性各レイヤーを個別に修正可能

技術アーキテクチャ

Qwen-Image-Layeredは、VLD-MMDiT(Variable Layers Decomposition MMDiT)アーキテクチャに基づいており、RGBA-VAEエンコーダーを使用してネイティブなアルファチャンネルを持つレイヤーを生成します。

このモデルは画像の無限の分解を可能にし、クリエイターに各視覚要素に対する詳細な制御を提供します。


利用可能な統合

エコシステムは迅速に反応し、ローンチ当日から統合が利用可能になりました:

プラットフォーム統合日付
fal.aiAPI利用可能12月19日
ComfyUI公式プラグイン12月19日
PrunaAI速度最適化12月20日

Qwen Image Layered is live on fal!

🇯🇵 Qwen Image Layeredがfalで公開されました!@Alibaba_Qwen Xで


ユースケース

  • グラフィックデザイン:編集可能な要素を使用した構成の作成
  • ゲームアート:背景とキャラクターを分離したアセット生成
  • マーケティング:マルチチャネルキャンペーン向けのモジュール式ビジュアル
  • プロトタイピング:再配置可能な要素を使用した迅速なモックアップ

利用可能性

リソースリンク
ソースコードGitHub QwenLM
モデルHugging Face Qwen
fal.aiデモfal.ai

モデルはオープンソースライセンスの下で公開されており、商用および学術利用が可能です。


これが意味すること

Qwen-Image-Layeredにより、AlibabaはQwenを画像生成における主要なプレイヤーとして位置づけ、これまでアクセスできなかったプロフェッショナルな機能を無料で提供します。このオープンソースのアプローチは、クリエイティブエコシステムにおける採用と革新を加速させます。


情報源