2048×2048 をはじめとする高解像度比率に最適化。鮮明なディテール、安定した構図、高い忠実度を実現。
32× 圧縮 VAE によりトークン数を削減しつつ構造を保持。1K と同等のトークン数で 2K 品質を実現し、推論効率を向上。
マルチモーダルエンコーダでシーン理解を行い、ByT5 による字形認識でテキスト描画と多言語表現を強化。
プロンプト書き換えで表現力を向上。Refiner がディテールを追加し、アーティファクトを低減。両方有効化すると最良の結果に。
蒸留版はステップ数を少なくしても高品質。素早いプレビューや試作に最適。
1:1、16:9、9:16、4:3、3:4、3:2、2:3 をサポート。SNS、印刷、広告など幅広く対応。
被写体、シーン、ライティング、文字(必要に応じて)を指定。スタイル(写実、アニメ、シネマティックなど)も追加可能。
PromptEnhancer で細部を充実させ、Refiner で鮮明さを高め、アーティファクトを低減。
蒸留版で高速プレビューし、必要に応じてアップスケールや精緻化して完成品をエクスポート。
ネイティブ 2K、高精度プロンプト対応、多言語サポート。強化オプションと Refiner で、ブラウザからすぐに利用可能。