Mixture-of-Experts と Transfusion 手法を組み合わせ、多モーダル統一表現と生成を実現。
現実の知識や専門知識を理解し、意味的に豊かで高精度なビジュアルを生成。
1000字を超える複雑な入力を処理可能。複数のシーンやストーリー表現に最適。
ポスター、インフォグラフィック、ロゴにおいて優れた性能。日本語と英語の文字を鮮明に再現。
写真写実、アニメ、油絵、水彩、3D レンダリングなど幅広く対応。
コードと重みを完全公開。個人も企業も商用利用可能。
被写体、動作、雰囲気、構図を記述。1000字以上の長文で複雑なストーリーを表現可能。
写実、アニメ、ポスター、3D レンダリングなど用途に応じて選択。
プレビューで確認し、ステップ数やスタイルを調整して完成度を高める。
長文プロンプト、正確な文字レンダリング、多彩なアートスタイルを備えた Tencent の最新オープンソース画像モデルを体験。