goenhance logo

WanX 2.1

アリババクラウドのトップランキングオープンソースAIビデオ生成モデル – VBenchで印象的な84.7%の総合スコアを達成。最先端のAI技術を活用して、あなたのコンセプトを高品質ビデオに変換します。今すぐGoEnhance AIでWanX 2.1を試してみてください!
今すぐWanX 2.1を試す

WanX 2.1の主な機能

高忠実度ビデオ生成

2分以内の高速ビデオ生成により、ビデオコンテンツを迅速に作成・反復できます

正確な動きの制御

テキストプロンプトを鮮明な1280x720解像度の高画質5秒ビデオに変換します

複数オブジェクトの相互作用処理

当社の先進的なAI技術により静止画を動画に変換し、滑らかで自然なアニメーションで静止画に命を吹き込みます

リーディングパフォーマンス

WanX 2.1はVBenchベンチマークで優れたパフォーマンス(84.7%の総合スコア)を発揮します

WanX 2.1の使い方

01

プロンプトを入力

説明を提供するか画像をアップロードして、ビデオへの変換を開始します。

02

設定をカスタマイズ

WanX 2.1が入力の処理を開始する前に、ビデオ設定(プロンプト、比率)を調整します。

03

ビデオをダウンロード

WanX 2.1が生成したビデオに満足したら、保存することができます。

よくある質問

WanX 2.1とは何ですか?

WanX 2.1(WanX2.1またはTongyi Wanxiang 2.1とも呼ばれる)は、アリババクラウドによって開発された先進的なAIビデオ生成モデルです。2023年7月に発売され最近更新されたこのモデルは、現在VBenchリーダーボードで印象的な84.7%の総合スコアでトップの座を獲得しています。このモデルはダイナミックレンジ(91.7%)、空間関係(87.5%)、複数オブジェクトの相互作用(85.4%)などの主要分野で優れた性能を発揮します。WanX 2.1は最先端のVAE(Variational Autoencoder)とDiT(Denoising Diffusion Transformer)技術を活用して、最大1080p解像度の高品質ビデオを生成できます。

WanX 2.1はどのように機能しますか?

WanX 2.1(WanX2.1)はマルチモーダル大規模モデルを活用して、テキスト入力を高品質ビデオに変換します。独自のVAEおよびDiTフレームワークを統合することで、時間的および空間的関係を強化し、よりリアルな視覚効果を生み出します。特に複雑な動きや物理的相互作用を含むシーンで効果的です。このモデルは包括的な時空間アテンションメカニズムを採用して実世界のダイナミクスを正確に再現し、超長文脈を活用してテキスト指示とビデオ作成プロセスをスムーズかつ正確に統合します。

WanX 2.1の際立った特徴は何ですか?

WanX 2.1は、最大1080p解像度の高品質ビデオ生成、正確な動きの制御、複数オブジェクトの相互作用を処理する能力など、いくつかの際立った特徴を提供します。中国語と英語のテキスト入力の両方をサポートし、多機能性を確保しています。このモデルは優れた視覚的品質と時間的一貫性を提供し、VBenchベンチマークで84.7%の総合スコアでトップパフォーマンスを達成しました。WanX 2.1は複雑な身体の動き、複雑な回転、正確な身体の調整を含むビデオの生成に優れており、同時にリアルな動きの軌跡を維持します。

WanX 2.1は無料で使用できますか?

WanX 2.1はフリーミアムモデルで運営されています。限られたクレジットで無料でビデオを生成できますが、WanX 2.1を通じて追加機能のサブスクリプションオプションも提供されています。

WanX 2.1はどのようなモデルをサポートしていますか?

WanX 2.1はいくつかのモデルを提供しています:T2V-14B(480P/720P)、T2V-1.3B(480P)、I2V-14B-720P、I2V-14B-480P、および任意のモデルでのテキストから画像への機能。すべてのモデルはHugging FaceとModelScopeで利用可能です。

ハードウェア要件は何ですか?

T2V-1.3Bは8.19GB VRAMのみ必要です(RTX 4090で動作可能)。14Bモデルは24GB+VRAMの高性能GPUまたはマルチGPU設定が必要です。限られたハードウェアでは、--offload_model Trueと--t5_cpuを使用してメモリ使用量を削減できます。

ビデオ品質を向上させる方法は?

--use_prompt_extendでプロンプト拡張を有効にします。より高い解像度(720P)を選択して品質を向上させます。T2V-1.3Bの場合、--sample_guide_scale 6を設定し、--sample_shift(8-12)を調整します。最良の結果を得るにはマルチGPU処理を使用します。

WanX 2.1の利点は何ですか?

他のモデルより優れたパフォーマンス。複数のタスク(T2V、I2V、編集)に多機能性を提供。ビデオ内で中国語/英語テキストを生成。先進的なWanX-VAEで効率的な処理。T2V-1.3Bモデルは一般消費者向けGPUと互換性があります。

ユーザーからの声

GoEnhance AIでWanX 2.1を試す

強力なWanX 2.1ビデオジェネレーターを探索

WanX 2.1を試す