goenhance logo

Kling O1 統合型マルチモーダル動画モデル

Kling O1 は、テキスト・画像・動画をすべて“指示”として読み取る統合型マルチモーダル動画モデルです。複数のツールを使い分ける必要なく、シーンの見た目、動き、変化を自然な言葉で指定できます。 数秒で、キャラクターが安定し、動きが滑らかで、ストーリー性のある3〜10秒のショットを生成します。
Kling O1で生成する

統合マルチモーダルエンジン
統合マルチモーダルエンジン
安定したキャラクターとシーン
安定したキャラクターとシーン
3〜10秒のリズムコントロール
3〜10秒のリズムコントロール
生成と編集を一つのモデルで
生成と編集を一つのモデルで

Kling O1 の動画生成機能を見る

1文だけで動画を編集 — Kling O1の自然言語編集

Kling O1では、複雑な操作ではなく“編集指示を伝える”感覚で編集できます。服装の変更、オブジェクトの追加・削除、季節の演出、雰囲気変更などを自然な文章で伝えるだけで、構図・動き・タイミングを保ったまま動画が書き換わります。

テキスト・画像・動画から統一されたショットを生成

Kling O1は、テキスト、画像、リファレンス動画を“1つのクリエイティブブリーフ”として理解します。静止画から始めても、製品レンダーでも、モーション参考動画でも、すべての情報を統合し、意図に沿った3〜10秒の映像を生成します。

Kling O1 動画モデルの主要機能

複数ショットで安定するキャラクター

Kling O1は、指定した人物やキャラクターの特徴をしっかり保持します。顔の構造、髪型、主要な特徴を保ちつつ、カメラのズーム・移動・異なる背景に切り替わっても“同じ人物”として成立します。
プロンプト生成動画
鋭い氷柱の間を切り裂くように飛ぶドラゴン。翼端の渦が粉雪を巻き上げる。氷河が崩れ、コバルト色のフィヨルドが露わになり、琥珀色の光が鱗に反射する。

シーンとスタイルの一貫性

リアルからアニメ、昼光からネオン調まで、どんなスタイルに変えても、Kling O1はシーンの形状と配置を維持します。同じ“場所”として自然に成立するため、スタイル変化の実験に最適です。
プロンプト生成動画
リビングルームのミディアムショット。カメラが入口から窓へ移動する間に、現実的な描写からモネ風の印象派スタイルへ滑らかに変化。家具の配置・小物・光の向きは一貫したまま。

マルチモーダル指示の理解力

Kling O1 のマルチモーダルビジュアル言語コアにより、文章・画像・リファレンス映像を別々ではなく“統合された意図”として理解。カメラ動作、服装、雰囲気をすべてガイドに沿わせます。
プロンプト生成動画
同じ女性が3つのロケーション(夕暮れの街、地下鉄ホーム、窓際のカフェ)を歩くクローズアップ。表情は集中→思案→リラックスへ緩やかに変化し、顔立ちと衣装は完全に一貫。カメラはパンやドリーで自然に移動。

カメラワークと動きのトランスファー

Kling O1にカメラワークや動きの参考動画を与えると、その動きを別の人物やシーンに適用できます。滑らかなオービット、手持ち風の歩行ショット、ドラマティックなプッシュインなどを違和感なく再現します。

Kling O1 と従来の別ツール型ワークフローの比較

Kling O1は、生成・編集・モーション転写を単一モデルで完結。従来の分散型ワークフローで発生しがちな細部のズレやスタイルの不一致を防ぎ、物語性のある動画制作をより効率化します。
項目Kling O1別ツール構成
特徴生成・編集・モーショントランスファー・スタイル変更を一つのモデルで実現。テキスト動画・画像動画・編集などを複数ツールで分担。
指示理解テキスト・画像・動画を統合して最終ショットを生成。各入力を独立処理し、整合性が崩れやすい。
カメラ・動作リファレンス動画のカメラ軌道をそのまま再現。キーフレームや追加プラグインが必要。
一貫性複数ショットでも人物・衣装・小道具が安定。ショットごとに“顔ズレ”や細部の不一致が起きやすい。
最適用途短いストーリー、製品紹介、キャラ中心のシーンなどに最適。単発ショットや簡易フィルター向け。
ワークフローGoEnhance AI内で生成・編集を一貫処理。複数ツールを行き来して編集する必要あり。

Kling O1 の機能一覧

マルチモーダルビジュアル言語のコア

Kling O1 は、テキスト・画像・動画を同一メッセージとして読み取り、短い指示、参考フレーム、モーション動画をまとめて最終ショットへ反映します。

キャラクターとシーンの継続性

主要キャラクター、小道具、環境情報を維持することで、ショット間の“顔ズレ”を防ぎます。スタイル変更やカメラ移動を加えても同じ人物・同じ場所として成り立ちます。

生成と編集を一体化したワークフロー

テキスト動画、画像動画、リファレンス動画、自然言語編集が同じモデルで実行可能。複数ツールへの切り替えが不要です。

柔軟な3〜10秒クリップ

Kling O1 は3〜10秒の短尺に最適化されており、SNS投稿、広告、物語の一場面として扱いやすい長さをコントロールできます。

細かなローカル編集

ブーケをぬいぐるみに変える、季節装飾を追加するなど、特定エリアだけを再描画し、全体の構図と動きを維持します。

カメラワークとモーショントランスファー

参考動画からカメラ軌道や人物の動きを学習し、別のキャラクターやシーンへ自然に適用できます。静止画にプロ級の動きを加える用途にも最適です。
Kling O1 のFAQ

Kling O1に関するよくある質問

Kling O1で動画を作り始めましょう

シーンを説明するだけで、静止画や参考動画から3〜10秒のシネマティックショットを生成できます。プロジェクトに合わせて自由に編集・再利用できます。

Kling O1を試す