goenhance logo

SkyReels-V3(统一的多模态生成)

制作一致性强的短片。使用 SkyReels-V3,您可以动画化单个参考图像,将 5 秒的片段扩展为更长的时刻,或通过音频驱动会说话的头像,同时保持身份、构图和运动的稳定性。从细微动作开始,获得干净的 5–8 秒结果,然后迭代优化。

试用 SkyReels-V3

SkyReels-V3 的关键功能

参考图像到视频(身份稳定)

SkyReels-V3 旨在保持主体外观和原始构图的稳定,同时添加可信的动作——适用于产品拍摄、肖像、角色和场景概念。
提示生成片段
参考:一只金毛犬坐在前门廊。提示:狗站起来,四处张望,尾巴轻轻摇摆,晨光,手持相机感,自然动作,干净背景。

多参考控制(最多 4 张图像)

结合多个参考图像来指导谁/什么出现以及应该保持在哪里。这是一种实用的方法,可以在需要受控输出时保持身份、服装和场景布局的一致性。
提示生成片段
使用 2–4 个参考:(1) 人物肖像,(2) 咖啡馆内部,(3) 杯子的特写。提示:人物拿起杯子,蒸汽升起,柔和的窗光,微妙的相机推入,一致的服装和面部。

视频扩展(单镜头延续)

SkyReels-V3 可以扩展初始片段,同时保留场景结构、运动动态和视觉风格——在需要更长的镜头而无需重新拍摄或手动编辑时非常有用。
提示生成片段
输入:一个 5 秒的剪辑,展示模特在花园里散步。提示:扩展到 10 秒,保持服装图案和光线,添加轻微的微风,慢慢向左平移,保持相同的场景和节奏。

导演风格镜头切换

对于类似故事的输出,SkyReels-V3 支持由文本指导的镜头变化——适用于访谈、对话、产品讲述和简单的电影序列。
提示生成片段
提示:两个人坐在舒适的咖啡馆里,自然地在小桌子上聊天。5 秒的剪辑,带有轻微的相机变化:从中宽镜头开始,展示两人从腰部以上以及桌子(杯子可见),然后轻推向主说话者以获得稍微紧凑的构图。柔和的侧窗光,温暖的室内,轻微的背景虚化,微妙的手势和点头,真实的嘴部动作(无夸张的唇同步),稳定的相机,平滑的过渡(无突然剪切),电影色彩,浅景深。

音频驱动的会说话头像(唇同步)

从一张肖像和音频轨生成会说话的头像,专注于紧密的唇同步和长时间的稳定性。非常适合快速说明、公告和多语言配音。

在一个地方构建完整工作流程

SkyReels-V3 自然地融入实用的管道:从动画化图片开始,优化动作,扩展剪辑,然后添加语音驱动的介绍。如果您需要更广泛的工具箱,它也可以很好地与AI 视频生成器工作流程配合,以满足不同的创意需求。

提示技巧与最佳实践

1

使用清晰的动作动词(保持人类尺度)

写下您可以在一个镜头中“看到”的动作:“站起来”、“向左看然后回头”、“眨一次眼”、“微微一笑”、“手抬起杯子”、“蒸汽升起”、“相机慢推入”。如果您一次要求太多动作,运动往往会变得不自然——选择 1–2 个主要动作,并保持其他一切稳定。

2

从实用参数开始(可复制的预设)

初始预设(最稳定):时长 5 秒 • 比例 16:9 或 9:16 • 相机:固定或慢推入 • 动作:低→中 • 背景:不变。扩展预设:从 5 秒开始 → 首先扩展到 10 秒(而不是 30 秒)• 保持光线/风格不变 • 仅添加一个新的动作提示(例如,“轻微的微风”)。如果您看到漂移,请缩短时长,降低动作强度,并简化相机运动。

3

参考指导:锁定身份 + 构图

如果一致性很重要,请明确说明:“保持面部、服装和背景不变;保持构图和颜色。”对于多参考,分配角色以防模型混淆它们:“Ref1 控制人物/面部,Ref2 控制房间/背景,Ref3 控制杯子/道具。”然后添加一句话:“不要在参考之间交换角色。”

4

您可以复制的提示示例

(1) 图像到视频:“保持主体的面部和服装完全相同。微妙的呼吸和一个自然的眨眼。柔和的日光。轻微的手持感。背景不变。” (2) 视频扩展:“平滑扩展到 10 秒。保持光线、服装图案和背景。添加轻微的微风。慢向左平移。无突然剪切。” (3) 会说话的头像:“准确的唇同步。自然的眨眼。轻微的点头。干净的背景。保持面部细节在帧间稳定。”

如何使用 SkyReels-V3

01

选择您的模式

选择您需要的工作流程:参考图像到视频或视频扩展。这可以使您的设置更简单,避免输入不匹配。

02

添加输入 + 编写扎实的提示

上传您的参考图像或初始视频。然后编写一个提示,说明动作、相机感、光线以及必须保持一致的内容(身份、服装、背景)。

03

调整参数并生成

设置时长、比例和 FPS。从保守的设置开始(较短的长度、中等的动作),生成,然后通过调整动作强度和场景约束进行迭代。

常见问题解答

SkyReels-V3 常见问题

今天开始使用

使用 SkyReels-V3 创建稳定、故事准备好的剪辑——动画化参考图像、扩展片段或在几分钟内构建会说话的头像。从干净的 5 秒剪辑开始,一旦看起来合适即可扩展。

立即开始创作