goenhance logo

Probé Seedance 2.0: Video Multimodal, Control de Referencia y Edición

Cover Image for Probé Seedance 2.0: Video Multimodal, Control de Referencia y Edición
Irwin

Todavía recuerdo la época en que "hacer un video de IA" significaba una cosa: escribir un aviso, tal vez agregar un primer cuadro y un último cuadro, y esperar que el modelo de alguna manera cuente la historia que tenías en mente.

Ese flujo de trabajo siempre se sentía como susurrar instrucciones a través de una pared.

Así que cuando escuché que Seedance 2.0 se construyó alrededor de una idea diferente — no solo generar video, sino entender referencias — tuve que probarlo. Después de probarlo, mi conclusión es simple:

Seedance 2.0 no es solo una actualización multimodal. Es una actualización de control.

Es la primera vez que siento que no estoy rogándole al modelo por un resultado... Estoy realmente dirigiendo.

Qué Cambió: Seedance 2.0 Ahora Piensa en Cuatro Modalidades

Seedance 2.0 admite cuatro tipos de entrada:

  • Imágenes (hasta 9)
  • Videos (hasta 3, total ≤ 15s)
  • Audio (MP3, hasta 3, total ≤ 15s)
  • Texto (lenguaje natural)

Y aquí está la clave: no estás obligado a un estilo de entrada "correcto".

Puedo usar una imagen para fijar el estilo, usar un video para definir el movimiento + lenguaje de cámara, y luego usar unos segundos de audio para establecer ritmo y ambiente — todo mientras uso inglés simple (o cualquier lenguaje natural) para explicar lo que quiero.

Esa sensación de "combinación libre" es real: ya no estoy escribiendo avisos; estoy ensamblando una pila creativa.

El Mayor Destacado: Capacidad de Referencia (Este Es el Verdadero 2.0)

Si tuviera que resumir Seedance 2.0 en una oración:

Es un modelo que puede "referenciar el mundo" y mantenerse fiel a lo que le das.

Las mejoras de referencia se muestran de cuatro maneras:

1) Imágenes de Referencia Que Realmente Respetan Composición y Detalles

Probé con imágenes cargadas de estilo y carácter, y la mejor mejora fue esta: la composición se mantiene, los detalles del carácter persisten, y no "deriva" tan rápidamente hacia caras genéricas o accesorios vagos.

2) Videos de Referencia Que Entienden el Lenguaje de Cámara + Movimiento Complejo

Aquí es donde se siente como un producto diferente.

En lugar de describir "acercamiento, paneo rápido, toma de seguimiento, ritmo rápido, efecto de transición…" en un muro de texto, puedo simplemente decir:

  • "Referencia el movimiento de cámara y el ritmo de corte de @video1"
  • "Copia el tempo de acción y los efectos creativos de @video2"

Y realmente lo hace — incluyendo sincronización de acción compleja, transiciones creativas, y efectos estilizados.

3) Extensión de Video Suave: No Solo Generar — "Seguir Filmando"

Seedance 2.0 admite extender un video existente y conectar clips más suavemente.

Eso importa porque la creación real no siempre es "empezar desde cero." A veces solo quiero: "Continúa esta toma por 5 segundos, mantén el movimiento y el ambiente consistentes."

Seedance 2.0 finalmente trata eso como un flujo de trabajo de primera clase.

4) La Edición Es Más Fuerte: Reemplazar / Eliminar / Agregar Dentro de un Video Existente

Este es un cambio sutil pero enorme: la creación de video ya no es solo generación.

Seedance 2.0 puede tomar un video existente y permitirme especificar:

  • reemplazar un personaje
  • eliminar o reducir una parte
  • agregar un elemento
  • redirigir el ritmo de la historia

Es la diferencia entre "salida" y "control".

Cómo Se Siente en la Práctica: El Flujo de Trabajo "@ Referencia"

El diseño de interacción es sorprendentemente práctico.

Hay dos puntos de entrada principales:

  • Modo Primer/Último Cuadro (bueno si es solo una imagen de primer cuadro + aviso)
  • Modo de Referencia Todo Propósito (necesario para entradas multimodales mixtas)

Dentro de Todo Propósito de Referencia, todo está impulsado por una idea simple:

Asignas roles escribiendo @nombredearchivo

Patrón de pensamiento de ejemplo:

  • @imagen1 como el primer cuadro (bloqueo de estilo)
  • @video1 para referenciar lenguaje de cámara + ritmo de movimiento
  • @audio1 para música de fondo / sincronización
  • luego escribe el aviso como si estuvieras informando a un editor + cinematógrafo

No es complicado — pero cambia la forma en que haces avisos. Dejas de describir todo abstractamente y comienzas a señalar referencias concretas.

La Actualización Silenciosa Que Importa: La Calidad Base Mejoró

Multimodal es el titular, pero Seedance 2.0 también se siente mejorado en lo fundamental:

  • el movimiento parece más natural
  • el comportamiento físico se siente más razonable
  • el seguimiento de instrucciones es más preciso
  • la consistencia de estilo es más estable
  • el resultado se ve más suave y más "real"

Si 1.0 se sentía como "a veces mágico, a veces caótico," 2.0 se siente como "aún creativo, pero mucho más confiable."

Límites del Mundo Real Que Debes Saber (Antes de Confundirte)

Algunas limitaciones prácticas a las que tuve que adaptarme:

  • Límite total de entrada mixta: 12 archivos (imágenes + videos + audio combinados)
  • Longitud de salida ≤ 15s (puedes elegir 4–15s)
  • Las referencias de video pueden ser más costosas que otras entradas (vale la pena planificarlo)
  • Las caras humanas realistas están actualmente restringidas para subir (imágenes/videos que contengan caras humanas reales claras pueden ser bloqueadas debido a cumplimiento)

Ese último es importante: si intentas subir la cara de una persona real y falla, no es tu flujo de trabajo — es una restricción de la plataforma.

Por Qué Esto Importa: Seedance 2.0 Es "Creatividad Controlable"

Muchos modelos de video son juzgados por una sola pregunta:

"¿Puede generar un clip genial?"

Pero los creadores reales se preocupan por una pregunta diferente:

"¿Puede generar el clip que estoy tratando de expresar?"

Seedance 2.0 se mueve hacia esa segunda pregunta.

Porque la actualización no es solo "más modalidades." Es que el modelo ahora trata la referencia como un elemento central — y la referencia es cómo trabajan realmente los directores, editores y diseñadores.

Mi Pensamiento Final

Cuando probé Seedance 2.0, no sentí que estaba apostando en un aviso.

Sentí que estaba construyendo una escena:

  • bloquear el estilo con una imagen
  • definir movimiento y cámara con video
  • establecer ambiente y sincronización con audio
  • luego usar texto para decir lo que importa

Ese flujo de trabajo está más cerca de la realización cinematográfica real que cualquier cosa que haya probado en esta categoría.

Seedance 2.0 es donde la creación de video multimodal deja de ser "solo generación" y comienza a ser "dirigible."

Seedance 2.0 — ideas audaces primero. Deja que el modelo maneje el resto.