Modelo Z-Image de Tongyi Lab

Z-Image es un modelo de generación de imágenes de 6B parámetros de Tongyi Lab, basado en un single-stream diffusion transformer que procesa tokens de texto e imagen en una sola secuencia para resultados eficientes y coherentes. En GoEnhance, puedes usar Z-Image-Turbo para texto a imagen rápido, renderizado de texto bilingüe en chino e inglés y flujos de edición flexibles sin instalar nada localmente.

Prueba Z-Image-Turbo gratis

Características clave de Z-Image

Texto chino e inglés nítido

Z-Image-Turbo está entrenado para dibujar tipografías complejas en chino e inglés directamente en la imagen. Puedes diseñar carteles, maquetas de UI y banners con ambos idiomas en un solo prompt y seguir obteniendo texto claro y legible en lugar de caracteres rotos.

Ejemplo de renderizado de texto bilingüe con Z-Image

Personas y escenas fotorrealistas

La variante Turbo se centra en un fotorrealismo sólido con iluminación natural y materiales detallados. Funciona bien para retratos, visuales de producto y escenas urbanas o de paisajes donde la piel, el tejido, los reflejos y la profundidad deben sentirse verosímiles.

Combinado con nuestro generador de imágenes con IA y la gama más amplia de modelos de imágenes de IA, se convierte en una opción fiable para creadores que necesitan visuales realistas listos para producción.

Ejemplo de generación fotorrealista con Z-Image

Razonamiento y estructura del prompt

Con un mejorador de prompts y sólido conocimiento del mundo, Z-Image puede seguir más que etiquetas cortas. Describe las relaciones entre elementos, composiciones aproximadas o detalles narrativos, y el modelo intentará reflejar esa estructura en lugar de ignorarla.

Ejemplo de razonamiento de prompt y composición con Z-Image

Variantes Turbo, Base y Edit

Junto a la variante Turbo, Tongyi Lab planea un checkpoint Z-Image-Base no destilado para fine-tuning personalizado, y Z-Image-Edit para edición de imágenes guiada por lenguaje natural. Esta familia facilita pasar de la experimentación a flujos de trabajo personalizados.

Variantes del modelo Z-Image y flujos de trabajo

¿Cómo usar Z-Image en GoEnhance?

Describe tu idea en detalle

Escribe un prompt que cubra el sujeto, el estilo, la sensación de cámara y cualquier texto en chino o inglés que quieras en la imagen. También puedes describir cómo deben relacionarse los distintos elementos.

Elige Z-Image y añade referencias

En GoEnhance, selecciona el modelo Z-Image y decide si empezar desde texto puro o subir una imagen de origen para editar.

Genera, ajusta y exporta

Ajusta los pasos, la intensidad y la guía para lograr el equilibrio que te guste. Cuando estés satisfecho con el resultado, descarga tu imagen como PNG o JPG, o envíala directamente a otras herramientas de GoEnhance para escalado de resolución o uso en vídeo.

Comienza con Z-Image-Turbo

Razones por las que equipos y creadores individuales pueden confiar en Z-Image para el trabajo visual diario

¿Por qué usar Z-Image en GoEnhance?

Calidad de imagen rápida y práctica

Z-Image-Turbo está destilado para muestreo de pocos pasos, así puedes pasar del prompt a una imagen utilizable con rapidez, suficiente para proyectos reales en lugar de solo experimentos lentos.

Texto bilingüe que se mantiene legible

El modelo está entrenado para manejar texto en chino e inglés directamente dentro de las imágenes, lo cual es útil para carteles, portadas y gráficos sociales dirigidos a audiencias bilingües.

Composición estable y enfoque del sujeto

La arquitectura single-stream ayuda a mantener alineados los tokens de texto e imagen, reduciendo el desvío habitual donde el sujeto o la composición cambian lentamente entre versiones.

Transformer single-stream eficiente

Al introducir texto, tokens semánticos y tokens de imagen VAE en una sola secuencia, Z-Image aprovecha mejor los parámetros que los sistemas de doble flujo y escala de forma limpia a escenas más grandes.

Diseño de destilación apto para investigación

El enfoque de entrenamiento Decoupled-DMD y DMDR separa la coincidencia de distribución, la ampliación estilo CFG y el aprendizaje por refuerzo, dando a los investigadores un control más claro sobre el comportamiento del modelo de pocos pasos.

Integración estrecha con GoEnhance

Z-Image en GoEnhance encaja en el mismo espacio de trabajo que tus otras herramientas. Genera, edita, escala o lleva fotogramas fijos a flujos de trabajo de vídeo sin escribir scripts ni gestionar GPUs tú mismo.

Preguntas frecuentes

¿Qué es Z-Image?

Z-Image es una serie de modelos de generación de imágenes de Tongyi Lab. Utiliza un single-stream diffusion transformer que mezcla tokens de texto e imagen en una sola línea temporal para producir imágenes coherentes a partir de prompts de lenguaje natural.

¿Quién construye y mantiene Z-Image?

Z-Image es desarrollado por Tongyi Lab. El equipo también propone los métodos de entrenamiento Decoupled-DMD y DMDR que impulsan la variante Turbo destilada y guían la hoja de ruta para los modelos Base y Edit.

¿Qué es Z-Image-Turbo?

Z-Image-Turbo es una versión destilada del modelo base diseñada para muy pocos pasos de muestreo. Ofrece una calidad de imagen sólida con alrededor de ocho evaluaciones del modelo, lo que lo hace práctico para uso interactivo y lotes grandes.

¿Qué son Z-Image-Base y Z-Image-Edit?

Z-Image-Base es el checkpoint completo de base orientado al fine-tuning y al desarrollo personalizado. Z-Image-Edit es una variante entrenada específicamente para edición de imágenes, donde describes cómo debería cambiarse una imagen existente en lenguaje natural.

¿Cómo se compara Z-Image con otros modelos de imágenes?

En pruebas de preferencia humana como evaluaciones estilo Elo en Alibaba AI Arena, Z-Image-Turbo ocupa posiciones competitivas frente a los sistemas líderes, mientras se mantiene abierto para investigación e integración en flujos de trabajo más amplios.

¿Está Z-Image disponible dentro de GoEnhance?

Sí. GoEnhance se conecta con Z-Image para que puedas ejecutar texto a imagen y flujos relacionados directamente desde tu navegador, con gestión de proyectos, escalado de resolución y herramientas de vídeo en el mismo lugar.

¿Puedo usar resultados de Z-Image para trabajo comercial?

Las imágenes generadas con Z-Image en GoEnhance normalmente pueden utilizarse en proyectos comerciales siempre que sigas los Términos de Servicio de GoEnhance y respetes cualquier norma aplicable de contenido, marca y licencias en tu región.

Más modelos de imágenes de IA en GoEnhance

FLUX.2

Nano Banana Pro

DALL·E 3

FLUX AI Anime Generator

Prueba Z-Image en GoEnhance AI

Abre GoEnhance, elige el modelo Z-Image y convierte prompts detallados en carteles bilingües, retratos fotorrealistas y visuales listos para diseño en solo unos pocos pasos.

Empieza a crear con Z-Image