Tongyi Lab 推出的 Z-Image 模型

Z-Image 是 Tongyi Lab 推出的 60 億參數的圖像生成模型，基於 single-stream diffusion transformer，在同一序列中處理文字與圖像 tokens，以更高效率產生一致、連貫的結果。在 GoEnhance 上，您可以使用 Z-Image-Turbo 進行快速文生圖、中文與英文雙語文字渲染，並以彈性的編輯流程線上完成，無需在本機安裝任何軟體。

免費試用 Z-Image-Turbo

Z-Image 的核心功能

清晰可讀的中英文文字

Z-Image-Turbo 經過訓練，可在圖像中直接描繪複雜的中文與英文字體設計。您可以在單一提示詞中同時使用兩種語言來設計海報、UI 原型與橫幅，依然得到清晰可讀的文字，而非破碎的字形。

測試文字渲染

Z-Image 雙語文字渲染範例

擬真人物與場景

Turbo 變體著重於強烈的擬真效果，具備自然光影與精細材質。它非常適合人像、產品視覺，以及城市或風景場景——在皮膚、布料、反射與景深上都能呈現可信的質感。

搭配我們的 AI 圖像產生器與更廣泛的 AI 圖像模型系列，對需要逼真、可投入製作的視覺內容的創作者而言，是值得信賴的選擇。

試用擬真模式

Z-Image 擬真生成範例

提示詞推理與結構

憑藉提示詞增強器與豐富的世界知識，Z-Image 不僅能理解短標籤。您可描述元素之間的關係、粗略版面或敘事細節，模型會盡力反映這些結構，而非忽略它們。

使用豐富提示詞

Z-Image 提示詞推理與版面範例

Turbo、Base 與 Edit 變體

除了 Turbo 變體，Tongyi Lab 計畫提供一個 non-distilled 的 Z-Image-Base checkpoint 以供自訂 fine-tuning，並推出 Z-Image-Edit 以進行自然語言驅動的圖像編輯。此系列能讓您更輕鬆地從實驗走向量身打造的工作流程。

探索 Z-Image 全系列

Z-Image 模型變體與工作流程

如何在 GoEnhance 使用 Z-Image？

01

詳細描述您的想法

撰寫涵蓋主體、風格、鏡頭氛圍，以及您希望呈現於畫面的中文或英文文字的提示詞。您也可以描述各元素之間應如何相互關聯。

02

選擇 Z-Image 並加入參考

在 GoEnhance 中選擇 Z-Image 模型，決定是從純文字開始，或上傳原始圖片進行編輯。

03

生成、調整與匯出

微調步數、強度與引導，取得您喜歡的平衡。滿意結果後，可將圖片下載為 PNG 或 JPG，或直接送往其他 GoEnhance 工具進行放大或製作影片。

從 Z-Image-Turbo 開始

讓團隊與個人創作者在日常視覺工作中信賴 Z-Image 的理由

為何在 GoEnhance 使用 Z-Image？

快速且實用的圖像品質

Z-Image-Turbo 透過蒸餾優化 few-step sampling，讓您能夠從提示詞快速生成可用的圖像，足以支援真實專案，而不僅是緩慢的實驗。

雙語文字依然清晰可讀

此模型能在圖像中直接處理中文與英文文字，對於面向雙語受眾的海報、封面與社群圖像特別實用。

穩定的構圖與主體聚焦

single-stream 架構有助於讓文字與圖像 tokens 保持對齊，減少常見的漂移現象——主體或版面在不同版本間逐漸改變。

高效的單序列 Transformer

將文字、semantic tokens 與 VAE 圖像 tokens 一併輸入同一序列，Z-Image 比 dual-stream 系統更有效運用參數，並能乾淨地擴展到更大型的場景。

有利研究的蒸餾設計

Decoupled-DMD 與 DMDR 的訓練方法將 distribution matching、CFG-style augmentation 與 reinforcement learning 分離，讓研究者能更清楚掌握 few-step 模型的行為。

與 GoEnhance 深度整合

在 GoEnhance 中的 Z-Image 與其他工具共用同一工作空間。您可生成、編輯、放大，或將靜態圖送入影片流程，無需自行撰寫腳本或管理 GPU。

常見問題

什麼是 Z-Image？

Z-Image 是 Tongyi Lab 推出的圖像生成模型系列。它採用 single-stream diffusion transformer，將文字與圖像 tokens 混合於同一時間序列，從自然語言提示詞生成連貫的圖像。

誰開發並維護 Z-Image？

Z-Image 由 Tongyi Lab 開發。團隊亦提出 Decoupled-DMD 與 DMDR 訓練方法，支撐蒸餾後的 Turbo 變體，並引導 Base 與 Edit 模型的路線圖。

什麼是 Z-Image-Turbo？

Z-Image-Turbo 是基礎模型的蒸餾版本，旨在以非常少的 sampling 步驟運作。約需八次模型評估即可產生優質圖像，因此適合互動式使用與大量批次。

什麼是 Z-Image-Base 與 Z-Image-Edit？

Z-Image-Base 是完整的基礎 checkpoint，面向 fine-tuning 與自訂開發。Z-Image-Edit 則是專為圖像編輯訓練的變體，您可用自然語言描述應如何修改既有圖片。

Z-Image 與其他圖像模型相比表現如何？

在 Alibaba AI Arena 的人類偏好測試（如 Elo 式評測）中，Z-Image-Turbo 具備與領先系統相媲美的競爭力，同時仍對研究開放，並可整合進更廣泛的工作流程。

Z-Image 是否可在 GoEnhance 中使用？

可以。GoEnhance 已與 Z-Image 連接，您可直接在瀏覽器中執行文生圖與相關流程，同步擁有專案管理、放大與影片工具於同一處。

我可以將 Z-Image 的產出用於商業用途嗎？

在 GoEnhance 上以 Z-Image 生成的圖像通常可用於商業專案，只要您遵守 GoEnhance 的 Terms of Service，並遵循您所在地區適用的內容、品牌與授權規範。

更多 GoEnhance 的 AI 圖像模型

FLUX.2

FLUX.2

Nano Banana Pro

Nano Banana Pro

DALL·E 3

DALL·E 3

/image-models/flux1/flux-ai-anime-generator

FLUX AI Anime Generator

在 GoEnhance AI 試用 Z-Image

打開 GoEnhance，選擇 Z-Image 模型，僅需幾步就能把詳細提示詞轉成雙語海報、擬真人像與可直接設計使用的視覺作品。

開始用 Z-Image 創作