goenhance logo

Tongyi Lab 推出的 Z-Image 模型

Z-Image 是 Tongyi Lab 推出的 60 億參數的圖像生成模型,基於 single-stream diffusion transformer,在同一序列中處理文字與圖像 tokens,以更高效率產生一致、連貫的結果。 在 GoEnhance 上,您可以使用 Z-Image-Turbo 進行快速文生圖、中文與英文雙語文字渲染,並以彈性的編輯流程線上完成,無需在本機安裝任何軟體。
免費試用 Z-Image-Turbo

Z-Image 的核心功能

清晰可讀的中英文文字

Z-Image-Turbo 經過訓練,可在圖像中直接描繪複雜的中文與英文字體設計。您可以在單一提示詞中同時使用兩種語言來設計海報、UI 原型與橫幅,依然得到清晰可讀的文字,而非破碎的字形。

Z-Image 雙語文字渲染範例

擬真人物與場景

Turbo 變體著重於強烈的擬真效果,具備自然光影與精細材質。它非常適合人像、產品視覺,以及城市或風景場景——在皮膚、布料、反射與景深上都能呈現可信的質感。

搭配我們的 AI 圖像產生器 與更廣泛的 AI 圖像模型 系列,對需要逼真、可投入製作的視覺內容的創作者而言,是值得信賴的選擇。

Z-Image 擬真生成範例

提示詞推理與結構

憑藉提示詞增強器與豐富的世界知識,Z-Image 不僅能理解短標籤。您可描述元素之間的關係、粗略版面或敘事細節,模型會盡力反映這些結構,而非忽略它們。

Z-Image 提示詞推理與版面範例

Turbo、Base 與 Edit 變體

除了 Turbo 變體,Tongyi Lab 計畫提供一個 non-distilled 的 Z-Image-Base checkpoint 以供自訂 fine-tuning,並推出 Z-Image-Edit 以進行自然語言驅動的圖像編輯。此系列能讓您更輕鬆地從實驗走向量身打造的工作流程。

Z-Image 模型變體與工作流程

如何在 GoEnhance 使用 Z-Image?

01

詳細描述您的想法

撰寫涵蓋主體、風格、鏡頭氛圍,以及您希望呈現於畫面的中文或英文文字的提示詞。您也可以描述各元素之間應如何相互關聯。

02

選擇 Z-Image 並加入參考

在 GoEnhance 中選擇 Z-Image 模型,決定是從純文字開始,或上傳原始圖片進行編輯。

03

生成、調整與匯出

微調步數、強度與引導,取得您喜歡的平衡。滿意結果後,可將圖片下載為 PNG 或 JPG,或直接送往其他 GoEnhance 工具進行放大或製作影片。

讓團隊與個人創作者在日常視覺工作中信賴 Z-Image 的理由

為何在 GoEnhance 使用 Z-Image?

快速且實用的圖像品質

Z-Image-Turbo 透過蒸餾優化 few-step sampling,讓您能夠從提示詞快速生成可用的圖像,足以支援真實專案,而不僅是緩慢的實驗。

雙語文字依然清晰可讀

此模型能在圖像中直接處理中文與英文文字,對於面向雙語受眾的海報、封面與社群圖像特別實用。

穩定的構圖與主體聚焦

single-stream 架構有助於讓文字與圖像 tokens 保持對齊,減少常見的漂移現象——主體或版面在不同版本間逐漸改變。

高效的單序列 Transformer

將文字、semantic tokens 與 VAE 圖像 tokens 一併輸入同一序列,Z-Image 比 dual-stream 系統更有效運用參數,並能乾淨地擴展到更大型的場景。

有利研究的蒸餾設計

Decoupled-DMD 與 DMDR 的訓練方法將 distribution matching、CFG-style augmentation 與 reinforcement learning 分離,讓研究者能更清楚掌握 few-step 模型的行為。

與 GoEnhance 深度整合

在 GoEnhance 中的 Z-Image 與其他工具共用同一工作空間。您可生成、編輯、放大,或將靜態圖送入影片流程,無需自行撰寫腳本或管理 GPU。

Frequently Asked Questions

更多 GoEnhance 的 AI 圖像模型

在 GoEnhance AI 試用 Z-Image

打開 GoEnhance,選擇 Z-Image 模型,僅需幾步就能把詳細提示詞轉成雙語海報、擬真人像與可直接設計使用的視覺作品。

開始用 Z-Image 創作