针对 2048×2048 与多种高分辨率比例优化,细节清晰、构图稳定、还原度更高。
32× 空间压缩在保留结构的同时显著减少 token 数量——以近似 1K 的 token 规模实现 2K 画质,推理更高效。
多模态编码器理解场景与动作,结合字形感知的 ByT5 提升文本渲染与中英双语能力。
可选提示词重写增强语义清晰度;Refiner 进一步提升细节并减少伪影——二者搭配效果最佳。
蒸馏版本支持更少步数即可出图,适合快速预览与迭代创作。
支持 1:1、16:9、9:16、4:3、3:4、3:2、2:3 等多比例,覆盖社媒、电商与打印等场景。
明确主体、场景、光线、构图与(如有)画面文字;可补充风格关键词(写实/动漫/电影感等)。
打开 PromptEnhancer 获得更丰富细节;启用 Refiner 获得更锐利边缘与更少伪影。
先用蒸馏步数快速预览,再进行放大/精修,导出最终成品。
原生 2K、强指令对齐、多语言支持,可选提示增强与精修,浏览器即开即用。