結合 Mixture-of-Experts 與 Transfusion 方法,實現多模態統一建模與生成。
理解現實世界與專業知識,生成語義更豐富、準確度更高的視覺結果。
單次輸入可達 1000+ 字,適合複雜場景、多鏡頭、多層次故事描述。
在海報、資訊圖、LOGO 中表現出色,中英文文字渲染清晰可讀。
支援攝影寫實、動漫插畫、油畫水彩、3D 渲染等多種風格訓練覆蓋。
完整開放原始碼與權重,許可友好,個人與企業均可合法商用。
描述主體、動作、氛圍與構圖,支援千字級長文本,適合複雜敘事。
根據需求選擇寫實、動漫、海報設計或 3D 渲染。
快速預覽後,可透過提升步數或調整提示進行最終打磨。
體驗騰訊最先進的開源圖像模型 —— 支援長文本提示、精準文字渲染、多風格生成與商業友好許可。