goenhance logo

HappyHorse 1.1 AI 影片生成器

HappyHorse 1.1 是阿里巴巴升級後的多模態 AI 影片模型,適用於 3–15 秒的短片,具備更流暢的動態、更強的主體一致性、更精準的提示詞遵循能力、更自然的視覺質感,以及原生影音生成功能。

HappyHorse 1.1 的主要功能

更強的動態與時間一致性

HappyHorse 1.1 改進了動態建模與影格間的一致性,特別是在格鬥、舞蹈、奔跑、轉身、車輛移動及鏡頭跟隨拍攝方面。與 1.0 版本相比,它減少了慢動作感、殘影以及動作節奏不連貫的問題。
提示詞範例生成的影片片段
一條兇猛的紅龍(元素)從海中衝出,飛向天空並在船隻上方快速盤旋,掀起巨大的波浪。動態鏡頭跟隨紅龍穿過風暴,翻越滔天巨浪,最後消失在遠方。

更穩定的多參考圖 R2V

升級後的多參考圖影片工作流程支援最多 9 張參考圖。這有助於在短片中保持人物臉部、服裝、產品細節、品牌元素與環境的一致性,非常適合電子商務廣告、直播風格影片、產品展示及基於角色的內容創作。

更佳的長提示詞與場景規劃

HappyHorse 1.1 提升了對長文本的理解、角色關係、場景規劃以及鏡頭語言的詮釋能力。它能更精準地遵循描述誰在說話、角色站位、情緒變化以及鏡頭切換方式的提示詞。
提示詞範例生成的影片片段
一個位於外星球的繁華未來市場,外星商人兜售著發光的水果,機器人隨處可見,漂浮的全息廣告充斥空中,四周閃爍著五彩斑斕的燈光,以電影級手持攝影風格呈現。

更自然的視覺質感

該模型針對更真實的皮膚紋理、臉部細節、毛髮渲染、光影與局部穩定性進行了調整。它減少了 1.0 版本中出現的油膩或過度處理感,同時讓肖像與短劇視覺效果更加自然。

原生影音生成

HappyHorse 能同時生成音訊與影片,而非事後添加聲音。1.1 版本改進了語音節奏、停頓、情感語氣、背景音樂、環境音以及影音同步效果,儘管樂器演奏場景可能仍需人工檢查。

HappyHorse 1.1 參數

參數數值備註
發佈日期2026 年 6 月 22 日作為阿里巴巴升級版 HappyHorse 影片生成模型正式發佈。
模型大小150 億參數一款擁有 150 億參數的多模態影片生成模型。
架構統一多模態 Transfusion / 單流 Transformer文字、圖像、影片和音訊標記在單一模型中處理,而非透過獨立的拼接模組。
Transformer 深度40 層報告顯示為統一的 40 層 Transformer 架構。
生成模式文字轉影片、圖像轉影片、參考圖轉影片、影片編輯涵蓋文字提示、靜態圖像動畫、多參考圖影片創作及影片編輯場景。
時長3–15 秒單次生成的片段支援短影音長度。
解析度720p / 1080p支援 HD 及 Full HD 生成。
影格率24fps適用於電影感短影音片段。
長寬比自訂 / 靈活支援橫向、縱向、正方形及其他創意格式的靈活輸出比例。
參考圖像最多 9 張圖像有助於鎖定角色、產品、服裝、場景及品牌元素。
音訊支援輸出包含音訊的影片,包括對話、環境音、音樂及音效。
去噪DMD-2 蒸餾,8 個去噪步驟減少生成步驟並提高效率。
CFG已移除移除無分類器引導 (Classifier-free guidance) 以提升效率。
推論速度在單張 NVIDIA H100 上生成 5 秒 1080p 短片約需 38 秒針對短片 1080p 生成的基準測試報告。
720p 價格牌價 0.9 元人民幣/秒;促銷價最低可達 0.54 元人民幣/秒促銷價格取決於平台與活動。
1080p 價格牌價 1.2 元人民幣/秒;促銷價最低可達 0.72 元人民幣/秒1080p 牌價較 HappyHorse 1.0 的 1.6 元人民幣/秒降低了 25%。

HappyHorse 1.1 應用場景

電子商務產品與直播銷售影片

使用多張參考圖,將代言人、產品、服裝與直播風格場景結合至單一短廣告片段中。當產品顏色、包裝、口紅色號、服裝或品牌細節必須保持一致,而非僅僅是「看起來差不多」時,此功能非常實用。

短劇、品牌故事與遊戲 CG 概念

HappyHorse 1.1 更適合情感對話、多鏡頭室內場景、動作序列、電影級品牌預告片以及風格化遊戲 CG 概念,因為它提升了動作連貫性、長提示詞規劃、鏡頭語言理解能力以及自然的臉部紋理。

X 平台上的 HappyHorse 1.1

HappyHorse 1.1 常見問題解答

什麼是 HappyHorse 1.1?

HappyHorse 1.1 是阿里巴巴升級後的 AI 影片生成模型,專為短片創作打造。它專注於更流暢的動作、更強的主體一致性、更好的提示詞遵循能力、更自然的影像品質以及改進的影音同步效果。

HappyHorse 1.1 支援哪些生成模式?

它支援文生影片 (text-to-video)、圖生影片 (image-to-video)、多參考圖生影片 (multi-reference reference-to-video) 以及影片編輯工作流程,適用於 AI 短片創作。

HappyHorse 1.1 生成的影片長度限制為何?

單次生成的片段支援 3 到 15 秒,適合短廣告、社群影片、角色片段、產品演示與短劇鏡頭。

支援哪些解析度?

HappyHorse 1.1 支援 720p 與 1080p 生成,並提供靈活的長寬比以適應不同的內容格式。

HappyHorse 1.1 最多可以使用多少張參考圖?

多參考圖工作流程最多支援 9 張參考圖,協助模型保留角色臉部、服裝、產品、場景與品牌元素。

HappyHorse 1.1 與 HappyHorse 1.0 有何不同?

1.1 版本保持了相同的總體技術方向,但在動作連貫性、多參考圖主體鎖定、複雜提示詞理解、視覺紋理與音訊表現方面均有所提升。此外,相較於 1.0 版本,1080p 的牌價也更為親民。

HappyHorse 1.1 能生成音訊嗎?

可以。HappyHorse 1.1 能夠與影片同步生成語音、環境音、音樂和音效。

主要的限制有哪些?

它在處理複雜物理效果、擁擠背景人臉、極端多主體場景以及樂器演奏音訊同步方面仍可能遇到困難。用於商業用途時,輸出內容在發布前仍應經過審核。

準備好測試 HappyHorse 1.1 了嗎?

使用 HappyHorse 1.1 探索 AI 短片,體驗更流暢的動作、更穩定的參考主體、更精準的提示詞遵循能力以及原生音訊。它特別適用於短劇、電商廣告、品牌概念和遊戲風格的影片創意。

試用 HappyHorse 1.1