goenhance logo

HappyHorse 1.1 KI-Videogenerator

HappyHorse 1.1 ist das verbesserte multimodale KI-Videomodell von Alibaba für 3–15-sekündige Clips mit flüssigeren Bewegungen, stärkerer Konsistenz der Motive, besserer Umsetzung von Prompts, natürlicheren visuellen Texturen und nativer Audio-Video-Generierung.

Hauptfunktionen von HappyHorse 1.1

Stärkere Bewegung und zeitliche Konsistenz

HappyHorse 1.1 verbessert die Bewegungsmodellierung und die Konsistenz zwischen den Einzelbildern, insbesondere bei Kämpfen, Tanzen, Laufen, Drehungen, Fahrzeugbewegungen und Kamerafahrten. Im Vergleich zu 1.0 reduziert es das Zeitlupengefühl, Geisterbilder und abgehackte Bewegungsabläufe.
Beispiel-PromptGenerierter Clip
Ein wilder roter Drache (Elementarwesen) bricht aus dem Meer hervor, steigt in den Himmel auf und kreist schnell über dem Schiff, wobei er riesige Wellen aufpeitscht. Die dynamische Kamera folgt dem Drachen, während er durch den Sturm schneidet, sich durch turmhohe Dünungen rollt und in der Ferne verschwindet.

Stabilere Multi-Referenz-R2V

Der verbesserte Multi-Referenz-Video-Workflow unterstützt bis zu 9 Referenzbilder. Dies hilft dabei, Gesichter, Kleidung, Produktdetails, Markenelemente und Umgebungen über kurze Clips hinweg beizubehalten, was für E-Commerce-Anzeigen, Livestream-Videos, Produktdemos und charakterbasierte Inhalte nützlich ist.

Bessere Planung von langen Prompts und Szenen

HappyHorse 1.1 verbessert das Verständnis langer Kontexte, Rollenbeziehungen, Szenenplanung und die Interpretation der Kamerasprache. Es setzt Prompts, die beschreiben, wer spricht, wo Charaktere stehen, wie sich Emotionen verändern und wie die Kamera zwischen den Einstellungen schneidet, besser um.
Beispiel-PromptGenerierter Clip
Ein geschäftiger, futuristischer Markt auf einem anderen Planeten, auf dem außerirdische Händler leuchtende Früchte anpreisen, Roboter überall herumlaufen, schwebende holografische Werbeanzeigen die Luft füllen und überall bunte Lichter zu sehen sind, eingefangen in einem filmischen Handkamera-Stil.

Natürlichere visuelle Textur

Das Modell wurde für realistischere Hauttexturen, Gesichtsdetails, Haarwiedergabe, Beleuchtung, Schatten und lokale Stabilität optimiert. Es reduziert den öligen oder überbearbeiteten Look, der bei einigen 1.0-Ausgaben zu sehen war, und sorgt gleichzeitig für natürlichere Porträts und Kurzfilm-Visuals.

Native Audio-Video-Generierung

HappyHorse generiert Audio und Video gemeinsam, anstatt den Ton nachträglich hinzuzufügen. Version 1.1 verbessert Sprachrhythmus, Pausen, emotionale Tonalität, Hintergrundmusik, Umgebungsgeräusche und die audiovisuelle Synchronisation, obwohl Szenen mit Musikinstrumenten möglicherweise noch manuell überprüft werden müssen.

HappyHorse 1.1 Parameter

ParameterWertHinweise
Veröffentlichungsdatum22. Juni 2026Offiziell veröffentlicht als Alibabas aktualisiertes HappyHorse-Videogenerierungsmodell.
Modellgröße15 Mrd. ParameterEin multimodales Videogenerierungsmodell mit 15 Milliarden Parametern.
ArchitekturUnified multimodal Transfusion / Single-Stream-TransformerText-, Bild-, Video- und Audio-Token werden in einem einzigen Modell verarbeitet, anstatt in separaten, zusammengesetzten Modulen.
Transformer-Tiefe40 SchichtenBerichtet als einheitliche 40-schichtige Transformer-Architektur.
GenerierungsmodiText-zu-Video, Bild-zu-Video, Referenz-zu-Video, VideobearbeitungDeckt schriftliche Prompts, Standbildanimationen, Multi-Referenz-Videokreation und Videobearbeitungsszenarien ab.
Dauer3–15 SekundenEinzelne generierte Clips unterstützen Kurzvideoformate.
Auflösung720p / 1080pSowohl HD- als auch Full-HD-Generierung werden unterstützt.
Bildrate24 fpsGeeignet für filmische Kurzclips.
SeitenverhältnisBenutzerdefiniert / flexibelUnterstützt flexible Ausgabeformate für horizontale, vertikale, quadratische und andere kreative Formate.
ReferenzbilderBis zu 9 BilderNützlich zum Fixieren von Charakteren, Produkten, Outfits, Szenen und Markenelementen.
AudioUnterstütztGibt Videos mit Audio aus, einschließlich Dialogen, Umgebungsgeräuschen, Musik und Soundeffekten.
DenoisingDMD-2-Destillation, 8 Denoising-SchritteReduziert die Generierungsschritte und verbessert die Effizienz.
CFGEntferntClassifier-free Guidance wurde zur Effizienzsteigerung entfernt.
InferenzgeschwindigkeitEtwa 38 Sek. für einen 5-sekündigen 1080p-Clip auf einer NVIDIA H100Angegebener Benchmark für die Generierung kurzer 1080p-Videos.
720p-Preis0,9 RMB/Sek. Listenpreis; ab 0,54 RMB/Sek. im AngebotAktionspreise hängen von der Plattform und der Kampagne ab.
1080p-Preis1,2 RMB/Sek. Listenpreis; ab 0,72 RMB/Sek. im AngebotDer 1080p-Listenpreis liegt 25 % unter dem von HappyHorse 1.0 mit 1,6 RMB/Sek.

HappyHorse 1.1 Anwendungsfälle

E-Commerce-Produkt- und Live-Selling-Videos

Verwenden Sie mehrere Referenzbilder, um einen Sprecher, ein Produkt, ein Outfit und einen Raum im Livestream-Stil zu einem kurzen Werbeclip zu kombinieren. Dies ist nützlich, wenn Produktfarbe, Verpackung, Lippenstiftton, Kleidung oder Markendetails konsistent bleiben müssen, anstatt nur ungefähr korrekt auszusehen.

Kurzfilm, Markengeschichte und Game-CG-Konzepte

HappyHorse 1.1 eignet sich besser für emotionale Dialoge, Innenraumszenen mit mehreren Einstellungen, Actionsequenzen, filmische Markenteaser und stilisierte Game-CG-Konzepte, da es die Bewegungskontinuität, die Planung langer Prompts, das Verständnis der Kamerasprache und die natürliche Gesichtstextur verbessert.

HappyHorse 1.1 auf X

Häufig gestellte Fragen zu HappyHorse 1.1

Was ist HappyHorse 1.1?

HappyHorse 1.1 ist Alibabas verbessertes KI-Videogenerierungsmodell für kurze Clips. Es konzentriert sich auf flüssigere Bewegungen, stärkere Konsistenz der Motive, bessere Befolgung von Prompts, natürlichere Bildqualität und verbesserte Audio-Video-Synchronisation.

Welche Generierungsmodi unterstützt HappyHorse 1.1?

Es unterstützt Text-zu-Video, Bild-zu-Video, Multi-Referenz-zu-Video und Videobearbeitungs-Workflows für die Erstellung kurzer KI-Videos.

Wie lang können HappyHorse 1.1-Videos sein?

Einzeln generierte Clips unterstützen 3 bis 15 Sekunden, was für kurze Werbespots, Social-Media-Videos, Charakter-Clips, Produktdemos und Kurzfilm-Aufnahmen geeignet ist.

Welche Auflösungen werden unterstützt?

HappyHorse 1.1 unterstützt die Generierung in 720p und 1080p mit flexiblen Seitenverhältnissen für verschiedene Inhaltsformate.

Wie viele Referenzbilder kann HappyHorse 1.1 verwenden?

Der Multi-Referenz-Workflow unterstützt bis zu 9 Referenzbilder und hilft dem Modell dabei, Gesichter von Charakteren, Kleidung, Produkte, Szenen und Markenelemente beizubehalten.

Wie unterscheidet sich HappyHorse 1.1 von HappyHorse 1.0?

Version 1.1 behält die gleiche allgemeine technische Richtung bei, verbessert jedoch die Bewegungskontinuität, die Multi-Referenz-Motivfixierung, das Verständnis komplexer Prompts, die visuelle Textur und den Audioausdruck. Zudem wurde der 1080p-Listenpreis im Vergleich zu 1.0 gesenkt.

Erzeugt HappyHorse 1.1 Audio?

Ja. HappyHorse 1.1 kann zusammen mit dem Video Sprache, Umgebungsgeräusche, Musik und Soundeffekte generieren.

Was sind die Haupteinschränkungen?

Es kann bei komplexer Physik, Gesichtern in überfüllten Hintergründen, Szenen mit mehreren Personen in Grenzbereichen und der Audio-Synchronisation bei Musikinstrumenten noch zu Schwierigkeiten kommen. Für die kommerzielle Nutzung sollten die Ergebnisse vor der Veröffentlichung überprüft werden.

Bereit, HappyHorse 1.1 zu testen?

Nutzen Sie HappyHorse 1.1, um kurze KI-Videos mit flüssigeren Bewegungen, stabileren Referenzobjekten, präziserer Befehlsumsetzung und nativem Audio zu erstellen. Es eignet sich besonders für Kurzfilme, E-Commerce-Anzeigen, Markenkonzepte und Videoideen im Game-Stil.

HappyHorse 1.1 ausprobieren