goenhance logo

HappyHorse 1.1 AI 비디오 생성기

HappyHorse 1.1은 3~15초 분량의 클립을 위한 Alibaba의 업그레이드된 멀티모달 AI 비디오 모델로, 더 부드러운 모션, 강력한 피사체 일관성, 향상된 프롬프트 이해력, 더욱 자연스러운 시각적 질감 및 네이티브 오디오-비디오 생성을 제공합니다.

HappyHorse 1.1의 주요 기능

더 강력해진 모션 및 시간적 일관성

HappyHorse 1.1은 특히 격투, 춤, 달리기, 회전, 차량 이동 및 카메라 팔로우 샷에서 모션 모델링과 프레임 간 일관성을 개선했습니다. 1.0 버전과 비교하여 슬로우 모션 느낌, 고스팅 현상 및 동작 끊김 현상을 줄였습니다.
프롬프트 예시생성된 클립
사나운 붉은 용(원소)이 바다에서 솟구쳐 올라 하늘로 날아오르며 배 위를 빠르게 선회하고 거대한 파도를 일으킵니다. 역동적인 카메라는 폭풍우를 뚫고 나가는 용을 따라가며, 거대한 너울을 넘어 멀리 사라지는 모습을 담아냅니다.

더 안정적인 다중 참조 R2V

업그레이드된 다중 참조 비디오 워크플로우는 최대 9개의 참조 이미지를 지원합니다. 이를 통해 짧은 클립 내에서 인물의 얼굴, 의상, 제품 세부 정보, 브랜드 요소 및 환경을 유지할 수 있어 이커머스 광고, 라이브 스트리밍 스타일 비디오, 제품 데모 및 캐릭터 기반 콘텐츠에 유용합니다.

더 나은 긴 프롬프트 및 장면 계획

HappyHorse 1.1은 긴 문맥 이해, 역할 관계, 장면 계획 및 카메라 언어 해석 능력을 향상시켰습니다. 누가 말하는지, 캐릭터가 어디에 서 있는지, 감정이 어떻게 변하는지, 샷 간에 카메라가 어떻게 전환되는지를 설명하는 프롬프트를 더 잘 따릅니다.
프롬프트 예시생성된 클립
외계 상인들이 빛나는 과일을 팔고, 로봇들이 어디든 돌아다니며, 떠다니는 홀로그램 광고가 공중에 가득하고, 주변에 다채로운 조명이 비치는 다른 행성의 번화한 미래형 시장을 영화 같은 핸드헬드 카메라 스타일로 담아내세요.

더 자연스러운 시각적 질감

이 모델은 더 사실적인 피부 질감, 얼굴 세부 묘사, 머리카락 렌더링, 조명, 그림자 및 로컬 안정성을 위해 튜닝되었습니다. 일부 1.0 출력물에서 보이던 기름지거나 과하게 처리된 느낌을 줄이면서 인물 사진과 단편 드라마 영상의 자연스러움을 유지합니다.

네이티브 오디오-비디오 생성

HappyHorse는 단순히 나중에 소리를 추가하는 것이 아니라 오디오와 비디오를 함께 생성합니다. 1.1 버전은 음성 리듬, 일시 정지, 감정 톤, 배경 음악, 주변 소음 및 시청각 동기화를 개선했지만, 악기 연주 장면은 여전히 수동 검토가 필요할 수 있습니다.

HappyHorse 1.1 파라미터

파라미터참고
출시일2026년 6월 22일Alibaba의 업그레이드된 HappyHorse 비디오 생성 모델로 공식 출시되었습니다.
모델 크기150억 파라미터150억 개의 파라미터를 가진 멀티모달 비디오 생성 모델입니다.
아키텍처통합 멀티모달 Transfusion / 단일 스트림 Transformer텍스트, 이미지, 비디오 및 오디오 토큰을 별도의 모듈 결합 방식이 아닌 하나의 모델에서 처리합니다.
Transformer 깊이40개 레이어통합된 40개 레이어의 Transformer 아키텍처로 보고되었습니다.
생성 모드텍스트-비디오, 이미지-비디오, 참조-비디오, 비디오 편집텍스트 프롬프트, 정지 이미지 애니메이션, 다중 참조 비디오 생성 및 비디오 편집 시나리오를 지원합니다.
길이3~15초단일 생성 클립으로 숏폼 비디오 길이를 지원합니다.
해상도720p / 1080pHD 및 풀 HD 생성을 모두 지원합니다.
프레임 속도24fps영화 같은 숏폼 클립에 적합합니다.
화면 비율사용자 지정 / 유연함가로, 세로, 정사각형 및 기타 창의적인 형식에 맞는 유연한 출력 비율을 지원합니다.
참조 이미지최대 9개 이미지캐릭터, 제품, 의상, 장면 및 브랜드 요소를 고정하는 데 유용합니다.
오디오지원됨대사, 주변음, 음악 및 효과음을 포함한 오디오가 포함된 비디오를 출력합니다.
디노이징DMD-2 증류, 8단계 디노이징생성 단계를 줄이고 효율성을 향상시킵니다.
CFG제거됨효율성 향상을 위해 Classifier-free guidance가 제거되었습니다.
추론 속도NVIDIA H100 1대 기준 5초 분량의 1080p 영상 생성 시 약 38초 소요짧은 1080p 영상 생성에 대한 벤치마크 결과입니다.
720p 가격정가 0.9 위안/초, 프로모션가 최저 0.54 위안/초프로모션 가격은 플랫폼 및 캠페인에 따라 달라질 수 있습니다.
1080p 가격정가 1.2 위안/초, 프로모션가 최저 0.72 위안/초1080p 정가는 HappyHorse 1.0의 1.6 위안/초 대비 25% 인하되었습니다.

HappyHorse 1.1 활용 사례

이커머스 제품 및 라이브 커머스 영상

여러 장의 참조 이미지를 사용하여 모델, 제품, 의상, 라이브 스트리밍 스타일의 공간을 하나의 짧은 광고 영상으로 결합하세요. 제품 색상, 패키징, 립스틱 색상, 의류 또는 브랜드 세부 정보를 대략적인 수준이 아닌 정확하게 일관되게 유지해야 할 때 유용합니다.

숏폼 드라마, 브랜드 스토리 및 게임 CG 콘셉트

HappyHorse 1.1은 동작 연속성, 긴 프롬프트 계획, 카메라 언어 이해 및 자연스러운 얼굴 질감이 개선되어 감성적인 대화, 다중 샷 실내 장면, 액션 시퀀스, 영화 같은 브랜드 티저 및 스타일리시한 게임 CG 콘셉트에 더 적합합니다.

X에서의 HappyHorse 1.1

HappyHorse 1.1 자주 묻는 질문

HappyHorse 1.1이란 무엇인가요?

HappyHorse 1.1은 숏폼 영상을 위한 Alibaba의 업그레이드된 AI 영상 생성 모델입니다. 더 부드러운 움직임, 더 강력한 피사체 일관성, 향상된 프롬프트 준수, 더 자연스러운 이미지 품질 및 개선된 오디오-비디오 동기화에 중점을 둡니다.

HappyHorse 1.1은 어떤 생성 모드를 지원하나요?

AI 숏폼 영상 제작을 위한 텍스트-투-비디오, 이미지-투-비디오, 다중 참조 이미지-투-비디오 및 영상 편집 워크플로우를 지원합니다.

HappyHorse 1.1 영상은 얼마나 길게 만들 수 있나요?

단일 생성 클립은 3초에서 15초까지 지원하며, 이는 짧은 광고, 소셜 영상, 캐릭터 클립, 제품 데모 및 숏폼 드라마 샷에 적합합니다.

어떤 해상도가 지원되나요?

HappyHorse 1.1은 720p 및 1080p 생성을 지원하며, 다양한 콘텐츠 형식에 맞춰 유연한 화면 비율을 제공합니다.

HappyHorse 1.1은 몇 개의 참조 이미지를 사용할 수 있나요?

다중 참조 워크플로우는 최대 9개의 참조 이미지를 지원하여 모델이 캐릭터 얼굴, 의상, 제품, 장면 및 브랜드 요소를 유지하도록 돕습니다.

HappyHorse 1.1은 HappyHorse 1.0과 어떻게 다른가요?

버전 1.1은 전반적인 기술 방향은 유지하면서 동작 연속성, 다중 참조 피사체 고정, 복잡한 프롬프트 이해, 시각적 질감 및 오디오 표현을 개선했습니다. 또한 1.0 대비 1080p 정가를 낮췄습니다.

HappyHorse 1.1은 오디오를 생성하나요?

네. HappyHorse 1.1은 비디오와 함께 음성, 주변음, 음악 및 음향 효과를 생성할 수 있습니다.

주요 제한 사항은 무엇인가요?

복잡한 물리 효과, 배경의 많은 인물, 예외적인 다중 피사체 장면, 악기 연주 오디오 동기화 등에서는 여전히 어려움을 겪을 수 있습니다. 상업적 용도로 사용할 경우, 게시 전 결과물을 검토해야 합니다.

HappyHorse 1.1을 테스트할 준비가 되셨나요?

HappyHorse 1.1을 사용하여 더 부드러운 동작, 더 안정적인 참조 피사체, 강력한 프롬프트 준수 및 기본 오디오가 포함된 짧은 AI 비디오를 제작해 보세요. 단편 드라마, 이커머스 광고, 브랜드 콘셉트 및 게임 스타일의 비디오 아이디어에 특히 유용합니다.

HappyHorse 1.1 사용해 보기