阿里发布HappyHorse 1.1视频生成模型：告别角色变脸、动作卡顿--快科技--科技改变未来

正文内容 评论（0）

阿里发布HappyHorse 1.1视频生成模型：告别角色变脸、动作卡顿

2026-06-22 16:09:46 出处：快科技作者：建嘉编辑：建嘉评论(0)

复制

纠错

#阿里巴巴 #阿里云

快科技6月22日消息，阿里巴巴正式推出文生视频大模型HappyHorse 1.1，这是继1.0版本后规模最大的一次全面迭代，围绕动态表现、主体还原、指令理解、画面质感、音频同步五大维度完成系统性升级，新版本已同步上线HappyHorse官网、阿里云百炼、千问云平台对外开放调用。

基础生成规格与前代保持一致，单次可输出3至15秒短片，原生支持720P、1080P两种高清分辨率，兼容任意自定义宽高比例，适配短视频、广告片、短剧分镜等多元创作场景。

动态表现力是本次核心优化方向，新版重构运动与时序建模逻辑，改善旧版动作迟缓、动态张力不足问题，舞蹈、打斗、流体、布料等复杂运动画面连贯度大幅提升，有效缓解行业普遍存在的动作失真、画面拖影缺陷。

主体一致性能力大幅增强，模型支持同时输入9张角色、商品参考图，强化多分镜、多素材融合理解。

生成全程稳定保留人物五官、品牌logo、产品细节，多人物连续镜头“角色变脸”问题显著减少，适配直播带货、系列广告、连续短剧批量生产需求。

指令遵循能力进一步强化，无论是简短关键词，还是包含多场景、多人物、镜头调度的长段叙事提示词，模型均可精准拆解执行，复杂分镜画面排布更稳定，叙事逻辑更完整。

画质质感完成精细化调校，大幅削弱AI生成常见的油光、过度锐化、虚假磨皮问题，完整保留皮肤毛孔、纹理褶皱等真实细节，人像、实景成片更贴近实拍质感，满足商业广告高清输出标准。

音频生成延续原生音画同步架构，区别于先出画面再后期配音的主流方案，文本、画面、音频统一序列建模，生成过程同步产出匹配口型的原声音频，支持中、英、日、韩、德、法、阿拉伯7种语言唇形对齐，无需二次调音对齐画面。

底层采用15B参数单流统一Transformer架构，搭配蒸馏去噪优化，推理效率与成本优势突出，单H100显卡即可快速输出1080P成片，适合中小创作者与企业批量商用生产。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：建嘉

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#阿里巴巴 #阿里云 #HappyHorse

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波