正文内容 评论(0)
快科技4月15日消息,阿里ATH旗下创新事业部研发的视频生成模型HappyHorse-1.0,近日已悄然在Arena.ai平台上线开放测试,目前正处于正式发布前的最后优化阶段。
官方表示,早期评测结果显示该模型在视频编辑任务中表现突出,目前已进入发布前的最后优化阶段,预计将在两周后正式推出版本更新。
经阿里内部消息确认,该模型将于4月30日开放API。目前已向社区开放早期体验入口,邀请用户参与测试与反馈。
上周,该模型突然以匿名身份空降全球权威AI平台Artificial Analysis Video Arena的盲测榜单,在文生视频和图生视频(无音频)两个赛道同时压过字节跳动Seedance 2.0和快手可灵3.0,强势登顶。
该模型采用150亿参数的40层单流自注意力Transformer架构,实现了原生音视频同步生成。
简单来说,其他视频模型需要先生成无声视频,再配乐对口型,几道工序下来,不仅费时费力,还容易出错。
而快乐马把视频和音频的生成彻底合并进了一个流程,画面和声音是一起出来,一次前向推理直接输出带声音的成片,不需要任何后期拼接。
此外,该模型还原生支持英语、普通话、粤语、日语、韩语、德语和法语七种语言的唇形同步。

- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
