腾讯混元发布语音数字人模型：仅需上传图像和音频图中主角就能说话唱歌--快科技--科技改变未来

正文内容 评论（0）

腾讯混元发布语音数字人模型：仅需上传图像和音频图中主角就能说话唱歌

2025-05-28 16:23:53 出处：快科技作者：哈尔编辑：哈尔评论(0)

复制

纠错

#混元大模型 #腾讯

快科技5月28日消息，腾讯混元发布语音数字人模型HunyuanVideo-Avatar。仅需一张图和一段音频，就能让图中的主角自然的说话、唱歌。

据悉，HunyuanVideo-Avatar由腾讯混元视频大模型及腾讯音乐天琴实验室MuseV技术联合研发。

该模型支持头肩、半身与全身景别，以及多风格、多物种与双人场景，面向视频创作者提供高一致性、高动态性的视频生成能力。

用户上传人物图像与音频，HunyuanVideo-Avatar模型就会自动理解图片与音频。让图中人物自然地说话或唱歌，生成包含自然表情、唇形同步及全身动作的视频。

当用户输入一张拿着吉他的坐在沙滩的女性图片和一段抒情音乐。

模型会自行理解“她在海边弹吉他，唱着非常抒情的歌曲”，并生成一段图中人物在弹唱的视频。

腾讯混元发布语音数字人模型：仅需上传图像和音频图中主角就能说话唱歌

目前，HunyuanVideo-Avatar适用于短视频创作、电商与广告等多种应用场景。

可以生成人物在不同场景下的说话、对话、表演等片段，快速制作产品介绍视频或多人互动广告，降低制作成本。

据介绍，HunyuanVideo-Avatar的单主体能力已经开源，并在腾讯混元官网上线，目前支持上传不超过14秒的音频进行视频生成，后续将逐步上线和开源其他能力。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：哈尔

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#混元大模型 #腾讯 #数字生命

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波