效果媲美GPT 4o！腾讯混元开源角色定制化图像生成插件--快科技--科技改变未来

正文内容 评论（0）

效果媲美GPT 4o！腾讯混元开源角色定制化图像生成插件

2025-04-18 14:30:52 出处：快科技作者：拾柒编辑：拾柒评论(0)

复制

纠错

#混元大模型 #开源

快科技4月18日消息，今日，腾讯混元宣布开源定制化图像生成件InstantCharacter，并实现了对开源文生图模型Flux的兼容。

通过该插件，在大模型中，只需要一张图加一句话，就能让任何角色以你想要的姿势出现在任何地方。

据介绍，InstantCharacter的优势在于可以确保角色在不同场景中的一致性和真实性、画质和精度高，同时具有灵活的文本编辑性，用户可以根据需要灵活切换任意场景，让人物生成任意动作。

因此，内容创作者能通过这一插件让生成的角色保持高度一致，能够更高效地创作出符合其需求的视觉作品，可以用于连环画、影片创作等场景。

输入以下原始图片：

+ prompt ：a rabbit is in the kitchen holding a spoon and drinking soup，就能得到下面的图：

+prompt：a rabbit in the city,cyberpunk，就可以得到：

实际的测评中，开源的InstantCharacter实现的效果媲美GPT 4o等业界领先模型。

腾讯混元表示，现有基于学习的方法主要依赖于U-Net架构，但在泛化能力和图像质量上存在局限性，而基于优化的方法则需要针对特定主体进行微调，这不可避免地降低了文本可控性。

为解决这些问题，InstantCharacter利用DiT模型构建了一个创新的框架。

框架引入一个可扩展的适配器（adapter），采用多个transformer encoder，能有效处理开放域的角色特征，并与现代扩散变换器的潜在空间无缝交互，这种设计使得系统能够灵活适应不同的角色特征。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：拾柒

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#混元大模型 #开源 #腾讯

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波