腾讯混元图像3.0图生图模型发布：自研算法一句话就能P图--快科技--科技改变未来

当前位置：首页 > 资讯中心 > IT业界 > 企业动态 > 文章详情

正文内容 评论（0）

腾讯混元图像3.0图生图模型发布：自研算法一句话就能P图

2026-01-26 12:22:28 出处：快科技作者：拾柒编辑：拾柒评论(0)

#腾讯混元 #腾讯

快科技1月26日消息，今日，腾讯混元宣布，混元图像3.0图生图（HunyuanImage 3.0-Instruct）模型正式发布，支持图片编辑与多图融合。

该模型在元宝同步上线，基于该模型用户可以直接制作表情包、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制、创意图片制作等。

据介绍，混元图像3.0图生图总参数量80亿（激活参数约13亿），采用混合专家（MoE）架构，基于混元图像3.0的原生多模态架构基础模型，引入图生图的多任务数据。

通过指令微调和后训练，实现了对用户输入图像和编辑指令的深度理解与处理。

混元图像3.0图生图指令遵循效果稳定，生成的图片一致性高、真实感强、情绪表现力佳，生成速度明显提升。

模型在收到用户输入的图片和提示词后，首先会先理解图像内容本身，并基于用户的提示词进行推理。

推理出具体的需要进行编辑的区域、详细的编辑步骤以及需要保留的图像区域，形成更加详细的编辑指令，实现良好的输出效果。

据了解，混元图像3.0图生图支持多样化的图片编辑与多图融合能力，比如增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力，以及把多张照片中的人物或元素提取出来合成合照与生成新图片等。

在数据层面，混元团队通过图像、视频原始数据挖掘和专家网络合成的方式，构建了千万量级的图生图数据，覆盖80+任务，并在持续训练（CT）阶段注入这些数据，使模型掌握基础编辑功能。

同时，混元团队进一步针对图生图数据构造了思维链，让模型学会先分析用户图像和意图，输出更加详细的编辑指令提升编辑效果。

后训练阶段，混元图像3.0图生图采用自研MixGRPO算法，结合奖励模型多轮迭代，高效对齐用户偏好，大幅提升指令响应和非编辑区域保持一致的效果。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：拾柒

文章内容举报

相关资讯

支持打赏
支持0人
反对
打赏

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#腾讯混元 #腾讯 #大模型

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

关于我们
关于我们
隐私权说明

交流合作
加入我们
意见反馈
广告刊例

关注我们
微信公众号：
微博号：快科技官方
QQ群：53467377

安卓客户端下载
IOS客户端下载

APP下载

手机扫码下载

支持Android/iOS/iPad
投稿
纠错

线索爆料

爆料群

爆料1群

打开微信扫一扫
扫描入群，加入爆料
意见反馈
评论
返回顶部