正文内容 评论(0

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图
2026-01-26 12:22:28  出处:快科技 作者:拾柒 编辑:拾柒     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技1月26日消息,今日,腾讯混元宣布,混元图像3.0图生图(HunyuanImage 3.0-Instruct)模型正式发布,支持图片编辑与多图融合。

该模型在元宝同步上线,基于该模型用户可以直接制作表情包、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制、创意图片制作等。

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

据介绍,混元图像3.0图生图总参数量80亿(激活参数约13亿),采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,引入图生图的多任务数据。

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

通过指令微调和后训练,实现了对用户输入图像和编辑指令的深度理解与处理。

混元图像3.0图生图指令遵循效果稳定,生成的图片一致性高、真实感强、情绪表现力佳,生成速度明显提升。

模型在收到用户输入的图片和提示词后,首先会先理解图像内容本身,并基于用户的提示词进行推理。

推理出具体的需要进行编辑的区域、详细的编辑步骤以及需要保留的图像区域,形成更加详细的编辑指令,实现良好的输出效果。

据了解,混元图像3.0图生图支持多样化的图片编辑与多图融合能力,比如增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力,以及把多张照片中的人物或元素提取出来合成合照与生成新图片等。

在数据层面,混元团队通过图像、视频原始数据挖掘和专家网络合成的方式,构建了千万量级的图生图数据,覆盖80+任务,并在持续训练(CT)阶段注入这些数据,使模型掌握基础编辑功能。

同时,混元团队进一步针对图生图数据构造了思维链,让模型学会先分析用户图像和意图,输出更加详细的编辑指令提升编辑效果。

后训练阶段,混元图像3.0图生图采用自研MixGRPO算法,结合奖励模型多轮迭代,高效对齐用户偏好,大幅提升指令响应和非编辑区域保持一致的效果。

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

腾讯混元图像3.0图生图模型发布:自研算法 一句话就能P图

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...