正文内容 评论(0

华科大发布AI大模型猴子:部分超越GPT-4
2023-12-12 19:37:55  出处:快科技 作者:随心 编辑:随心     评论(0)点击可以复制本篇文章的标题和链接

快科技12月12日消息,华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型“Monkey”。

该模型擅长图像描述和视觉问答,能够实现对世界的“观察”,对图片进行深入问答交流和精确描述。

华科大发布AI大模型猴子:部分超越GPT-4

官方介绍称,在18个数据集上的实验中,华科大Monkey模型表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、谷歌的PALM-E、阿里的Mplug-owl等。

此外,Monkey在文本密集的问答任务中显示出显著的优势,甚至在某些样本上超越了业界公认的领先者GPT-4V。

Monkey的一个显著特点是其出色的“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。

另一亮点是能够处理分辨率高达1344 x 896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍。

据悉,目前业内能处理的图片最大分辨率为448×448像素。

值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:随心

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...