正文内容 评论(0

又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十
2024-09-29 15:07:39  作者:梦佳 编辑:梦佳     评论(0)点击可以复制本篇文章的标题和链接

9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九,是得分最高的开源大模型。

同一时间,全球开源社区基于Qwen系列二次开发的衍生模型数量突破7.43万,超越Llama系列衍生模型的7.28万。通义千问Qwen成长为世界最大的生成式语言模型族群,在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。

不论是模型性能还是生态影响力,Qwen都创造了中国开源大模型的历史。

又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十

Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十

Chatbot Arena是由开放研究机构LMSYS Org推出的大模型性能测试平台,自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。

9月19日发布的Qwen2.5迅速进榜,旗舰模型Qwen2.5-72B-Instruct得分位列LLM榜单第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中国大模型;同天开源的视觉语言模型Qwen2-VL-72B-Instruct闯入Vision榜单第九,略逊于GPT-4o、Gemini-1.5-Pro等闭源模型,是成绩最好的开源模型。此前Qwen系列已有多款开源模型闯入Chatbot Arena榜单。

又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十

Chatbot Arena官方发文,Qwen2-VL-72B-Instruct是排名最高的开源视觉语言模型

Qwen2.5的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放AI”;有用户测评发现Qwen2.5从0.5B到72B都是SOTA水平,于是发起话题:“大家都用Qwen2.5替换了那些常用模型?”

又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十

又创新高 阿里通义开源模型Qwen2.5进入大模型盲测全球前十

海外开源社区盛赞Qwen2.5

【本文结束】如需转载请务必注明出处:快科技

责任编辑:梦佳

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#阿里

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...