正文内容 评论(0

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
2025-05-30 17:12:13  作者:cici 编辑:cici     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

来自SuperCLUE

报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:子莹

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快科技

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...