正文内容 评论(0

Claude Opus 4.8问世:三项全球第一
2026-05-30 19:00:32  出处:快科技 作者:随心 编辑:随心     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技5月30日消息,Anthropic在5月28日推出最新旗舰大模型Claude Opus 4.8。

根据SuperCLUE最新中文测评,这款模型在代码生成、幻觉控制、科学推理三项核心能力全部拿到全球第一。

代码生成方面,Opus 4.8拿到83.58分,领先第二名超过2分,比上一代4.7版本提升4.5分以上,软件工程相关子任务同样登顶,独立写代码和网页开发都很稳。

幻觉控制得分87.48,同样全球第一,比前代提升超过6分,AI乱编答案的情况大幅减少,回答更靠谱,专业场景用起来更放心。

科学推理拿到77.19分,也是全球第一,相比4.7版本提升近9分,理科计算、逻辑推导能力明显变强。

Claude Opus 4.8问世:三项全球第一

综合智能指数73.93分,和GPT-5.5、Gemini 3.1 Pro Preview同处第一梯队。推理速度基本持平,API价格没有变化,依旧属于高性能但性价比偏低的档位。

不过它也有小幅短板,智能体任务规划、数学推理、指令遵循略有下降,指令遵循分数下滑比较明显,日常使用影响不大。

整体来看,Opus 4.8重点强化了代码、诚实度和科学推理,对开发者、科研人员非常友好,是目前综合能力最均衡的旗舰模型之一。

Claude Opus 4.8问世:三项全球第一

【本文结束】如需转载请务必注明出处:快科技

责任编辑:随心

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...