11月中文大模型基准测评出炉：GPT 5.1夺冠、DeepSeek开源第一--快科技--科技改变未来

正文内容 评论（0）

11月中文大模型基准测评出炉：GPT 5.1夺冠、DeepSeek开源第一

2025-11-28 20:45:32 出处：快科技作者：随心编辑：随心评论(0)

复制

纠错

#DeepSeek #GPT-5.1

快科技11月28日消息，SuperCLUE公布了2025年11月中文大模型基准测评结果。

本次测评围绕数学推理、科学推理、代码生成（含web开发）、幻觉控制、精确指令遵循五大核心任务展开，题目总量为822道新题，最终得分取各任务平均分。

本次共测评27个国内外大模型同台竞技，OpenAI的GPT 5.1与国产模型DeepSeek分别斩获综合冠军与开源领域第一。

OpenAI的GPT-5.1 (high) 以68.11的总分登顶，成为本月综合表现最佳的大模型。

GPT-5.1 在数学推理（74.07）、代码生成（76.30）等项表现突出，幻觉控制得分 88.80，展现出强稳定性。

Anthropic的Claude-Opus-4.5-Reasoning以62.57分紧随其后，其幻觉控制得分高达90.33，在该项能力上领跑。

而在开源模型中，深度求索的 DeepSeek-V3.2-Exp-Thinking以53.69分位列开源阵营第一。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：随心

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#DeepSeek #GPT-5.1 #大模型

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波