清华权威报告：文心一言4.0多项指标遥遥领先--快科技--科技改变未来

正文内容 评论（0）

清华权威报告：文心一言4.0多项指标遥遥领先

2024-04-23 06:56:30 出处：快科技作者：随心编辑：随心评论(0)

#百度 #文心一言

快科技4月23日消息，由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合能力评测报告》中，共涵盖了14个具有海内外影响力的模型。

在此次评测中，文心4.0的表现令人瞩目，其性能接近国际顶级模型，且与顶尖模型的差距正在逐步缩小，堪称国内领先模型。

例如，在人类对齐能力的评测中，文心4.0以卓越的表现位居国内首位。

在中文推理和中文语言的评测中，文心4.0遥遥领先，与其他模型相比，差距明显。在中文理解上，文心4.0的领先优势尤其突出，比第二名的GLM-4高出0.41分。

在语义理解的数学能力评测中，文心4.0与Claude-3并列全球第一，而GPT-4系列模型则位列第四和第五，其他模型的得分主要集中在55分左右，显著落后于领先群体。

在阅读理解能力的评测中，文心4.0超越了GPT-4 Turbo、Claude-3以及GLM-4，取得了最高的成绩。

在企业最关注的安全性评测中，文心4.0同样表现出色，力压国际一流的GPT-4系列模型和Claude-3，获得了最高分（89.1分），而Claude-3仅位列第四。

数据还显示，自去年3月16日文心一言首次亮相以来，用户数量已经突破了2亿，每天的API调用量也超过了2亿次。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：随心

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#百度 #文心一言 #文心大模型

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波