阿里通义千问发布小尺寸模型Qwen3-4B：超越GPT4.1-Nano 手机也能跑--快科技--科技改变未来

正文内容 评论（0）

阿里通义千问发布小尺寸模型Qwen3-4B：超越GPT4.1-Nano 手机也能跑

2025-08-07 10:37:11 出处：快科技作者：拾柒编辑：拾柒评论(0)

复制

纠错

#阿里巴巴 #通义千问

快科技8月7日消息，今日，阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社区、HuggingFace正式开源。

据介绍，在非推理领域，Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。

在推理领域，Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B（thinking）。

官方表示，2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。

以下为模型核心亮点

Qwen3-4B-Instruct-2507

通用能力均大幅提升，超越商业闭源的小尺寸模型GPT-4.1-nano，与中等规模的Qwen3-30B-A3B（non-thinking）性能接近。

新模型覆盖更多语言的长尾知识，在主观和开放性任务中增强了人类偏好对齐，可提供更符合人们需求的答复。

上下文理解扩展至256K，小模型也能处理长文本。

Qwen3-4B-Thinking-2507

推理能力大幅增强，AIME25高达81.3分，Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。

特别是在聚焦数学能力的AIME25测评中，以4B参数量斩获81.3分成绩。

Agent分数爆表，相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。

256K tokens上下文的理解能力，支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：拾柒

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#阿里巴巴 #通义千问 #大模型

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波