正文内容 评论(0

阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑
2025-08-07 10:37:11  出处:快科技 作者:拾柒 编辑:拾柒     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技8月7日消息,今日,阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社区、HuggingFace正式开源。

据介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。

在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。

官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。

阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑

以下为模型核心亮点

Qwen3-4B-Instruct-2507

通用能力均大幅提升,超越商业闭源的小尺寸模型GPT-4.1-nano,与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。

新模型覆盖更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。

上下文理解扩展至256K,小模型也能处理长文本。

Qwen3-4B-Thinking-2507 

推理能力大幅增强,AIME25高达81.3分,Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。

特别是在聚焦数学能力的AIME25测评中,以4B参数量斩获81.3分成绩。

Agent分数爆表,相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。

256K tokens上下文的理解能力,支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑

阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑

阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...