最强开源大模型！阿里云开源通义千问720亿参数模型--快科技--科技改变未来

当前位置：首页 > 资讯中心 > IT业界 > 企业动态 > 文章详情

正文内容 评论（0）

最强开源大模型！阿里云开源通义千问720亿参数模型

2023-12-01 14:23:31 出处：快科技作者：随心编辑：随心评论(0)

#开源 #大模型

快科技12月1日消息，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。

据了解，该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型最优成绩，性能超越开源标杆Llama 2-70B，成为业界最强开源大模型。

不仅如此，其性能也超越了大部分商用闭源模型，在部分测评中甚至超越闭源的GPT-3.5和GPT-4。

比如，在英语任务上，Qwen-72B在MMLU基准测试取得开源模型最高分；中文任务上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4；数学推理方面，Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力有了质的飞跃。

此前，中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。

Qwen-72B填补了国内空白，以高性能、高可控、高性价比的优势，提供不亚于商业闭源大模型的选择。

基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI for Science等科研工作。

用户仅用一句提示词就可创建自己的AI助手

除了720亿参数模型外，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。

阿里云是国内最早开源自研大模型的科技企业，8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单，得到中小企业和个人开发者的青睐，累计下载量超过150万，催生出150多款新模型、新应用。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：随心

相关资讯

支持打赏
支持0人
反对
打赏

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#开源 #大模型 #通义千问

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

关于我们
关于我们
隐私权说明

交流合作
加入我们
意见反馈
广告刊例

关注我们
微信公众号：
微博号：快科技官方
QQ群：53467377

安卓客户端下载
IOS客户端下载

APP下载

手机扫码下载

支持Android/iOS/iPad
投稿
纠错

线索爆料

爆料群

爆料1群

打开微信扫一扫
扫描入群，加入爆料
意见反馈
评论
返回顶部