终于！清华团队的ChatGPT发布：国人用起来相当友好--快科技--科技改变未来

正文内容 评论（0）

终于！清华团队的ChatGPT发布：国人用起来相当友好

2023-03-20 14:57:30 出处：量子位作者：丰色编辑：万南评论(0)

#清华大学 #ChatGPT

终于，清华大学唐杰团队也出手了。

就在GPT4发布的同一天，唐教授在微博宣布：

基于千亿参数大模型的对话机器人ChatGLM，现在开启邀请制内测。

据介绍，ChatGLM专门针对中文进行了优化，可以说是国人友好～

看起来，写博客提纲、创作剧本、解数学题、写代码，甚至是扮演高冷御姐，它都拿捏的死死的：

△ 写介绍ChatGLM的博客提纲

△ Cosplay聊天扮演高冷御姐

量子位有幸拿到了内测名额，将在后文进行一波实测。

与此同时，还有另一个消息宣布：

唐杰团队为了与社区一起更好地推动大模型技术的发展，同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署，有一块2080Ti就行。

一起来看看。

能写文言文致辞，知道何恺明最新动态，但……

先看ChatGLM，它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM（全称qa-glm-v0.7）。

浅试一下效果。

首先，我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构，和擅长中文的特点。

那么，就让它用文言文写个致谢词叭。

咋说，虽然多了一个“余”、出现了一个莫名其妙的繁体字，但读着还可以，用的排比句增强了气势。

接着，我们把前几日硅谷暴雷的文章开头丢给它，让它起个标题。

感觉还不错，起码抓住了几个关键信息。

不幸的是，论文挑战没有通过，我们把GLM-130B的链接扔给它，让它简要概括一下主题时，它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼（手动狗头）。

接下来，考考它的数学能力吧。

这道小学应用题没问题：

不过鸡兔同笼，就难倒它了，最后居然还算出了负数==

编程方面，也可以解决简单的算法题。

归纳信息能力呢？我们给了一段英文需求，不难：

结果正确：

需要注意的是，目前ChatGLM每轮对话最多只可以进行5个来回，每次最多输入1000字。

它对新信息的掌握度不错，知道推特现在的CEO是马斯克，也知道何恺明3月10日回归学界的事情，但还没发现GPT-4已经发布了。

以及，目前响应速度还是非常快的，无论什么问题，回答得对不对，基本几秒内就能给出答案。

最后，量子位也让它来了个cosplay，看看哄女朋友的本事如何：

emmm，虽然有点板正，但听完这段话“我”的气确实消了。

那么，以上就是我们的测试结果，各位觉得如何？

基于1300亿参数的基座模型打造

据官方介绍，ChatGLM参考了ChatGPT的设计思路，在千亿基座模型GLM-130B中注入了代码预训练，通过有监督微调等技术来实现人类意图对齐（就是让机器的回答符合人类价值观、人类期望）。

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型，参数1300亿，去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构，GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括：

在Stanford报告的30个世界主流大模型评测中，GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩：

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平，鲁棒性和校准误差在所有千亿规模的基座大模型（作为公平对比，只对比无指令提示微调模型）中也可圈可点。

而就在CCF最近的一场会议上，有现场观众提问：ChatGPT为什么没有诞生在中国？是我们没有关注这件事吗？

嘉宾就把GLM-130B搬了出来（它也入选了ICLR’23）。

现在，GLM-130B也终于被派上了“大用场”。

关于内测，唐杰团队表示，后续会逐步扩大范围，有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM，唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

△ GitHub已经揽获近2k标星

ChatGLM-6B使用与ChatGLM相同的技术，初具中文问答和对话功能。

特点如下：

当然，缺点就是容量只有60亿，其模型记忆和语言能力较弱，不擅长逻辑类问题（如数学、编程），以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛，在单张2080Ti上就能进行推理使用，硬件需求不高。

因此，只要有兴趣都可以下载下来试试，进行研究和（非商用的）应用开发都可以。

责任编辑：万南

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#清华大学 #ChatGPT #人工智能

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波