如果说这半年来,当红炸子鸡是哪一位。
那 AI 生成内容说第二,恐怕也没有人敢说一。
虽说热度一直没停过,但是这几天感觉,看 AI 们乱杀,完全不如看它翻车来得有意思。
比如下面这种认人成狗的乌龙。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S1ab5a88b-5115-4861-b676-845dc6316d53.png)
又或者是这种莫名其妙直接让人头脚倒置的。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S83deb11c-a634-42d9-a8fe-5b6bcd9f2356.png)
甚至互联网上还出现了一大批带着 AI 生成的图,想替兄弟讨回公道的网友们。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S3c10fddf-21e4-49f6-a788-ec7be660df0b.png)
连无穷小亮都中招了,在自己的微博声讨 AI 。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sa5557f0c-4e0b-4510-b761-8470b0811e9a.png)
不过,AI 犯傻也不是一天两天了,自 从 DALL·E 带头的这批绘画模型出现后,各种段子就没停过。
比如因为喂的素材不够多,一旦涉及了知识盲区,AI 就开始不懂装懂,原地乱画。
画出来的筷子,怎么看都觉得手里那个,更像我奶奶的锅刷。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/bf039450-f7fe-45fb-8f4e-a34e740566c8.png)
输入的描述词如果有点抽象的话,AI 甚至会画出一些有点冒犯性的照片。
比如非常经典的 “ 鲑鱼回流 ” 图,是鲑鱼看了要喊律师的水平。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S08a7f109-4357-4273-a8c3-0712199cbc49.png)
结果,这AI 绘画的热度还没降下来,AI 聊天就又来了。
左手边的同事在玩 Stable Diffusion ,右手边的人就在和 chatGPT 聊天。
这款AI 聊天应用上线的时候,火到连马斯克都在调侃,人们陷入了一个 GPT 的循环里面。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sdec3b1e2-3592-47d7-9f92-f8a5805a60da.png)
自己还没体验上呢,各种网友调戏AI 聊天的段子又横空出世了。
比如给AI 出脑筋急转弯,结果当然是一头撞到了墙上。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sc41c8a66-556f-47b6-8f54-31901e3acb9b.png)
又或者是用中国人的经典小学数学题,考验对方。
虽然 AI 答题态度很好,试卷题目都写满了,但是没一个答案是对的。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/9a6b6143-5aba-468b-addd-a9e2662c299b.png)
不过啊,玩归玩,闹归闹,但 AI 要是认真起来,实力早已经相当可怕了。
虽然 chatGPT 做不来脑经急转弯,但是它可以快速找出一段代码中的 bug ,并且完成代码修复。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/c656c214-0f4a-4d84-abf7-b7837814a928.png)
而偶尔犯傻的 AI 绘画,如果调试得好,它甚至能帮你做出一张足以拿奖的作品。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S8ffc229a-8dc0-4859-affd-34686900bc1e.png)
国外甚至已经有人用chatGPT 和其他AI 绘画软件,创作了一本儿童读物《 Alice and Sparkle 》。
目前,已经上架了亚马逊。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/fa2e5ec0-d4e0-4b10-bb3a-20a818f5aa28.jpg)
玩梗归玩梗,但 AI 的潜力网友们早就心知肚明。
像老美做的 chatGPT 这类AI 应用,国内其实也早就有企业悄咪咪在跟进做了,比如抖音、意间之类的。
这条赛道上,甚至还有一个你完全想不到的参赛选手,就是靠游戏起家的互联网出海巨头——昆仑万维。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sfd76ed6e-e720-4336-b6ae-fe128e47337d.png)
说实话,虽然它是以游戏起家的公司,但是第一时间想到的已经不是游戏业务,而是它在全球范围的各种业务和投资。
比如想要做浏览器,但是大部分浏览器市场都被谷歌牢牢地坐在屁股下面。
于是,昆仑想到了收购没落的 Opera 浏览器,带着它从非洲这个互联网增速最快的新市场入手,把这个没落的浏览器,扶上了非洲第二大浏览器的位置。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S00dd93a9-a475-478e-9b22-31939815e57b.png)
再比如虽然也搞社交聊天,但是却投资了同性交友软件 Grindr 。因为群体的高消费属性,直接给企业带来 29.5亿的收益。。。
而这一次,昆仑万维早在 2020 年就瞄准了 AI 这个炙手可热的香饽饽。
虽然老本行靠游戏发家,但是昆仑做起 AI 项目来,也毫不马虎。前面咱们聊过的绘画和聊天模型,昆仑万维全都有布局。
废话不多说了,练家子还得拿出真本事来,咱们直接上手体验一下。
先是昆仑万维用现在最火的AI 绘画模型 Stable Diffusion ,做的一个支持中英文双语的AI 绘画模型——天工巧绘 SkyPaint 。
天工巧绘这个模型目前可以在小程序上体验它的实力,小程序界面非常简单,输入描述词后,就可以一键生成画作。而输入之后,程序都会一次性生成四张图片。
体验了一下,基本上所有图片都能在 10 秒之内生成。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S908161af-c0b3-4438-8a68-70f73a202c64.png)
世超先用兄弟小黑胖试了一下,输入了:“ 一个丰富细节的小黑胖 ”。
结果,小黑胖这么挫的名字,居然获得了一张这么细致的生成图。
甚至连裤子和手部的纹理细节,都渲染出来了。
说实话,才 10 秒不到就能做出这么细致的图片,确实是超乎预期。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S939fcf6f-a3a8-4844-943b-6f303e8971da.png)
但是,光用这些普通的描述词有啥意思,不如给 AI 搞点抽象的东西,考验一下。
于是,世超尝试了一句陆游《 十一月四日风雨大作 》里的名句—— “ 铁马冰河入梦来 ” 。
结果,天工巧绘真的画出了一只踏着云霞,毛发飘逸的铁青色马匹。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S7280a8f1-b52f-4615-adad-fb080007524e.png)
不服输的世超又用更抽象的 “ 灯火阑珊处 ” 试验了一下,结果也是非常惊喜。
甚至,世超从这一句中文古诗词的生成结果里,感觉到了一些赛博朋克的味道。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/474f83c1-ea1c-4b7c-be62-0bce297ecfd3.jpg)
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/e332907d-d1b5-4fde-b39b-051bfbbfbf41.jpg)
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/a0e70215-4fb8-400c-acec-d8d2d4c0b235.jpg)
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/89d9ed17-a271-4c17-a176-90c03b744158.jpg)
可能有小伙伴发现了,世超从头到尾用的都是中文。甚至,后来使用的古诗词,天工巧绘都能很精准地读懂我的意思。
其实说到 AI 绘画,想要说一个容易被人遗忘的关键词输入。
所有人都盯着最后生成的图片看,但是,却忘记了 AI 绘画的第一步其实是文本输入。
比如你想获得这样一张充满现代感,并且风格强烈的图片。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S33c28397-8964-41cb-a0d9-00ac57b4e02f.png)
那你可能得输入长达七行的关键词,才能获得一张满意的作品。。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S848468a2-9e51-42e2-9932-a79af0b4fd4b.png)
因此关键词还被做成了一门暴利的生意,一家叫 PromptBase 的公司,主就是专门售卖 “ 关键词 ” 。
一个关键词,能卖到 1.99 美元的价格。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S8bf925c6-757d-4cb7-8908-1d1d0ed4988b.png)
说实话,匮乏的英文储备,每次都限制了发挥,用的时候,还得在旁边挂一个谷歌翻译。
这不,为了方便中文用户使用,昆仑万维直接做了一套中文文本模型。
虽然咱看着好像没啥难度,不就是英译中吗。但是,这项目一开启,就是一个止不住的投资无底洞了。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/aeb7ed75-5fff-49c5-98e6-5ed7241cb8f9.jpg)
首先中文是一种信息密度更高的多维语言,简单来说,就是表达的意思会比英文更复杂。
这个前提下,要想做中文模型,就得花大量精力做语料清洗和中文语义的理解。
为了提高 AI 的准确性,昆仑用了一种 “ 回报机制 ” 来训练这个模型,简单说就是给模型做的试卷打分。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S5708d434-b6b5-487b-9e93-cdfe5a29e1c9.png)
给模型出一百道题,最后工程师们给 AI 提交的答案挨个评分。
通过这种方式,给 AI 做一对一语文辅导,慢慢提成绩。
这看似容易的英译中服务,其实非常烧钱。
昆仑万维为了做这块,光是加速卡就有两百多张,仅仅是硬件支出就得近千万,而这还不算人力成本投入。模型每个月的训练成本,又固定是上百万。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/643c0279-ee95-451d-924f-61fc3a873dc3.jpg)
烧了这么多钱后,他们才慢慢把这套大语言模型打磨出来,用最少的人力,获得了很好的效果。
也是依靠着它,天工巧绘才能够很好地理解世超输入的中文语义。
依托这套中文模型,昆仑万维也用 GPT3 做了一套 AI 文本模型——瑶光。
除了基本的聊天回答、摘要、续写之类的功能,还有很多针对中国人的各种传统技能,比如对对联,古诗词之类的。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S29c9cd5c-e620-460b-846e-ca6e2902a6d8.png)
看到这,可能很多人会觉得疑惑了,为啥昆仑万维作为一家互联网平台出海企业,却看似 “ 不务正业 ” 地花这么多力气,来搞这个全新的业务呢?
其实,上面咱们聊的那么多东西,有个总称,也就是 AIGC 。说白了,就是让 AI 来提供和创造内容。
所以 AI 的用途,可远不止开头那些玩梗这么简单的。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S25ec9888-b73e-4582-89f6-57fe42cca68c.png)
虽然一开始,大家对AI 还都嗤之以鼻,早几年听过最多的词就是:人工智障。
包括 2019 年李开复在《 人工智能 》里说的,也只觉得 AI 最多,就只能够代替人们五秒钟的工作,比如人脸识别、淘宝客服回复的水平。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Se67cb447-4866-4a0c-a92b-7ba63fd1fe32.png)
但是,慢慢地所有人都发现事情不简单了。
尤其是身处 2022 年年末的我们,被 AI 轰炸了一整年,眼看着 AI 绘画从 DALL E 到 Stable Diffusion ,AI 聊天从续写到及时应答。
当年的 DALL·E ▼
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/45aa88e4-8ed5-4594-8291-a8c175f6fdbe.png)
照这个势头下去,AI 似乎真的要奔着超越人类去了?
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S580ad63f-d523-4c29-b803-2f9f169e3fc3.png)
虽然还不至于到取代人类的地步,但是 AIGC 对我们生活的改变,很有可能有18 世纪时,人们跨入蒸汽时代那么大。
只不过,这一次负责驱动的,是一个看不见、摸不着的计算程序。
AI 给人们带来的不是失业,而是人与机器共存、协作完成各类工作的全新时代。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S75eda7cc-189d-4a7f-bda6-c1ea2ee4b969.png)
昆仑万维的所有布局,就是为了迎接这个时代。
就在昨天,昆仑万维召开了一场线上发布会,宣布把覆盖绘画、文本、编程三大块的 AIGC 模型,正式地开源发布。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S5f63c38e-7421-47bd-87cf-10c3c7047151.png)
这就意味着利用昆仑万维的算法与模型,作为应用开发的底层基石,所有人都可以自由地搭建自己需要的垂类应用。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/S9d3a5433-7b00-4432-a613-cadaead11678.png)
昆仑万维会选择把耗费数千万的模型,对外开放的原因,一方面当然是希望通过更多人的参与,让昆仑天工有更多的应用可能性和创新性。
像完全开源的 Stable Diffusion ,网上就有各种各样地围绕它的创意版本。
网友魔改的宝可梦版 ▼
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sde570ba4-1b6e-4e78-8d89-9d9575ae062c.png)
而另一方面,一项技术进步,只有给普通人带来便携,才具有正面的社会意义。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Se9f1032d-51fa-46ca-bcf2-f7fd44dbf115.png)
尤其是当技术都掌握在头部手里,算法的成本只会水涨船高。技术壁垒的高墙,就这样慢慢地越砌越高。
最后,个人开发者或者是小企业,就被会高成本拦在门外。
但是,昆仑万维觉得技术不应该只属于头部。所以,他们打从一开始,就是冲着对外开源这个方向去的。
通过模型开源,降低行业门槛和开发成本。而且,开发中文大语言模型作为支撑,更好地配合中文使用者的习惯。让更多的个人开发者或者是中小厂,也可以搭上AIGC 这辆高效的马车。
已经落地了的昆仑 AI 音乐就是很好的例子。
昆仑万维有一个叫 starmaker 的音乐 K 歌软件。
可能你会有点陌生,因为它主要是面向的是海外用户,在南亚东南亚、中东南美洲地区的活跃用户已超过 5000 万。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Sb6cad56f-ba88-4d4b-a03d-8650832b2854.png)
昆仑根据 starmaker 开发了各种音乐类的游戏。对于音乐类游戏或者应用来说,歌曲库的丰富程度,肯定是执掌大局的关键。
但是,一首曲子的制作成本费用,最便宜也大概在三万多左右。。
![谁说AI只会画画、聊天?它可能要打破一切](/img/20221217/Se2cdd489-144a-45f1-98e0-24b4cf29528c.png)
有了自己的AI 音乐实验室 MusicX Lab 之后,他们利用 AI 就能快速玩出各种想要的音乐风格。
最近,昆仑做了款音乐游戏,里面有接近两百多首的音乐,全都是来自这个工作室。
假设用 AI 制作只是省去一半成本,那也是减少了将近 300 万的支出。
这还仅仅只是 AI 音乐的可能性,之后 AIGC 还会深入到各种创作者的工作之中去。例如 AI 绘画以可以后帮助原画师、3D 美术师、艺术家等等进行内容创作,帮助画师们打开想象。
就算是普通的用户,也有使用它的可能。比如搭建一个专门做各种美甲图片的应用,美甲师们只需要动动手指,就能获得各种甲面风格。
甚至有一天,你可能会发现在文章的最后,署名不再是我,而变成了 chaping AI 。
|