GPT-4学会“自我反思”：测试表现提升达30%--快科技--科技改变未来

正文内容 评论（0）

GPT-4学会“自我反思”：测试表现提升达30%

2023-04-04 14:31:20 出处：快科技作者：乃河编辑：乃河评论(0)

#GPT-4 #人工智能

早些时候，OpenAI正式对外展示了GPT-4多模态模型，展示了它相较此前GPT-3.5强大的性能。

但事实上，从近日放出的信息来看，GPT-4最为强大的并不是它诞生时的能力，而是它能够像人类一样“自我反思”。

根据研究人员Noah Shinn和Ashwin Gopinath在论文中的表述，他们开发了一种新的技术，能够让AI模拟人类的自我反思，并评估自己的表现。

这使得GPT-4 在完成各种测试的时候，会增加一些额外的步骤，让它能够自己设计测试来检查自己的答案，找出错误和不足之处，然后根据发现来修改自己的解决方案。

团队目前已经使用该技术对GPT-4进行了多种不同的性能测试。

在HumanEval测试中，GPT-4需要解决164个从未见过的Python编程问题，原本准确率为67%，使用反思技术后，准确率提升到了88%。

在 Alfworld测试中，GPT-4则需要在各种不同的交互环境中，通过执行一些允许的操作，来做出决策和解决多步任务；使用反思技术后，AI的准确率从73% 提高到97%，只有4个任务失败。

总体来看，基于这一技术，GPT-4在高难度的测试中能够取得明显进步，提升达到了30%左右。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：乃河

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#GPT-4 #人工智能 #AI

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波