正文内容 评论(0)
快科技2月11日消息,这个春节全网都在等DeepSeek发布最新的大模型DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。
根据DeepSeek自己的介绍,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSee V3系列也就是128K。
有了1M上下文,DeepSeek可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。
其他方面的能力是之前就有的,DeepSeek也没有提及更详细的信息。
值得注意的是,DeepSeek在回答完这个问题之后还特别加了一段,强调它就是最新的DeepSeek模型,没有特定的子名称,不是V3也不是R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是V4 Preview预览版的联想。
但是从网友的反馈来看,这次DeepSeek的小更新实际上能力提升很大,知名大模型测试博主@karminski-牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。
结论就是肉眼可见美学, 建模, 物理模拟, 代码性能都有提升, 甚至还有小惊喜,这个就是比之前发布的任何版本都SOTA,也就是当前最优的大模型(当然主要是指DS的版本)。
目前还不确定DeepSeek的这个新模型是不是完全体,因为有网友测试这两天很热门的50米距离上去洗车是走路还是开车去的问题上,DeepSeek新模型给出的回答不一,有人说正确,有人说不行。

- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...


