GPU延迟对比：AMD RDNA2完胜NVIDIA安培-AMD,NVIDIA,显卡,RDNA ——快科技(驱动之家旗下媒体)--科技改变未来

正文内容 评论（0）

GPU延迟对比：AMD RDNA2完胜NVIDIA安培

2021-04-19 19:16:22 出处：快科技作者：上方文Q 编辑：上方文Q 评论(0)

#AMD #NVIDIA

CPU缓存与内存延迟测试，相信大家都有所耳闻，但是GPU同样的测试却几乎没人做过。

Chips And Cheese就做了一次特别的测试，对比考察了AMD、NVIDIA GPU架构的缓存、显存迟问题。

首先是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼，代表是RX 6900 XT、RTX 3090，前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了Infinity Cache无限缓存，提升带宽的同时，延迟也可圈可点，二级缓存命中率上只增加了大约20ns的延迟，明显低于Ampere。

更惊人的是，RDNA2显存延迟和Ampere几乎一模一样，但是别忘了，Ampere只有两个层级的缓存，RDNA2却有四个。

Ampere的缓存架构更加传统，SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟，RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来，GA102核心面积过大，也直接增加了延迟。

这正好可以解释AMD RDNA2架构在低分辨率下性能、能效更优秀，因为二级缓存、三级缓存延迟很低，更适合执行较小的负载。Ampere则相反，高负载下优势明显，比如说4K分辨率。

说完了GPU之间的对比，那么GPU、CPU放在一起怎么样呢？这里以RX 6900 XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的，所以这里Y轴用了线性数据，可以看到全程大大低于RDNA2，搭配DDR3-1600 CL9内存延迟只有63ns，RX 6900 XT、GDDR6的组合则有226ns，另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIA GPU，包括Maxwell架构的GTX 980 Ti、Pascal架构的GTX 1080、Turing架构的RTX 2060 Mobile。

Maxwell、Pascal其实差不多，前者整体略高一些，可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子，一级缓存延迟低得多，二级差不多，奇怪的是显存延迟在32MB之后偏高，原因未知。

AMD考察了TeraScale架构的HD 5850/6950、GCN架构的HD 7970，再加上RX 6900 XT，很明显在逐代降低，而且是各级缓存都在同时进步。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：上方文Q文章纠错

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#AMD #NVIDIA #显卡 #RDNA

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波