正文内容 评论(0)
三、技术介绍:安培架构提升明显 N卡独门绝技DLSS和Reflex
NVIDIA GeForce RTX 3060 Ti使用的全新的Ampere GPU架构,采用了8nm工艺,在628平方毫米的芯片内部集成了280亿只晶体管,较上一代Turing架构12nm FFN工艺的754平方毫米的面积内集成的186亿晶体管,提升了83%的密度,带来可非常可观的性能提升。
同时,Ampere架构的显卡还有以下几点提升:
1、整合INT32与FP32单元
Turing的INT32单元只能做整数运算,闲置率很高。为了解决这个问题,提升INT32单元的利用率,NVIDIA改进了INT32单元,使之不仅可以运行整数运算,也能进行单精度浮点运算,相当于整合了INT32和FP32单元,因而使得以FP32单元计数的GPU流处理器数量直接翻倍,单精度浮点性能也同样翻倍。
2、将ROP单元从内存控制器中分离
传统的ROP单元被集成在内存控制器中,阉割GPU位宽会降低ROP单元数量。而Ampere构架将ROP单元变成了GPC的一部分,每个GPC含有16个ROP单元,只要GPC数量不被阉割,ROP单元数量就不会减少。
比如RTX 3070与RTX 3080一样都有6组GPC,ROP单元数量同样都是96个。
3、第二代RT Core
NVIDIA通过提升插值算法,提升了光线追踪技术在动态模糊效果下的精确度,使得Ampere构架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以达到20Giga Rays/s。
4、第三代Tensor Core
第三代Tensor Core的效率是第二代的4倍,即便Ampere构架将每个SM中的Tensor Core减半,它依然能达到Turing2倍的效能。
在NVIDIA推出Turing架构GPU的同时,也将DLSS升级到了2.3,结合RTX光追技术,更堪称绝配,兼顾高画质、高性能,很多玩家也将DLSS昵称为“大力水手”。
NVIDIA DLSS,即深度学习超级采样技术(Deep Learning Super Sampling),由GeForce RTX显卡上专用AI处理器Tensor Core提供支持。
DLSS是一个经过改进的全新深度学习神经网络,能够提高帧速率,同时生成精美、清晰的游戏图像,为玩家提供了充足的性能,有助于最大化光线追踪设置,并提高输出分辨率。
最早的DLSS 1.0,训练模型比较粗暴,只有特定优化的场景才能获得较好的体验,支持的游戏也很少,画面并不太符合玩家的预期。
随后的DLSS 2.1增加了8K分辨率,VR虚拟现实这些领域的支持,同时对游戏引擎提供了优化,可方便更多游戏开发商采用。
DLSS 2.2版本,则针对开启DLSS后画面变模糊进行了改进,特别是在运动场景下的画面清晰度,噪点等进行了优化。
现在全新推出的这个DLSS 2.3,针对玩家反馈的运动游戏元素出现的鬼影残留,现在的态画面中,高速运动物体的路径上,不再会有残影,同时对烟雾火星等粒子渲染带来了改进,减少了模糊烬和其他小型粒子效果外观的条纹现象。
在上图官网给出的《赛博朋克2077》游戏画面中,高速行驶的车辆会留下部分残影,而DLSS 2.3则可以使之消除。
这就是DLSS 2.3带来的特定之一,可帮助玩家能够更清晰的分辨出这类快速移动的物体中,对画面有着较高需求的游戏玩家,这项技术可以说帮助玩家减少了干扰因素。
在NVIDIA DLSS 2.3的加持下,玩家可获得更优质的游戏画面,同时还能大幅提升性能, NVIDIA Image Scaling的实际游戏画面效果也更佳。
还有NVIDIA Reflex技术,是随着去年GeForce RTX 30系列GPU一起推出的,借助此项技术,可让系统延迟显著降低,使玩家更容易锁定敌人,操作速度也更快。
这里所说的延迟并不是FPS,FPS只代表PC的吞吐量,而无法体现其响应速度。系统延迟包括从鼠标点击直到屏幕显示对应变化所用的全部时间。
使用NVIDIA Reflex技术,游戏引擎能够完成即时渲染,使CPU和GPU完美保持同步,从而动态减少渲染队列,使游戏能够采样鼠标在最后一刻的输入,以进一步降低系统延迟。
玩家只需GeForce GTX 900系列以上的显卡搭配支持Reflex技术的游戏即可体验到NVIDIA Reflex带来的超低延迟特性。