正文内容 评论(0

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机
2022-10-04 19:06:35  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

【RTX 40核心技术:光追再造巅峰、DLSS3革命性跨越】

一、光线追踪:两大新引擎加速

光线追踪,无疑是GPU历史上的一大变革,而引导这一变革的,正是NVIDIA,Ada上已经发展到了第三代,有效光追算力达到191TFlops(每秒191万亿次运算),是上一代产品的2.8倍。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

Ampere架构的第二代RT核心里,BVH加速的包围盒碰撞引擎(上图中左侧方框),执行光线-三角形碰撞(求交)检测加速的是三角形碰撞引擎(上图中右侧三角形部分)。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

Ada架构的第三代光追核心,又增加了两个新的引擎。

一是Opacity Micromap Engine,上图左下角的带树叶三角形部分。

它会评估不透明微遮盖,加速Alpha遍历,大大减轻着色器的工作量,号称光线-三角形碰撞吞吐性能、Alpha遍历性能都提升2倍。

它可以让开发人员为物体、环境加入更多细节,更方便描述不规则形状或半透明物体,比如叶子、火焰、篱笆等。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

比如面对一片叶子,以前需要对整个区域的所有三角形区域,进行同样的光线遍历操作,但不同区域是不一样的,有的整个三角形区域内都是叶子,有的完全没有,有的占一部分。

Ada架构可以对这些不同区域进行分别处理,避免重复和浪费工作量。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

在游戏中,以专门开发的《Portal RTX》为例,应用该技术后,G-Buffer缓冲填充速度可加快30%,帧率可提升30%。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

二是Micro-Mesh Engine,上图右下角的复合三角形部分。

它可以动态生成微网格,以产生额外的几何图形,在处理复杂几何物体、环境光线时,提升几何图形的丰富度,并大大降低BVH的创建时间和存储成本。

你可以把它想象成一个立体版的曲面细分(Tessellation)。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

NVIDIA举了三个例子:创建11:1的珠宝盒,需要15.3万个微网格、1100万个微三角形,BVH创建速度可加快8.5倍,存储空间缩小6.5倍。

创建14:1的珊瑚蟹,需要1.7万个微网格、160万个微三角形,BVH创建速度可加快7.6倍,存储空间缩小8.1倍。

创建28:1的陶鼎,需要17.5万个微网格、5700万个微三角形,BVH创建速度可加快超过15倍,存储空间缩小20倍。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

不止是游戏,微网格位移在内容创作中也可以大大加速,目前已经得到了Adobe、Simplygon两家企业的支持。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

说了半天,来感受下第三代光追的惊人效果,分别来自首批优化到位的《赛博朋克2077》、光追重制版《Portal RTX》、《Racer RTX》。

其中,《赛博朋克2077》可对每个像素执行635次的光追计算来确定光照,比四年前的首批光追游戏,比如39次的《战地5》,增加了多达16倍。

二、着色器执行重排序(SER):化凌乱为整齐

NVIDIA宣称,着色器执行重排序(SER)技术在GPU中的引入,堪比乱序执行技术在CPU中的引入,是GPU历史上的又一伟大创新。

这是不是吹嘘?还真不是。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

简单的说,光追需要光线面对不同物体、环境的多次反射、折射,处理强度不同的负载,着色器面对的工作量是复杂多变的,往往有的已经完成了,有的还在执行,需要等待。

SER就是通过即时重新安排着色器的负载,使之恢复均衡,从而提高执行效率,更好地利用GPU资源。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

还不明白?来看个直观的例子。

假设一组平行光线照射舞台、木墩、狗狗、墙面、天花板,第一次形成的光追负载是非常规律有顺序的,可以轻松处理。

但是光线遇到物体后向不同方向反射,第二次与物体相交,形成的光追负载就更多、更复杂、更凌乱。

SER这时候介入,按照不同类别进行二次排序,着色器就可以像第一次那样有序地处理负载了。

神之飞跃!RTX 40架构、技术、产品深度解析:价格大有玄机

按照NVIDIA的说法,SER可以为光追带来最高3倍的性能提升,整体游戏性能提升也可达25%。

还是以《赛博朋克2077》、《Portal RTX》、《Racer RTX》为例,性能可以分别提升44%、29%、20%。

责任编辑:上方文Q

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...