想用好GTX 680 请准备好i7-3960X--快科技--科技改变未来

正文内容 评论（0）

想用好GTX 680 请准备好i7-3960X

2012-04-18 08:44:26 出处：快科技编辑：鲲鹏评论(0)

你的GTX 680真的火力全开了吗？

基于Kepler构架的NVIDIA新旗舰Geforce GTX 680已经发布近一个月了，这款比竞争对手更小更凉更便宜却又更快的新一代旗舰一经发布便掀起了一场轩然大波。所有人都在问同样的一个问题——为什么？为什么Kepler会表现得如此之快？为什么更少的晶体管和更小的规模可以带来更高的性能？为什么Kepler可以做到如此高的性能功耗比……太多的疑问萦绕在人们的心头，不论业界还是爱好者，甚至包括竞争对手AMD在内，每个人都希望能够获得这些问题的答案。

想用好GTX 680 请准备好i7-3960X

和所有人一样，我们也渴求着这些问题的答案，但由于初期资料以及测试的不完善，我们在逻辑构架解读的细节展现以及特性解释等方面都遇到了不小的困难,因此我们在首测文章中无法给予读者们所有这些关于构架细节、“黑科技”以及诸多“为什么”的答案。

想用好GTX 680 请准备好i7-3960X
给我们带来各种“为什么”的Kepler芯片

在过去的近一个月时间里，我们进行了大量可以进行的关于开普勒构架底层的延展性测试，以求能够揭开蒙在Kepler构架以及Geforce GTX 680周围的重重帷幕。现在，我们相信自己已经揭开了这神秘面纱的重要一角——Scheduling过程的细节和意义。而我们所使用的方法，就是测试Kepler以及Fermi逻辑结构对不同处理器性能的依赖程度。

想用好GTX 680 请准备好i7-3960X
你的处理器够力满足GTX680么？

抛去逻辑结构那些晦涩的细节以及对爱好者较高的技术水平要求，即便是对于一般用户来说，手头的显卡是不是已经物尽其用，究竟怎样的处理器才能让显卡获得最完整的性能发挥等等同样是值得关注的问题。因此，我们决定利用本期的GPU炼金试验室栏目对我们深挖Kepler构架黑科技过程的部分测试的结果进行展示，在为我们接下来将要进行的讨论做铺垫的同时，为大家带来“Geforce GTX 680究竟搭配怎样的处理器才不会吃亏”这个问题的答案。

你的Geforce GTX 680真的火力全开了么？相信我，你会对这个问题感兴趣的。

不能用游戏么，那我们要怎么测试？

所谓GPU对处理其性能的依赖性，实际上指的是由处理器频率来决定的GPU本身的性能。一款GPU对于处理器的依赖体现在很多方面，诸如生成任务的能力、对于函数库以及内存访问的中断管理、对指令的转译以及管理等等。这些由处理器决定的过程每时每刻都在影响着我们的应用，通过逐步调整处理器的频率并收集对应频率下不同GPU的性能，我们就可以知道各种GPU构架对于处理器性能的依赖程度了。

想用好GTX 680 请准备好i7-3960X
处理器对任务及中断过程的管理

遗憾的是，这些依赖度的测试并不能很直接的使用实际游戏之类的手段来进行。诚然，显卡的各种测试最终都是要服务于游戏等实际应用当中才有意义，但在一般的游戏过程中，处理器除了要负责与GPU性能也就是依赖性直接相关的部分之外，还要负责处理顶点生成、程序中断控制管理、典型物理过程运算以及AI等多项事务，这些过程的处理都会极大地影响到最终游戏执行的速度。换句话说，处理器不仅影响着GPU的性能，其本身对应用的最终性能同样会产生直接的影响。通过调整处理器主频确实可以得到不同的游戏表现，但这些表现往往是处理器本身对游戏性能的影响，并不一定是GPU构架依赖处理器性能所导致的。

想用好GTX 680 请准备好i7-3960X
我们熟悉的3Dmark Vantage CPU Test就是典型的AI处理过程

GPU炼金实验室是一档致力于揭示构架底层设计特点的栏目，我们所做的测试均要求尽可能的回避能够对结果产生干扰或造成不确定性的因素。有介于这种情况，我们决定继续采用过去经常采用的低图形关联度测试法，以直接面向底层性能的通用计算测试，也就是SDK Simulation测试来替代多种因素交织并彼此产生影响的常规游戏过程。在此基础上，我们会同时提供对处理器性能依赖较小的图形过程来进一步体现GPU对处理器性能的依赖情况。

想用好GTX 680 请准备好i7-3960X
Fluid dynamics simulation

我们首先进行的SDK Simulation测试是使用Direct Compute完成的流体力学模拟测试——Fluid dynamics simulation。Fluid dynamics simulation基于弹性力/黏着力/重力为基础的颗粒碰撞模拟，每一个颗粒均拥有独立的力学参数，通过对颗粒本身在统一的重力参数作用下自有力学参数以及交互作用的计算，可以模拟大量颗粒的行为并达到模拟由它们构成的“流体”特性的目的。由于每一个粒子最终都会被处理成与其他粒子关联的任务，大量任务及其背后的关联性让Fluid dynamics simulation的Grid测试部分对于线程关联度判断等过程非常敏感，因此该项测试可以考验不同构架在图形通用计算以及有针对性的物理特效计算时对处理器的依赖度。

想用好GTX 680 请准备好i7-3960X
Cascaded Shadow Maps

Cascaded Shadow Maps（CSM）是一种基于阴影深度进行的阴影判断及快速操作模式，CSM通过将整个阴影划分成若干级的层次，以层次内部像素的深度来定义和快速判断阴影位置，并对近景阴影采取高精度贴图，远景阴影采用低精度贴图的方式来达到节约资源同时快速准确实现阴影贴图的目的。CSM可以极大地加快阴影操作的速度，同时避免大多数因为光源形态、阴影深度与像素尺寸差异所导致的阴影边缘及内部贴图错误。CSM可以透过Compute Shader来进行大量涉及矩阵运算及坐标判断，而这一过程会频繁的访问API，因此对处理器的任务及中断管理能力有着很高的要求。

3Dmark 11

不同版本的3Dmark对于图形过程中处理器的依赖度是不同的，基于DirectX 11的3Dmark 11由于侧重点的改变，对于处理器在常规图形过程中的依赖要小于其他版本的3Dmark Serise。因此，通过对3Dmark 11的测试，我们不仅能够从侧面获得一定的GPU构架对处理器依赖度的信息，还可以取得不同处理器主频下GPU构架所能够表现出来的图形性能变化趋势。

测试平台及测试项目简介

性能测试使用的硬件平台由Intel Core i7-3960X、X79 Chipset和4GB*4四通道DDR3-1600内存构成。细节及软件环境设定见下表：

想用好GTX 680 请准备好i7-3960X

各类合成测试软件和直接测速软件都用得分来衡量性能，数值越高越好，以时间计算的几款测试软件则是用时越少越好。由于是芯片级首测，因此我们将所有参测显卡的频率统一调节成了公版频率。

最低频1.2G，“不给力”的起点

我们的测试从Rampage IV Extreme能够允许的最低运行倍频12开始，当倍频被调节到小于默认的33之后，I7 3960X的睿频功能便被自动关闭，CPU主频将被定格在当前设置的数值上，这为我们的测试提供了便利。在极低的频率下，Kepler构架以及Fermi构架分别开始了自己的表演。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

在最低CPU主频的测试中，Geforce GTX 680在通用计算测试部分表现出了低落的性能，其测试数值尚不及上代的Fermi构架。而图形测试环节，获益于超过Fermi一倍的Texture资源，Geforce GTX 680维持住了相对Fermi的优势，但领先幅度与默认状态存在不小的差距。

1.6G，Kepler依旧不及Fermi

我们以400MHz为单位提升CPU的主频，当主频达到1.6G时我们再次进行了测试并收集了数据，在1.6G的主频上，Kepler与Fermi的差距不仅没有缩小，反而被进一步拉大了。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

在1.6G的I7-3960X的驱动下，Kepler的表现依旧比较乏力，伴随着处理器频率的提升，Fermi构架在CSM测试中取得了增幅要明显大于Kepler的Geforce GTX 680。而图形相关的测试中，Geforce GTX 680终于找回了一定的自信，在增幅上超过了GTX580。

2.0G，Fermi贴近界限

伴随着处理器频率的进一步提升，Geforce GTX 680终于开始了属于自己的表演，其测试成绩开始有了令人期待的加速增长态势。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

2G的SNB-E处理器成功地阻止了Kepler与Fermi构架之间通用计算性能差距的进一步扩大，不仅CSM测试Geforce GTX 680稳定住了与Geforce GTX 580之间的差距，在Fluid测试中Geforce GTX 680更是完成了对GTX580的超越。图形测试部分，Geforce GTX 680同样维持了更高的性能增长率，而GTX580则逐步贴近了默认性能界限。

2.4G，Kepler性能增速提升

当主频来到2.4G时，Kepler构架终于开始了属于自己的表演，在测试中表现出了更加明显的性能提升，并基本上完成了对Fermi的完全超越。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

在2.4G的处理器频率下，Geforce GTX 680在CSM测试中达到了与GTX580相同的测试结果，而其他的所有测试项目中GTX680均表现出了更高的性能。

2.8G，Fermi已达极限

当频率被提升到2.8G时，我们的测试进行到了一个冰火两重天的状态。一方面Kepler的性能依旧在维持着几乎线性的增长，另一方面的Fermi的性能则进入了滞涨的状态。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

在2.8G的测试中，Geforce GTX 580无论是图形性能还是通用计算性能都已经增长到了界限，当前的成绩与我们所进行的公测以及后续测试中所展现出来的默认成绩均一无二致，这表明Geforce GTX 580已经达到了其理论性能的界限，接下来所发生的一切事情，都不是由处理器依赖性所决定的了。

3.2G，Kepler依旧维持增长

当频率进一步提升到贴近I7-3960X的默认状态时，Fermi构架的性能已经停止了增长，但Kepler构架却依旧维持着旺盛的性能增长状态。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试

想用好GTX 680 请准备好i7-3960X
CSM测试

想用好GTX 680 请准备好i7-3960X
Fluid测试

在3.2G的测试中，Geforce GTX 680在所有的测试环节均完全超越了Geforce GTX 580，领先幅度基本上达到了公测阶段默认处理器频率下所收集到的级别。

在这些频率上，我们都遇到了什么？

前面的测试结果收集都是以特定频率为阶段进行的，将他们割裂的进行分析会令人很难产生处理器对GPU性能影响的完整印象，所以我们将这些结果进行收集并按测试项目分别制成了曲线图，接下来就让我们来看一看处理器频率究竟对Geforce GTX 680以及Geforce GTX 580产生了怎样的影响吧。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 P模式测试曲线

3Dmark 11的P模式测试大幅削减了材质以及后端输出的需求，因此负载更加偏向于shader的执行也就是ALU的动作效率，在P模式的测试中，伴随着处理器频率的提升，Geforce GTX 680表现出了高于Geforce GTX 580的性能增长速度，这表明Geforce GTX 680的效率比Geforce GTX 580更加依赖于处理器的性能表现。

想用好GTX 680 请准备好i7-3960X
3Dmark 11 X模式测试曲线

X模式的3Dmark 11拥有极高的材质以及shader吞吐压力，同时后端也必须面对诸如抗锯齿之类应用所带来的负荷。在这些“干扰因素”的作用下，Geforce GTX 680与GGeforce GTX 580的处理器依赖性表现得并不明显，但两者仍旧随着处理器频率的增加而获得了性能的提升。

想用好GTX 680 请准备好i7-3960X
CSM测试曲线

CSM的测试结果一定会出乎不少人的意料，在较低的处理器频率下，Geforce GTX 580竟然完成了对Geforce GTX 680的性能超越，这种超越在处理器主频达到2G之后才有所缓解，当处理器频率超过2.4G之后，Geforce GTX 680显然从处理器的频率提升中获得了更多的好处。

想用好GTX 680 请准备好i7-3960X
Fluid测试曲线

Fluid simulation测试的结果在趋势上与CSM类似，在处理器性能低落时Geforce GTX 580要比Geforce GTX 680更快，这种情况直到处理器频率达到2G之后才得到了缓解，而伴随着处理器频率以及性能的提升，GTX680获得了始终呈线性状态良好增长的性能曲线。

为了黑科技，买一颗好处理器吧少年

测试结果既出乎意料却又在情理之中。伴随着我们使用的3960X主频的提升，无论是图形测试还是通用计算测试，Geforce GTX 680均表现出了比Geforce GTX 580更明显的性能延展性，性能提升幅度要明显好于后者并且直到测试结束都维持着几乎线性的性能延伸，但这句结论在这里并不是全然意义上的正面描述。这样的测试结果，充分证明了Geforce GTX 680有着比上代Fermi构架的Geforce GTX 580更强烈的处理器依赖性。

想用好GTX 680 请准备好i7-3960X
Kepler构架有着比既往构架更加强烈的处理器依赖性

在两项通用计算性能测试中，Geforce GTX 680在处理器低频状态下均败给了上代的Geforce GTX 580，而伴随着频率的提升，GTX680的各项性能均呈现出完全的线性增长，最终直到处理器默认频率状态下这种增长仍然没有停止。这不仅佐证了GTX680更加强烈的依赖性，更为国内外各大媒体在GTX680首测期间所提供的趋势相同但细节迥异的测试结果提供了解释——目前我们所接触到的处理器默认状态，尚不足以完全发挥出Geforce GTX 680全部的性能。

想用好GTX 680 请准备好i7-3960X
默认I7-3960X以上的处理器才能满足GTX680

对于Geforce GTX 680的用户来说，一款强劲的处理器是绝对必要的，它可以让Geforce GTX 680表现出“应有”的性能。根据目前的测试结果来看，我们甚至建议用户保证I7-3960X这样档次的处理器，最起码要保证处理器在超频状态下具有与3.3G的SNB-E处理器相近的性能水准。只有这样的处理器性能，只有这样才能够保证Geforce GTX 680在图形及通用计算应用的绝大部分场合的正常发挥。而对于Geforce GTX 580的用户来说，这一限制被放宽到了一个较低的性能等级上，只要你的处理器比2.8G的SNB-E更快，那么你手头的Geforce GTX 580将在大多数场合发挥除正常的性能。

想用好GTX 680 请准备好i7-3960X
GTX580对于处理器的依赖要比GTX680小得多

早在Geforce GTX 680的首发测试中，我们就曾经对GK104身上出现的诸多“黑科技”进行过初步的探讨。在这些黑科技中，最引人注目的部分便来自Scheduling过程的巨大变革，它不仅是Geforce GTX 680目前所表现出来的强烈的处理器依赖性的主因，更是Kepler构架中一系列重大变化，如SMX单元以及更高每瓦特性能等出现的重要原因。今天的测试除了向读者们表明Geforce GTX 680需要强劲的处理器才能发挥应有性能之外，更重要的意义在于为我们即将到来的关于GK104黑科技的解密过程提供讨论的依据。

想用好GTX 680 请准备好i7-3960X
期待下期登场的Kepler黑科技吧

在接下来的文章中，我们将会对GK104全新的Scheduling过程所具备的特点、出现的原因以及对当前和未来所产生的影响进行详细的讨论。如果你是一个希望更多更全面的了解Kepler以及未来NVIDIA GPU设计细节和发展方向的读者，那么接下来的文章将是你不容错过的。Kepler的黑科技正在我们的拷问之下初步显现出更多的细节，敬请期待我们对这些黑科技的全面展示吧。（文/ZOL）

【本文结束】如需转载请务必注明出处：快科技

责任编辑：

文章内容举报