正文内容 评论(0

55nm最后绝唱!RadeonHD4890终极评测
2009-05-06 16:21:51  出处:硬派网  作者:硬派网 编辑:D3D     评论(0)点击可以复制本篇文章的标题和链接

随着发售日期的渐渐临近和我们的追踪报道,Radeon HD4890的神秘面纱终于逐渐揭开,其照片、参数、性能、价格也越来越明朗,大家对它的认识也渐渐清晰。从最早的RV790到现在的HD4890,大家对这款显卡的讨论热情从来没有减少过,ATI对广大DIYer的影响可见一斑。而今天,4月2日,ATI终于确认了这款产品的正式发布!

55nm最后绝唱!RadeonHD4890终极评测

对于Radeon HD4890的大致规格,我们在之前的新闻中已经有过不少报道,虽然HD4890似乎不算神秘,但正是这些扑朔迷离的消息,让我们产生了对HD4890的四大疑问?

●能否带来更强的性能?

可以说在核心架构上,Radeon HD4890采用的RV790芯片与之前的RV770几乎没有差别,而只是核心频率的提升以及显存频率的提升,这样看似乎RV790仅仅是RV770的一个超频版本,频率的提升能带来明显的性能提升吗?

而且HD4890能否和现在如日中天的GeForce GTX260+对抗,这是我们最大的疑问,也是想要购买HD4890显卡用户的最大疑问。

55nm最后绝唱!RadeonHD4890终极评测

●能否保持很好的控制功耗?

核心频率以及显存频率上,Radeon HD4890都达到了前所未有的高度,这不禁让人担心,在功耗上HD4890如果不能做到很好的控制,将全面超越HD4870,毕竟谁也不想请一个“电**”回家。

●能否有让玩家DIY的潜质?

以HD4890的定位来看,其主打的中高端市场,这个阶段的市场上DIY居多。因此对于购买回的显卡是否可“玩”都非常关心。比如超频能力如何,是否有改造的潜质,目前40纳米的GPU还没有推出,我们都想知道HD4890能否再让55纳米工艺最后疯狂一次。

●能否保持低廉的价格?

最后说到价格问题。从Radeon HD3850/70到HD4850/70,ATI在单芯片的高端显卡上一直保持着主打“高性价比”的策略。HD3850/70上市价格都在2000元以内,HD4850/70也不例外。HD4890上市之初能否马上给出DIY玩家一个非常满意的价格,这是HD4890能否有市场竞争力的最关键因素之一。

55nm最后绝唱!RadeonHD4890终极评测

相信读者和我们都是带着这四点最大疑问来迎接Radeon HD4890的,硬派网显卡频道马上为你全面揭开Radeon HD4890的面纱,如果你是一个DIY玩家,下面的内容绝对不容错过。

原4870的继承者 4890定价1699元

首先,我们来了解一下ATI今天发布的这款Radeon HD 4890显卡的市场定位在哪里。相信熟悉ATI产品的朋友,其实从这款显卡的命名上就已经猜到了它的市场定位。以ATI最新的命名方式,Radeon HD 4890当中的“4”表示了这是第几代产品,“8”则表示性能级产品,也就是说这款产品为高性能的产品,“9”则表示了这款产品为4800系列当中最高规格的显卡(X2系列双核心显卡除外)。

55nm最后绝唱!RadeonHD4890终极评测

从上面的命名规则上来看,HD4890这款显卡显然是目前ATI单核心显卡最高端的一款产品,定位于Radeon HD 4870与Radeon HD 4870 X2之间。以我们截止至发稿前的消息来看,Radeon HD 4890这款产品售价大约在1699元左右,这个价位阶段也正好是在HD4870显卡降价之后的一个空白阶段,同时竞争对手在这一价位上实际也没有产品存在。而HD4890上市之后,2000元以内的最佳性能显卡很可能非它莫属。

55nm最后绝唱!RadeonHD4890终极评测

从上面我们预测的市场产品图来看,在HD4890显卡上市后,ATI的整体产品线无需做任何调整,HD4890刚好能够补全从1499~3000元这个巨大的市场空当上。而同时,NVIDIA方面显然也已经察觉到这一问题,因此将会在今天晚些时候发布GeForce GTX 275显卡来弥补这一空白。

市场定位我们已经清楚了,那么Radeon HD 4890在产品的规格上又有什么变化呢?下面我们就一起来看看。

频率再次提升 产品规格变化不大
Radeon HD 4890显卡的消息刚刚放出时,曾经还有报道称这款显卡将会采用超过800个流处理器的设计,据悉原因是ATI打开了部分RV770核心当中的隐藏的流处理器管线。不过在随后的新闻当中又再次传出这款显卡仍为800个流处理器,那么实际情况究竟如何呢?今天,在HD4890产品正式发布后,我们终于能够一探究竟了。

55nm最后绝唱!RadeonHD4890终极评测

Radeon HD 4890确实是采用了800个流处理器设计,不过根据官方消息来看,他们将RV770核心经过了重新的优化,并且核心的封装形式也有一定的变化,这一点我们会在随后的章节当中为大家介绍。除了流处理器数量没变以外,ROP单元以及纹理单元等核心规格均没有变化:

55nm最后绝唱!RadeonHD4890终极评测

从产品的规格对比表格上来看,实际上Radeon HD 4850/4870/4890都像是采用了相同的核心架构,三者的区别在于显存以及频率方面。而这其中,又以HD4870和HD4890之间的规格最为相近。HD4890经过了核心设计(*注意,我们所指的核心设计并非架构上的设计,而是核心电路设计)的优化,将原本运行在750MHz的核心频率提升到了850MHz,并且这还远非RV790核心的频率极限!除此以外,显存规格的升级也让显卡的带宽得到了不小的提升。而经过我们后文的超频测试,大家也可以了解一下GDDR5在超频方面的恐怖性能。

显卡的功耗方面相比Radeon HD 4870来说“有升有降”,在待机状态下,PowerPlay发挥了更好的节电功能,使得HD4890单卡在待机等轻负载状态下仅有60W的功耗,而4870则要达到90W;满载状态下,由于HD4890频率更高,因此峰值功耗也达到了190W,而HD4870为160W。

架构:沿用HD4870设计 频率更高

◆800个流处理器的RV790核心:

从架构方面来看的话,实际上RV790核心并不能够称作一款新品。因为RV790的核心设计是与RV770大致相同的,也就是说,RV790也是基于R600为基础的流处理器架构。在进入DirectX 10时代以后所有显卡核心的Vertex Shader和Pixel Shader都合并成统一架构,流处理器单元可以处理包括顶点数据、像素渲染等各种数据流。R600是采用的ATI第二代统一架构技术,RV770同R600一样都采用的是单时钟周期处理5个标量乘加指令的设计,也就是我们常说的4D+1D设计。

55nm最后绝唱!RadeonHD4890终极评测

虽然4D+1D设计方式在运算时间的灵活度和执行效率不如NVIDIA的全1D式设计,但是所带来的好处就是流处理器单元的设计复杂度低,因此ATI可以将流处理器的数增加的更多,由此我们才会看到现在RV790所能达到的800个流处理器的数量。

在流处理器的设计上RV790仍然采用的是Shader频率与核心频率保持一致的做法,这一点同NVIDIA的设计思路仍然不同。Radeon HD4850和HD4870都采用了的RV770核心,而Radeon HD 4890则升级到了RV790核心。HD4850频率是625MHz,HD4870是750MHz,而到了HD4890则提升到了850MHz,不过三者在架构上没有本质区别。

◆HD4890显卡核心曝光:
从RV670核心的Radeon HD3000系列显卡开始,ATI就开始使用55nm工艺,而竞争对手也是在不久前才全面的转换到了55nm工艺。到了之后的RV770核心,ATI仍然沿用了55nm工艺的设计方式。虽然在不久前,ATI发布的移动版Radeon HD 4000系列显卡升级到了最新的40nm工艺,不过对于台式机显卡而言,ATI还是稳扎稳打,继续采用55nm工艺技术。

55nm最后绝唱!RadeonHD4890终极评测

现在就让我们揭开55nm工艺制造的RV790核心的神秘面纱。我们为大家拆解的是原厂Radeon HD4890显卡,揭开散热器后,你不难发现,RV790的核心面积似乎与RV770比较像,不过RV790却是经过了重新的优化设计改进,但是具体改进的项目ATI并没有详细透露。

改进:核心重新优化 封装有改变

为何说RV790核心是经过重新优化的?首先我们从照片上来判断一下,以下两张照片分别为RV790(Radeon HD 4890核心)和RV770(Radeon HD 4870核心),我们先来看看两者在外观上的区别:

55nm最后绝唱!RadeonHD4890终极评测

虽然我们用肉眼很难一眼区分出核心大小的变化,不过核心周边电阻我们还是很容易看出两者的区别的。核心周边的电阻无论是排位、还是大小均有不小的变化,也就是说负责为核心传输信号的PCB已经进行了较大幅度的调整,因此我们有理由相信,在核心内部也进行了一定的改变。当然,这一切的改变都是建立在核心架构不变的基础上的,这些改变可能进一步的提升了显卡的执行效率或者超频能力等等因素。

55nm最后绝唱!RadeonHD4890终极评测 

55nm最后绝唱!RadeonHD4890终极评测

55nm最后绝唱!RadeonHD4890终极评测

55nm最后绝唱!RadeonHD4890终极评测

除此以外,经过我们使用游标卡尺的反复测量发现,RV790核心尺寸也要比RV770稍大了一些(仅相差0.5mm左右的边长)。当然,我们并不否认我们这样粗略的丈量会有些许误差,因此我们用最新版的GPU-Z软件也对显卡的核心规格进行了检查: 

55nm最后绝唱!RadeonHD4890终极评测

55nm最后绝唱!RadeonHD4890终极评测

从最新版的GPU-Z软件检测信息来看,RV790核心与RV770核心之间确实存在着一定的面积差别!也就是说Radeon HD 4890的核心面积确确实实的要比Radeon HD 4870增加了一些,不过增加的面积非常有限。因此,我们猜测RV790核心确实在核心设计上进行了重新优化,并且增强了某些功能。而我们为了验证这一事实,特意将Radeon HD 4890显卡降到了与HD4870相同的频率上,来验证RV790与RV770核心之间的性能差异。

◆Stream流处理技术回顾:

RV790这款产品的前作RV770的浮点运算能力早已达到了12000亿次,而此次,ATI再度将这以数据刷新,达到了史无前例的13600亿次。配合ATI的Stream流处理技术,能够让更多的并行计算软件得到更加出色的性能发挥,进一步提升了GPGPU的强大计算能力。

55nm最后绝唱!RadeonHD4890终极评测

目前GPU的浮点运算能力普遍都比CPU强出多倍。就连ATI很久以前的入门级产品HD3400系列,浮点运算性能都要比目前最顶级的四核心i7处理器更好。此次发布的RV790自然在浮点运算能力上更胜一筹,而要知道RV790采用SIMD的架构,在理论浮点计算能力上更为强劲。RV790核心的13600亿次浮点计算能力仍然大幅度超越了ATI曾经旗舰级产品R600的5000亿次!

◆Stream技术在此升级:

伴随着RV790显卡的正式发布,ATI再次升级了Stream技术。从1998年到2008年,3D加速卡已经经历了大约10年的发展历程,从最初的3D加速卡的诞生到现在性能非常强悍的产品已经经历了无数次的更新换代,不过这是种逃离不掉显卡从诞生至今的唯一功能——仅能局限于3D加速的领域。经历了大约十年的显卡发展历程,由最初的单纯3D显示加速到如今的并行计算,让显卡这一产品经历了一个十分巨大的变革。

55nm最后绝唱!RadeonHD4890终极评测

随着显卡的性能增强,人们越来越意识到如此高性能的显卡如果单纯的利用在3D加速领域的话,会让显卡在大部分时间浪费掉它的出色性能,因此并行计算便提上了显卡未来发展路线的日程。当然,实际上目前来看,显卡已经在朝着这一方向大步迈进了。ATI在去年的催化剂8.12当中也首次将这一功能公之于众——Stream流处理技术。这一技术将会主要针对娱乐、游戏以及桌面级应用提供强大的技术支持以及效能提升。

55nm最后绝唱!RadeonHD4890终极评测

相对NVIDIA的CUDA技术而言,ATI采用的Stream技术是一项开放性的技术。实际上,最初ATI采用的流处理技术并非完全开放,而是仅针对单一的一个项目而研发的,当然这也是ATI首次尝试让显卡运行在3D加速以外的应用,因此我们不可能有过多的要求。

55nm最后绝唱!RadeonHD4890终极评测

为何要将这一技术完全开放,实际上这是ATI一个非常明智之举。ATI方面直接基于OpenCL这一开放性标准,因此势必会得到更多厂商的技术支持。并且,ATI在最近也更新了Stream SDK到1.4版,同时也继续支持即将发布的OpenCL SDK 2.0。

55nm最后绝唱!RadeonHD4890终极评测

此外,在最新的Stream技术当中,ATI也继续发挥了整体平台的性能优势,而不是将所有的工作一味交给显卡来运行,而是更加合理的分配,使得CPU与GPU能够更好的协同运作,从而达到更高的运行效能。

物理:支持OpenCL 看新物理引擎

◆Havok助力,HD4830也能支持物理加速:

目前,我们虽然已经能够看到不少采用PhysX引擎的游戏已经能够通过NVIDIA显卡实现物理加速功能,不过ATI方面依然将会继续采用Havok物理引擎。毕竟,到目前为止,采用Havok物理引擎技术的游戏同样比比皆是。最为知名的应该就算是让Havok物理引擎饱受好评的《半条命2》这款游戏了。除此以外,例如:刺客信条、英雄连、生化骑兵、地狱之门:伦敦等等。之所以获得这么多游戏的支持,原因就是因为Havok技术非常先进,同时价格却非常便宜,应用程序接口的程序编写上也相对更为简单。

55nm最后绝唱!RadeonHD4890终极评测

可能有些读者会问,NVIDIA的PhysX技术的最大亮点就在于能够支持显卡的物理加速计算功能,那么ATI何时也能加入这一功能呢?实际上,ATI在不久前一直认为物理引擎的计算主要还是要CPU来承担,并且AMD和Intel都将对Havok FX引擎在处理器中进行更进一步的优化。

而这一情况,在不久前举办的GDC 2009大会上却将要得到改善。在最新的GDC 2009大会上,Havok首次宣布了能够支持OpenCL架构的物理加速引擎,除此以外,AI引擎也将引入OpenCL接口上。何谓OpenCL?实际上我们可以简单的把OpenCL简单的也看做是OpenGL或者DirectX之类的应用程序接口,它能够让编程人员通过程序语言让GPU来实现并行计算功能。也就是说,此次Havok公司公布的OpenCL物理加速引擎,实际上就表明了显卡也将会实现硬件支持Havok公司的物理计算功能,并且Havok公司也首次公布了OpenCL物理计算效果
而ATI的Stream技术当中又提供了很好的OpenCL的支持,因此我们不难想象到在未来支持OpenCL物理加速的游戏大量上市之后,ATI显卡也能够顺利的支持物理加速的效果。并且我们深信,以Havok的影响力,对其支持的游戏应该也不会亚于目前NVIDIA PhysX技术的游戏。

55nm最后绝唱!RadeonHD4890终极评测

实际上,在不久前举办的GDC 2009大展上,Havok展示了不少的物理加速视频效果。唯一遗憾的是,目前ATI还没有放出相关的技术演示DEMO,因此此次测试我们无法亲身为给为读者展现,对此感兴趣的朋友可以在下一页看到实际的视频演示效果。

系统:支持Windows7 驱动已就绪

被众多用户病垢的Windows VISTA操作系统正式发布后,除了能够支持DX10效果外,绝大多数用户实在是想不到升级的意义何在。更多用户仍然还在使用Windows XP系统,这也使得微软不得不提前将下一代操作系统Windows 7提前摆上了日程。目前Windows 7一经推出了非常多的试用版本,并且终于得到了多数用户的认可。

55nm最后绝唱!RadeonHD4890终极评测

◆完善的驱动支持:

现在距离产品正式发布的时间也日益临近,而ATI目前也已经为Windows 7准备好了最新的驱动程序。实际上,使用非HD4890显卡的用户,目前已经能够下载到Windows 7下最新的催化剂9.3版正式版驱动程序了,也就是说,即使Windows 7明天就正式发布,而ATI显卡的用户也已经可以全面体验了。

55nm最后绝唱!RadeonHD4890终极评测

在Windows 7当中,GPU将会发挥更加重要的作用,它已经不单纯的会作为3D加速显示的用途了,即使用户在2D界面下,同样能够使用显卡来为您的显示画面进行加速,而这一切的前提都必须是有一款良好的驱动来支持,由此可见驱动程序的重要性。

◆更好的性能表现:

55nm最后绝唱!RadeonHD4890终极评测

当然,作为一款娱乐级显卡产品,尤其是高端显卡而言,游戏性能还是玩家考虑的首要因素。上图就是ATI官方公布的Radeon HD 4870显卡在VISTA系统下和在Windows 7下相比的性能提升,可以看到,绝大部分游戏ATI几乎都做到了达到5%的性能提升,而竞争对手方面表现则相对糟糕,不少游戏都出现了性能不升反降的情况。

特性:支持第二代DX10.1硬件架构

ATI Radeon HD4890理所当然的继续支持在RV770发布时一系列其他的特性,毕竟RV790的核心架构本身与RV770没有区别。例如对DX10.1架构的支持、对物理引擎、科学计算、UVD2.0、PowerPlay2.0等技术的支持。下面我们就对这些特性进行一个简单的回顾。

◆ DX10.1在反锯齿方面的改进

在催化剂驱动中我们可以看到4种不同的反锯齿模式供给DX9甚至更早的游戏应用。而在最新的游戏中,ATI同样能够提供纹理和shader的反锯齿技术,达成球体边缘的反锯齿过滤效果。在技术展示Demo中,我们可以看到ATI显卡对于边缘锯齿的检测非常精确,对于这部分像素被赋予了更多的采样点,右下角的放大图可以精确的展示反锯齿的效果,边缘的柔化和闪烁几乎不存在

55nm最后绝唱!RadeonHD4890终极评测

◆ 自定义反锯齿的优势和应用

DX10.1中的一个新的特性就是允许shader控制反锯齿缓存的读取,而在之前只允许访问多重采样的颜色缓存,这一机制允许更先进的反锯齿技术存在,更有利于着色器的效能发挥硬件的优势,而ATI的CFAA反锯齿其实已经应用了类似的技术。

55nm最后绝唱!RadeonHD4890终极评测

◆ 针对纹理的强制规范

其中对开发者的一个障碍就是避免了让他们使用更高精度的纹理和输出格式,最新版本的DirectX一直在进行这方面的工作。DX10.1将32位浮点格式以及16位的整数混合格式作为了强制的规定。

◆ 常规反锯齿的强制规范

MSAA也就是多重采样反锯齿是一个比较完善的技术,不过在近些年,图形厂商基于此技术推出了很多增强的技巧和方法,不同的图形卡往往采用不同的输出方式,而开发者也无法将此项技术直接应用到游戏中。DX10.1为此项技术作出了硬性的规定,包括最小反锯齿的倍数(4x),以及如果需要提升反锯齿的质量(比如8x/16x),必须遵循多重采样的模板,从而保证MSAA在不同GPU之间的一致性。

◆ 更高的精度规范
所有的数据格式都是在有限的精度范围内进行计算的,不过,某些运算并不充分利用可用精度来产生输出,而近似值的应用往往会导致一个最低精度值的产生。这种做法会导致很多不可预测的后果,尤其是当运算需要重复进行的时候,这个误差会不断累积很多倍。DX10.1规定的运算精度就是为了避免这种情况的产生,所有浮点运算和混合运算的精度都达到统一的高度,这样就能保证所有兼容的GPU运算的尾数有同样的精度下降(与CPU的数据交流同样)。

特性:UVD+PowerPlay均为2.0版本

◆UVD 2.0,轻松解码高清视频:

而如果谈到高清视频解码方面,那么ATI的这一优势将会更加明显了。从最早的HD2000系列产品开始,ATI一直在高清视频解码方面比对手拥有更加明显的优势。而到了HD 4000产品时代,ATI再次推出了新一代的UVD 2.0引擎,让原本已经非常出色的UVD引擎得到了更加完美的升级。此次发布的HD 4890对这些特性也都全部完整支持。

在RV770(包括此次发布的RV790核心HD4890显卡)显卡上,ATI正式支持双位流解码技术。UVD 2.0能够在硬件上完全支持双视频流的解码,能够使平台更好的实现Blu-Ray和HD DVD影片中画中画功能,Radeon HD 4890显卡的解码单元能够同时完整处理两组并发的高清视频流,仍然不需要Shader和CPU的介入。

55nm最后绝唱!RadeonHD4890终极评测

除了高清视频播放速度的保证,画质也是不可或缺的一部分,虽然高清视频已经凭借更高的分辨率获得了优异的画面效果,但是后期处理能让高清视频的画质锦上添花。HD4890除了用UVD 2.0引擎来解码高清视频,还配备了一个名为AVP的引擎来专门进行视频的后期处理。例如,降低影像锯齿与画面波纹,改善按比例缩放来源影像后引起的锯齿及毛边等等。此外,通过强化讯号来源,自动调整影像的亮度及对比度;采用12-bit转换器,减少转换时的资料损失,硬件去噪声可以呈现更纯净的画面。简言之,令画面色彩更鲜艳,更细致,更清晰,更锐利。

◆PowerPlay 2.0,让你的电脑更节能:

PowerPlay这项技术原本是应用在笔记本当中的一项节能技术,它可以减低图形处理器的耗电量,消除不必要的电源浪费,并使笔记本电脑的电池达到最长的使用寿命。而这项技术在移植到台式机上之后,ATI从新进行了优化,针对台式机的使用习惯以及功耗,从新为产品定制了一套电源管理方案。这项技术也是从RV670开始首次应用到台式机上,实现了高端显卡的节能降耗的功能,让那些时常抱怨高端显卡功耗过高的用户的脸上露出了一丝笑容。不过,在今天的HD4890产品上,ATI已经将这项PowerPlay技术提升到了第二代。在第二代PowerPlay技术当中,面向台式机的PowerPlay功能优点如下:

1.具备“自我意识”的图形引擎,可以关闭没有工作的处理单元,从内部节能

2.高级频率和电压控制,自动识别GPU的负载,在2D或者低负载3D应用程序时通过降低电压和频率来节能

3.高级显存频率控制,显存的供电和GPU一样,在2D或者低负载3D应用程序时通过显存频率来节能

55nm最后绝唱!RadeonHD4890终极评测

为了保证整个显卡“效率”的体现,ATI在显卡的节能技术方面也花费了苦心,虽然GPU核心的设计为55nm,已经保证了节能的基础,但是ATI还是通过内部核心的功能和外部软件来控制整体的功耗。我们可以看到,新的PowerPlay技术不仅能够实现不同负载下让核心运行在不同频率,同时也首次让显存频率也能够自动调节。另外,在第二代PowerPlay技术当中,还增添了电压调节功能,这更加直接的降低了显卡的整体功耗,从而让显卡的节能效果更佳明显。

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...