正文内容 评论(0)
[导言]
在图形处理芯片领域里,AMD(原ATI)与NVIDIA的竞争愈演愈烈。相信很多人都记得在ATI Radeon X1900时代的R580核心,甚至很多人至今也难以相信R580创造的记录!R580在晶体管数量超过R520的25%的情况下竟然将像素着色单元数量提升了300%的程度!这项成绩得以让ATI在当时打了个漂亮的翻身仗。但是在进入DirectX时代,新架构演变和新工艺的加入却让ATI R600品尝了失败的滋味。而在DirectX10第二代产品竞争中AMD大胆的改革了自己的战略方案,开始以“小核心”来斗“大核心”。但同时也延续R600系列产品的“效率指标”。
在NVIDIA新产品线正式推出之后不久,AMD也推出了自己的新产品Radeon HD4850和Radeon HD4870。ATI新战略一改以往的传统由高到低式的产品推出顺序。AMD将不再单纯的从单核心性能上与NVIDIA争锋,而是全力的推出能够真正获得市场的高质量中级芯片,然后以1+1>1的双核心策略来来推出顶级显卡来竞争霸主地位。
AMD的认为以往利用增大核心面积、填充晶体管来提高核心性能的方法已经不适用,所以AMD选择了“以小斗大”的战略。但这并不是说明AMD放弃了产品的重型规格和高性能指标,反而,AMD依靠技术让小核心展现出了更加强大的规格和性能。并且以比对手更加低廉的价格来进行市场拓展。
以上的所述,改变了新战略的核心究竟能为我们带来多么强大的规格和性能,都将在AMD最新一代的RV770核心上得以展现。让我们来进入RV770的世界来了解一下吧。
关键字:55nm
以往利用增大核心面积、填充晶体管来提高核心性能的方法从理论上是非常合理的,但是从实际角度去考虑,从成本角度去出发却是不合情的。虽然大数量的晶体管会带更高的性能,但在工艺一成不变的情况下,大数量的晶体管也会带来体积更大的芯片,随之而来的还有更大的功耗以及更高的发热量。同时在相同面积的晶圆中,所能切割出的芯片数量也会减少,所以成本的增加也在所难免。
AMD则为自己的产品开辟出一条新的途径。在新核心的设计上不再一味的追求高性能,而是在功耗、发热、成本等全方面考虑之后推出一款全新RV770核心。AMD从R600核心开始,其核心工艺制程直接从TSMC 80nm跳到了55nm工艺。并且更加成熟的应用在RV770芯片上。而NVIDIA最新的GTX280核心也仍只是采用65nm工艺。更先进的工艺是AMD可以在加入更多晶体管的同时又可以很好的控制芯片面积。从而得以使采用RV770芯片的显卡的低廉价格是对手无法相比的。
关键数字:800
NVIDIA新旗舰GTX280核心拥有的流处理器数量为240个。而早在07年末就已经有消息传出“RV770将搭配480个流处理器,是RV670的1.5倍!”。也就是说,RV770的核心数量是GTX280的两倍!但是,RADEON HD 4850的正式登台已经证明这“480个流处理器”只是当时放出的烟雾弹……
而且,RV770续写了R580的传奇,虽然拥有的800个流处理器,但芯片的面积却只有260平方毫米,相较R580面积仅提升了70平方毫米。但晶体管数量去提升到了R580的320个流处理器的2.5倍之多。而在800个流处理器的带动下,其浮点运算效率达到了史无前例的1TeraFLOP!是目前世界上运算效率最高的GPU。
关键字:浮点运算
小数点后面的数位在计算机中是采取浮点形式储存。在浮点表示方法中,小数点的位置是浮动的。为了便于计算机中小数点的表示,所以规定将浮点数写成规格化的形式,即尾数的绝对值大于等于0.1并且小于1,从而确定了唯一的小数点的位置。尾数的长度将影响数的精度,其符号将决定数的符号。浮点数的阶码相当于数学中的指数,其大小将决定数的表示范围。
我们都知道GPU的主要工作就是对要生成生成图形进行多边形处理。而这些多边形,其实就是三角型。每一个3D图形的三维坐标内,三角形的三个定点坐标,就决定了这个面的位置。多边形越多自然三角形也就越多,生成的图像越复杂精细,越逼真。
高精度的浮点运算为我们带来更加逼真的视觉效果
从上面的说明不难看出,三角形各点的位置坐标准确度就决定了形成图形精细程度,而此时在数据单位中非常重要的小数点就出现了。小数点后的数位对图形的最终形成的精确度起到决定性的作用。而浮点运算就是实数运算。浮点运算能力就是对实数能力就是指对于这样的小数点后带数位的数字的运算及处理能力。
综上所述,对于图像运算,尤其是三维图像,浮点运算能力起着极其重要的,可以说是起到了决定性作用。对于二维运算及贴图、光源等处理,因为每个点都是浮点运算,因此附加在每个点上的贴图、光源运算也都是浮点运算。
关键字 PowerPlay、功耗
PowerPlay技术已经随着RV670核心的而广为人知。这项是AMD的最初是应用于笔记本呢当中的电源管理技术。这项技术的关键就是能节能、降耗。
在节能技术方面AMD可以说是非常“资深”。第一家将动态频率及电压支持(P组态)功能导入x86处理器的厂商就是AMD,而这项技术就是久负盛名的“PowerNow”!当不需要CPU全效能执行时,此技术可按需提供效能(performance on demand)而大幅降低功耗。
PowerPlay技术可以对其所监控的主题的动态和静态功耗进行非常精确的分析,并在针对分析结果来进行优化。其中的Power-on-Demand这种动态调整功能不会让用户感受到任何效能上的差异。因为PowerPlay技术可以通过线路上设计不断的对功耗进行分析,并在性能的非关键部位上设置为低功耗区域,进而可以用户感觉不到性能的降低又有效的降低了功耗。
从根本上说,PowerPlay技术属于FPGA(现场可编程门阵列)产业。而这个产业又是半导体行业中最前沿的、最重要的一个行业之一。FPGA产业的提升也是随着半导体生产工艺的提升而提升。不断进步的生产工艺让FPGA拥有更高的密度、更快的速度,同时也带来了更低的成本。而FPGA的提升也让半导体芯片可以拥有更小的产品尺寸和更低的功耗,自然也带来更低的成本。
关键字:Havok
“物理加速卡”相信很多朋友都不陌生,特别对老资格的DIY用户来说,在当时拥有一块3dfx的Voodoo历史上第一块3D加速卡是何等的荣耀!但堪称千古绝唱3DFX VOODOO系列最终被NVIDIA收购。而全球第一家开发出的“物理加速处理器(Physics Processing Unit)”PhysX的厂商Ageia也最终没有逃过被NVIDIA收购的命运……
但面对越来越多的3D模型和越来越多的实际特效没有物理加速是不可能的。NVIDIA收购了Ageia自然有PhysX物理加速,那AMD呢?那自然是选择应用率更高的Havok推出的Havok物理加速引擎。AMD之所以选择Havok引擎有几个原因。
第一:目前在全球游戏领域里被广泛应用的物理引擎的只有Ageia和Havok,其中Ageia被对手NVIDIA收购自然不会去选择采用。
第二:从物理引擎的游戏实际应用数量上看,使用Havok引擎的游戏约为总数量的3/4款,而使用PhysX技术的只剩下的1/4款。自然是首选Havok物理加速引擎。
第三:PhysX主要是让GPU去运算物理效果,而Havok则是让CPU+GPU联合来运算,符合AMD的GPGPU的发展线路。
关键字:GPGPU
目前,在通用计算和图形处理领域里可以说是三国鼎立。Intel堪称通用计算的龙头,但是只有CPU而没有真正独立的GPU,虽然在各种宣传中一再强调CPU的重要性,但从其收购Havok来看,Intel自然也想在图形处理领域里分一杯羹。而图形领域里的龙头NVIDIA则与Intel相反,其只拥有GPU而没有完整独立的CPU。但最近两年的发展趋势不难看出NVIDIA正在努力的向通用计算领域里挺进。而AMD在成功收购ATI之后,则是同时即拥有完整独立的GPU和CPU,而GPGPU的概念也再一次成为关注焦点。
“GPGPU”可以被称为通用图形处理器。其中第一个“GP”通用目的(General Purpose)而第二个“GP”则表示图形处理(Graphic Process),这两个“GP”搭配起来就是“通用图形”。而再加上“U”(Unit)就成为了完整的通用处理器。
拥有双向发展的AMD更需要让GPU有个完美的发展前景,在GPU中基于了一套完整的DiretX、OpenCL开放标准,并且在发布了开源工具、Linux开源驱动之后又继续向外界公开GPU的微代码。AMD认为只有开放的标准才能让自己走的更远。而且AMD也希望与其他厂商共同前进集思广益,共同打造出一个完美开放式的通用计算标准,虽然NVIDIA也加入了开源的行列,但AMD认为CUDA方式并不符合自己的开放方向而放弃采用。
关键字:TessellATIon
从R600芯片开始ATI便采用了DirectX 10.1的先进架构,其最主要的特点可以用“细化”两个来概括。如新的光照技术、抗锯齿能力等等。而DirectX 10.1中最关键的部分就是可编程TesselIon技术的应用。
虽然在DirectX 10中AMD便已经尝试使用TessellATIon技术,但当时只是个“临时牌照”并不被认可,直到DirectX 10.1开始才将其列为标准之一。Tessellator作为一种硬件多边形细分功能, Tessellator使用高顺序表面几何使游戏的原始简单模型变得更圆滑更细致。Tessellator可以根据对象与观察者的距离的图同而利用GPU自动创造出定点,并且处创建线框密度不同的3D模型,进而使模型在细节上更加圆滑,让画面晓果更加惊喜。而且Tessellator技术的应用还有效的降低开发难度、改进程序性能。
由于Tessellator技术的智能性,让GPU在做多边形定点运算以及模型的制作上更加的方便、迅速,也从而减轻了其他方面的性能消耗,最终让显卡以最低的性能输入而获得最大的画面质量。这也是可编程Tessellator技术应用的最关键所在。
关键字:UVD2
AMD的UVD技术可以说是将CPU解放出来,可以对H.264和VC-1进行完美的硬件解码。采用了UVD技术的显卡广泛的被高清爱好者所选用。而在RV770核心中AMD更是为其添加了第二代UVD技术,在传承了第一代UVD技术的优良设计的同时还进一步对其进行优化。
第二代UVD技术在高码流的播放上进行了优化,甚至可以播放码流超越40Mbps的片源。另外还可以对超高分辨率视频解码,我们所看的1080P的高分辨率电影对UVD技术来说已经是小菜一碟,新一代的UVD技术甚至可以对高达2160P分辨率的片源进行解码。而且更加让人惊叹的是,第二代UVD技术还加入了多流解码,即同时解码多部高清影片,比双流解码更强大。
[HD4850核心详细规格]
通过规格表我们可以清楚的对比出HD 4850所采用的RV770核心的与HD 3850所采用的RV670和GF 9800GTX采用的G92核心的区别。RV770不仅是在流处理器方面非常突出,在纹理单元和光栅单元方面也是具有明显的领先优势。但在其中最为突出的一项数字就是纹理单元。AMD向来都是以像素渲染单元为显卡性能提升的重点,而对纹理单元不够重视,但NVIDIA则对纹理单元有着独特的经验心得。但随着实际应用的效果让AMD终于在纹理单元上下了功夫。RV770的纹理单元由原来的4组16个增加到了10组40个,增幅非常明显。但整体架构也只是优化性质,并没有进行深入改变。
[HD 4850赏析]
AMD Radeon HD 4850在先进的工艺下很好的控制了发热量和功耗,并采用了单槽散热器。这款显卡定位中端,现在许多品牌已经将价格定在了1399元的。而在前不久刚刚猛降1000元的GeForce 9800GTX却也仍比HD 4850高出400元。
在输出接口上,HD 4850作为中高端产品仍然是提供了爽DVI + S-VIDEO而没有提供HDMI接口。但高请用户不用担心,只要通过DVI转接到HDMI即可HDMI高清视频的输出。而且有UVD2技术作保障,用户大可放心的欣赏高清影片。
去掉散热器HD 4850的裸卡即呈现在我们面前,出了可以观察到核心之外,我们还可以看到这款显卡采用了Qimoda(奇梦达)出品的响应时间为1.0ns的GDDR3显存颗粒。共8颗,共同构成了HD 4850显卡整体的256bit/512M的显存规格。默认核心/显存频率为625/1896MHZ,与公版默认频率相同。
显卡的核心与显存的供电部分采用了2+1式的三相供电模块,由全封闭陶瓷电感搭配高品质的MOS管与以富士通红色固态电容为主的电容群共同作用。而在外接电源的电流净化方面该款HD 4850也是采用了SANYO(三洋)出品的电容与开放式绕磁线圈电感共同搭配工作。
虽然HD 4850的RV770核心中拥有约10亿的晶体管,但是得以于55nm的工艺制程,AMD还是采用了单槽散热器意在凸显先进工艺的优势。但在散热效果上也是采用了12V/4A的风扇来作为主动散热,相对正常1A左右的风扇要高出很多。由此可以看出“艺高人胆大”主要还是在“艺高”二字上,没有优秀的散热器做保证性能在强大的核心也无法运行。
[测试平台及说明]
DirectX 10显卡已经进入第二代,DX10游戏也不断的推陈出新。所以此次测试在DirectX 9方面选择了3DMARK 06和Half Life2作为测试项目。另外选择的3款经典的DX10游戏来对HD 4850的DirectX 10架构进行测试。为了公平起见,所有的测试项目均是选择了控制台Demo和自带的测试Benchmark来进行测试。
采用的AcBel(康舒)LCD POWER SUPPLY(ATX-450CA-AB7FB) 450W电源带有独立LCD面板,通过LCD面板可以及时直接反映出电源的功耗,和负载百分比。在DIY群中这款电源深受好评。本次功耗的测试部分就是利用这款电源的功耗监控来测试。
[3DMARK06测试成绩]
在3DMARK06的整个测试成绩中,HD 4850相较HD 3870有很大幅度的领先优势,但却始终落后于9800GTX的成绩,直到在打开4AA8AF之后2560x1600的高分辨率下HD 4850的成绩才略领先于9800GTX。从整个测试过程来看,这种成绩的落差与驱动有很大关系。因为在3DMARK VANTAGE中HD 4850的领先优势非常明显。
[3DMARK VANTAGE测试成绩]
3DMARK VANTAGE是转么针对DX10架构而开发的,虽然在测试场景方面要少于3DMARK 06以及其之前的版本,但是每个测试场景几乎都在极尽所能的去消耗显卡的性能以求显卡性能的最极致。在测试选择3DMARK VANTAGE也做简化,分别列出Extreme(旗舰级)、High(高端级)、Performance(性能级)和Entry(入门级)四个级别,用户只需要选择所需级别即可。本次测试选择了其中P级别(性能级)和X级别(旗舰级)。
在3DMARK VANTAGE的测试结果中可以看出,HD 4850已经从HD 3870的失败中走出,不但以绝对优势领先与HD 3870,更是超越9800GTX一改颓势。在性能级的测试中HD 4850领先9800GTX约7%的优势,而在旗舰级中领先优势竟然达到了14%。可见AMD的优化架构的成果还是非常喜人的。
[DX9.0C Half Life 2测试成绩]
Half Life2作为DX9时代经典的FPS游戏可谓家喻户晓,但在这项测试中,HD 4850得到与3DMARK06相同的结果。只有在最后打开4AA8AF的高分辨率下才取得了优势。
[DX10失落星球测试成绩]
失落星球作为DX10游戏其表现出的完美画面令人难忘,在这项测试中HD 4850以觉得优势领先与9800GTX,而HD 3870则无法与之相比。并且在抗拒能力越强,分辨率越高的情况下HD 4850的领先优势越大。
[DX10英雄连测试成绩]
作为由DX9补丁而来的DX10游戏,在英雄连的测试中HD 4850再次落后于9800GTX。从实际的游戏测试中可以感觉到AMD并没有即将淘汰的DX9上投入太多的精力。
[DX10冲突世界测试成绩]
冲突世界作为与失落星球相同的纯DX10游戏也同样带给了HD 4850强大的领先优势,AMD的架构优化结果再次得到证实!
[OpenGL雷神战争测试成绩]
OpenGL一直是A卡的弱项,在雷神战争的测试结果再次证明了这一点,不过值得欣慰的是在高抗锯齿高分辨率下,HD 4850与9800GTX已经不相伯仲。
[高清解码CPU占用率测试]
在高清解码测试中HD 4850将会以新一代的UVD技术来向我们展示A卡强悍的解码能力。此次测试选择H2.64编码的《变形金刚》、VC-1编码的《终结者》以及MPEG2编码的《黑鹰计划》。其中H2.64和VC-1都是HD 4850完整硬解码,而对MPEG2编码影片的解码能力就需要从下面的测试中得出结果。
我们可从结果中可以看到,HD 4850在对H2.64和VC-1V的解码中可以说几乎是不占用CPU的使用。而对MPEG2仍然需要CPU的参与工作,这一点稍显失望,但整体UVD2给我们带来结果还是非常令人呢满意的。
[功耗测试对比]
在功耗的测试项目中使用电源自带的功耗表来测量在待机和满负载状态下的整机总体功耗。
图为HD 4850满载功耗
图为HD 4850待机状态下的功耗
图为9800GTX的满负载功耗
图为9800GTX的待机功耗
通过对比我们可以看出HD 4850的待机功耗以及满负载功耗均低于9800GTX,PowerPlay技术发挥了应有的作用,但从待机功耗来说,HD 4850仍没有达到预期的目标。这不免有一些遗憾。
[温度测试]
在室温26度的情况下,HD 4850的待机温度为70°让人诧异,而且核心频率居然达到了500MHz,而满载的核心频率也只有625MHz。从PowerPlay在温度上的控制能力来看不及上一代。
在满负载状态下的温度也不理想,居然达到了85°。不但如次更让人吃惊的是风扇转速只有39%。看来AMD对其4A的风扇也是心有余悸,不惜牺牲性能来换取静音的环境。相信这种情况会在新的完善的驱动和BIOS中得到改善。
[测试总结]
可以说Radeon HD4850的推出让AMD一扫颓势,再次翻身。其性能的大幅度提升的确让吃震惊。HD 4850在性能上已经与9800GTX不相伯仲,且在功耗上优于9800GTX,这样结果可以说是达到我们所期望的目标。而且从市场竞争的角度看,现在AMD已经将HD 4850的整体价格拉到1399元的价格,无疑是将成本颇高的NVIDIA逼到死角,9800GTX在吐血大降1000元之后其价格区间也是在1399元~1799元之间,从性价比的角度说HD4850完胜了9800GTX。
但AMD也存在这一大软肋,就是驱动的支持。随着NVIDIA的55nm工艺的推进,功耗更低、成本更低的新核心必然会对AMD造成打击,如果HD 4850的驱动得不到完善而始终停滞不前,相信过不了08年其地位就将被攻下。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...