正文内容 评论(0)
编者注:本文源自Xbitlabs,链接在此。
AMD和Intel的六核处理器已经在服务器市场销售多时,预计明年都会进入桌面市场。这几年来的CPU竞争已从单纯的频率之争转变为核心架构、核心数目的比拼,双核已经普及,四核也日益受宠,未来还会有六核、八核甚至十六核,核心数的增多为PC应用带来了前所未有的性能提升,当然也带来了严重的挑战,如何为多核心优化成了软件、游戏厂商的一大任务。Xbitlabs网站找到了一款支持单路Socket F插槽的主板对AMD的伊斯坦布尔处理器做了一番测试,借此预估了明年将要进军桌面的Thuban六核处理器的性能表现。
笔者将其编译过来希望读者能够一览六核处理器的优势与不足,本文内容忠于原文,但是力有不逮,错误之外在所难免,欢迎读者指正,也希望能共同讨论多核处理器对日后电脑应用的影响。
自从2005年Intel推出第一款双核处理器以来,多核处理器已经逐步深入到PC应用中的各个角落,两大CPU厂商Intel和AMD的市场推广努力并没有白费,如今无论是硬件厂商还是软件厂商都已接受了这样的观念:多核心是提高性能的最佳方式之一。在过去的2009上半年中,这一趋势愈发明显,双核CPU得到了大面积的普及,四核处理器也在逐步靠近主流价位,不过多核之路显然还没有终点,Intel的六核Xeon处理器已经上市,桌面级的Gulftown也已浮出水面,AMD的伊斯坦布尔处理器早已销售多时,预计明年上半年也会进入桌面市场。虽然实际应用中并非所有程序都能实现多线程并行处理,但是以多媒体创建、编辑为代表的日常应用已经表露出对多核心处理器的强烈需求,超多核处理器已经初具登陆桌面市场的需求。
实际上限制四核以上CPU进入PC市场的因素只有一个,那就是当前的半导体工艺生产多核心处理器成本太高以至于个人用户难以接受。尽管代价高昂,四核处理器走下神坛被六核乃至更多核心的处理器所取代是不可避免的。对价格不甚敏感的高性能服务器处理器市场上早已出现了六核处理器的身影,其中Intel采用Core 2 Duo架构的Xeon六核处理器已经上市,六核处理器的另一个代表就是AMD的伊斯坦布尔,这款处理器同样基于45nm工艺,核心架构类似于桌面的Phenom II系列。伴随随着六核处理器的价格逐渐降低,六核处理器最终也会扩展至桌面市场。
六核处理器走向桌面并不是我们的臆想,之前Intel公布的路线图中证实代号Gulftown的六核处理器会在2010年第二季度问世,它将沿用i7 900系列的LGA1366针脚设计,支持现有的X58主板,核心是采用32nm工艺的Westmere架构。AMD方面也有类似的计划,在2011年推进32nm工艺之前先行发布桌面级六核处理器,时间也在明年第二季度,根据现有消息显示这款处理器代号为Thuban,核心架构源于服务器市场的伊斯坦布尔处理器。
如果你不想等到明年而是现在就要享受六核处理器的威力,最困难的倒不是伊斯坦布尔处理器的价钱(伊斯坦布尔是多路设计,2400系列是两个处理器搭配销售-编者注),而是找到一款支持单路处理器、带有PCE-E X16插槽的主板。我们评测室很幸运地找到一款支持单路Socket F接口的主板,我们也因此搭建了一套六核平台,藉此检验一下六核处理器在处理桌面应用中的性能。
AMD现有的四核处理器尚不能与Intel i7相抗衡,而Thuban有将承担起冲击Intel旗舰地位的秘密武器,所以我们也希望这套平拍能模拟未来的Thuban处理器的性能。据以往的测试发现,Intel i7处理器凭借Hyper-Thread(超线程)技术在多线程并行计算中拥有很大优势,而Thuban处理器可以用增加的两个物理核心虚拟出四个线程,这样一来i7与Thuban的对决会更加激烈。
[2.探究服务器处理器与桌面处理器的渊源]在成功引入45nm工艺之后,AMD已经藉此生产出数款桌面级多核处理器,比如我们已经熟知的代号Deneb的Phenom II X4、代号Propus的Athlon II X4以及Regor代号的Athon II X2等CPU。AMD的桌面处理器多是同架构的服务器处理器改进而来,这两者在技术规格上基本相同,拥有相似的HT总线、集成内存控制器以及内存规格,“Shanghai”核心的Opteron(Optron) 2300和8300就与桌面级的Deneb核心架构基本相同(不同的是接口等外部架构)。
不过六核处理器“伊斯坦布尔”的问世打破了这一规则,因为桌面领域并没有相应的六核处理器。即使伊斯坦布尔处理器没有脱离Deneb的架构范畴,但是核心增多导致二者的区别已经并非HT总线、内存控制器数量多少的问题了。拥有六个核心的伊斯坦布尔处理器起价达到了¥450美元,成为目前最贵的Opteron处理器,其惊人的规格参数如下:核心面积达到了346 mm2,比shanghai核心高出1/3,晶体管数量为9.04个,每个核心的L2缓存为512KB,共享6MB L3缓存。
伊斯坦布尔拥有三条HT总线,支持双通道DDR2-800/667/533 ECC内存,为了保证现有SocketF平台的兼容性,非ECC内存同样支持。值得一提的是,向下兼容性一直是AMD处理器的一个优势(桌面级和服务器级都是如此),三年前问世的Socket F平台通过升级BIOS一样可以兼容现在的六核伊斯坦布尔处理器。
相比前代服务器处理器,六核伊斯坦布尔拥有一项明显的改进―HT Assist(HT助手)以减少内存操作时CPU的等待时间。以往的多路处理器系统中,每个处理器都会包含一份其他处理器内存中的数据拷贝,处理器一旦有数据存取操作就会同时向其他处理器发出请求同步其他处理器中数据备份,在随着处理器核心数量的增多,这样的操作将会造成大量的延迟(一个处理器存取数据,其他处理器就要等待这一操作完成)。在伊斯坦布尔处理器的L3缓存中,有一个单独区域保存着所有处理器缓存数据的索引,再有类似操作时所有处理器都可以同步得知。HT Assist技术可以降低多路处理器之间同步数据造成的等待时间,这在四路乃至八路系统上很有实用意义。
如果用作单路CPU平台,伊斯坦布尔处理器或许并不需要HT Assist和三路HT总线,抛开核心数量的不同,伊斯坦布尔处理器相比Shanghai/deneb处理器依然拥有特定的优势。首先,伊斯坦布尔的HT总线频率达到了2.4GHz,比桌面平台最高的2.0GHz还要高,第二点则是内部的L3缓存的频率从原来的2GHz小幅超频到2.2GHz。
核心数量的增多并非没有代价,六核处理器的频率明显低于四核产品,伊斯坦布尔中最顶级的型号频率为2.8GHz(桌面的X4 965已经达到了3.4GHz),为此AMD还推出了平均功耗55W的HE低功耗版伊斯坦布尔处理器,标准版六核处理器在2.6GHz的频率下平均功耗在75W。由于频率比顶级四核Phenom II X4低30%,六核处理器在适合并行处理器的场合也未对四核产品表现出明显优势,这也许是AMD并不急于推出桌面六核处理器的原因之一。
我们今天的测试就是一款频率2.6GHz的六核Opteron2435,下表列出的是这款CPU的具体参数:
Opteron2435是市售六核处理器中的顶级型号(后来发布过105W功耗的2439频率为2.8GHz),售价为1000美元,明年如果进入桌面市场会更便宜些。由于定位服务器市场,Opteron2435沿用了Socket F接口,拥有1207个LGA针脚,普通桌面处理器的接口多为AM2+/AM3,所以看起来会有很大不同。
除了DDR2内存、更高的HT总线与NB总线频率之外,六核伊斯坦布尔处理器更引人注目的是它的热功耗仅有75W,这一数值要比四核CPU标准的125W-140W减少近一半,这实际上是AMD结合服务器处理器的特点深思熟虑的结果,第一:服务器处理器使用了更低的工作电压(标准Phenom II处理器的工作电压为1.35V,个别型号如速龙II X2 620在1.39-1.4V左右,伊斯坦布尔的工作电压为1.3V-编者注),考虑到刀片服务器的空间,安装高性能散热器是一件很困难的事,降低电压则可以有效降低发热。第二点则是AMD在标注服务器处理器功耗的时候改变了方法,服务器CPU引入了ACP(Average CPU Powe,平均处理器功耗)指标,它与传统的TDP功耗(Thermal Design Power,热设计功耗,可以简单认为是处理器的最大功耗)有所不同,总结来说就是六核伊斯坦布尔处理器的平均功耗要比Phenom II处理器低,具体低多少则没有准确数值,因为我们无法准确衡量ACP功耗和TDP功耗的数值。
服务器极高的内部带宽需要使得处理器需要具备多条HT总线,针脚数也随之增多,Socket F插槽拥有1207个针脚,桌面处理器只支持一路HT总线,针脚数可以大幅减少,AM2+是940针,AM3接口则是938针。此外,伊斯坦布尔至少也是双路应用,主板厂商也很少设计生产单路插槽的产品,这些都是我们寻找合适的主板平台中遇到的挑战之一。最终我们幸运地找到了一款微星生产的单路主板―K9NU Speedster,这款主板原本是为单路服务器、高性能工作站所设计,此次机缘巧合成为我们的测试平台。
需要注意的是,这款主板是2007年设计的,并不是最新的产品,受益于好龙处理器的向下兼容特性,简单升级一下BIOS即可正常使用最新的伊斯坦布尔处理器。主板使用的芯片组来自于Nvidia的nForce 3400 MCP,规格与当时的nForce 570 SLI相近,主板也因此提供了两条PCI-E X16 1.1插槽,可以X8+X8的方式组建双卡SLI。
除了显卡SLI功能外,K9NU主板的其他特色依然显示出这是一款服务器/工作站专用主板,最明显的一点就是集成16MB显存的XGI Z7芯片,这使得主板无需安装独显即可使用。主板本身也没有集成声卡,但是集成了千兆网卡,通过Renesas(瑞萨科技) H8S/2168V控制器可进行远程管理。
另外比较显眼的则是主板的8条DDR2内存槽,仅支持Registered DIMM(寄存型内存),但不限制ECC支持与否,每条内存槽最大支持4GB容量,内存最大支持为32GB。
有一点需要注意的是,2006年发布的nForce 3400芯片组对最新产品的支持并不完美,举例来说,伊斯坦布尔处理器2.4GHz 的HT总线频率实际中或许只能运行在1.0GHz,不过单路处理器数据交换量需求远不如多路处理器,这些影响对总体性能的影响较小。还有一个不容忽视的影响则是主板的BIOS设置问题,这款主板上并没有桌面级主板上常用的BIOS超频选项,所以我们的全部测试也都是在默认模式完成,并没有对处理器进行超频。
[4.测试平台配置及说明]由于桌面平台还是首次拥有四核以上的超多核心,我们第一部分的测试就聚焦于核心数量不同带来的差异,所以我们将与之对比的Phenom II X4处理器降频,保证两者是同样的始终频率。
第二部分的测试主要是探究六核Opteron2435与桌面四核处理器的性能对比,对比的是Phenom II X4产品线以及LGA1366接口、支持超线程技术的i7处理器。
最终的测试平台配置如下:
注:为了直观对比,测试平台的表格重做,原文只列出文字。
下图是测试平台的CPU-Z截图:
[5.六核优势知多少]目前四核平台尚未得到普及,多数用户依然将双核处理器作为性价比首选,从实际情况来看也确实如此。现在多数程序尤其是为数众多的游戏尚不能完全发挥四核处理器的威力,这也是许多用户拒绝多核处理器的理由。从这一点来看,六核处理器的前景似乎颇有争议,即使正式上市六核处理器依然要寻找合适的定位。
从另一面来看,现在也有许多对多核心运算需求迫切的日常应用,比如多媒体创建与处理,而且这些领域的软件对多核心处理器优化的比较好,可以充分发挥多核的优势,软件的优化也同样推动了多核CPU的发展,越来越多的电脑用户开始使用多核CPU进行视频处理器。
在横向对比六核与四核处理器的性能差异之前,我们将四核处理器的频率都降至六核处理器的水平,排除频率的影响之后可以单一测试因核心数目增加而导致的性能差异。换句话说,我们将测试用的频率相同的Phenom II 910与伊斯坦布尔做对比,为了保证两台平台中除CPU之外的条件尽量相同,我们将Phenom II 91平台的内存频率降至667MHz,特别测试中也显示只要同为667MHz频率,Socket F与AM2+平台的内存性能相同,而Registered或者Unbuffered类型内存并不影响内存性能。
总体来看,六核处理器相比四核处理器确拥有一定的性能提升,在视频处理、编码以及渲染等方面优势还颇为明显,在Futurmark的测试软件中同样也有较大提升,增加CPU核心数在某些场合很有意义。不幸的是,游戏玩家对六核处理器可能没什么兴趣,大多数游戏性能并没有表现出相应的提高,甚至还略有下降,仅有个别游戏如《生化危机5》能从多核心中受益。
仅仅通过上面表格中的测试数据还不能对多核心的性能提升下定论,此处的测试主要反映的是核心数量不同带来的性能差异,没有考虑频率的影响。事实上由于工艺的限制,六核处理器的频率通常要低于四核产品,高频的四核产品的性能很容易就超过六核处理器,这样下来六核处理器的吸引力就没有那么大了。在这一点上,Intel公司的做法或许更明智,他们将使用下一代32nm工艺生产高频率的桌面级六核处理器,希望借助新工艺来提高六核处理器的频率进而弥补可能的性能不足。
以上这些是第一部分的测试,下面的则是不加限制的伊斯坦布尔与Phenom II X4 965的性能测试。
[6.基准性能测试之PCMark Vantage]为了评估系统的综合性能,测试用PCMark Vantage来模拟各种日常应用。
测试结果显示Opteron 2435败给了X4 965和i7 920,得出这个结果并非意外,PCMARK Vantage软件模拟的是办公、娱乐、网络浏览等日常应用,这类应用对多线程的优化不佳,尚不能发挥多核的威力,在这一点上六核处理器并不适宜作为桌面平台使用。
3DMark Vantage是一款基准3D测试软件,与PCMark不同的是它的CPU测试部分为并行处理做了优化。
高度优化的3DMark Vantage测试结果与PCMark Vantage有明显不同,游戏应用中通常包含大量物理效果与AI计算,这些都对CPU的计算能力提出了更高要求,所以2.4-2.6GHz的六核处理器可以战胜3.4GHz的X4 965。对比同样支持超线程技术的i7-920,六核伊斯坦布尔依然没有动摇i7的王者地位,除了核心数,先进的核心架构同样非常重要。
[8.视频编码、转码及处理测试]视频处理测试是本次评测中最有意义的一部分,视频处理在家庭娱乐中越来越普遍,同时这些应用也极度消耗资源,对处理器的要求颇高。
视频编码测试中伊斯坦布尔处理器的表现优异,即使是频率较低的opteron也能与支持Turbo加速、八线程的i7-920几近平手。
在使用Cyberlink Media Show 5进行转码测试的时候(将电影《2012》的高清预告片转码为youtube常用的视频格式),六核处理器并没有表现出多少优势,频率更高的X4 965的转码速度都要比六核处理器要快。
在非线性视频编辑软件如Adobe Premiere Pro中六核处理器也可以派上用场,两款opteron处理器都要比高频的X4 965要快上一些。但是与i7-920相比两者都处于下风,增加的两个核心并没有发挥出应有的优势,Phenom在架构上的不足或许要等到下一代Bulldozer(推土机)上才能有所改观。
[9.三维渲染测试]三维渲染也是一个适合并行计算的领域,AMD的六核处理器便因此轻松战胜自家的高频四核处理器。与i7-920的对比仍然没有逃过败局,由此推断明年双方的六核处理器正式登场的时候,性能测试大战的结果似乎是明摆着的了。
[10.其他应用测试]PhotoShop的测试结果显示多核心处理器在此处没有发挥太大作用,图像处理过程中大多数操作都只是单线程,在此情况频率与架构才是决定因素。
文件压缩测试中,六核处理器也比频率更高的四核有优势,虽然差别较小。与之前的结果一样,AMD的六核处理器依然大幅落后于i7-920,这与系统较弱的内存性能也有一定关系。六核平台配备的是DDR2-667内存,明年六核Thuban系统发布的时候将会配备DDR3内存,对系统性能会有改善。
Folding@Home是一个分布式并行计算项目,六核心的Opteron 2435表现良好,整体表现已与i7-920相近。
[11.游戏性能测试]游戏性能测试之所以放到最后一部分是因为这方面的测试结果并没有值得期待的,大多数游戏并没有为多核处理器优化,另外一个原因则是Socket F平台的DDR2 667内存已经大大落后于现在的主流配置,这对处理器的性能发挥有一定的影响。
虽然结果早有预期,《生化危机5》依然是个亮点,频率较低的opteron 2435的帧数要好过3.4GHz的X4 965,这个结果至少证明了六核处理器内在的潜力。当然了,在大多数游戏中,仍然是频率越高性能越好。
[12.功耗测试]AMD宣称伊斯坦布尔处理器拥有更低的ACP平均功耗,性能每瓦比更高,为此我们也测试了所有参测平台的实际功耗,以下图表显示的就是测试平台的测试结果(不含显示器)。测试使用64位Linx 0.6.3使系统满载,而且为确保待机功耗测试结果更精确,我们开启了系统自带的节能技术,如C1E、CNQ 3.0以及Intel增强型SpeedStep。有一点需要注意,K9NU主板不支持处理器与北桥独立供电,所以Socket F平台的待机功耗因此略高。
待机功耗上,伊斯坦布尔要比AM2平台高一些,因为2006年推出的Nvidia nForce Professional 3400芯片组功耗较高(受限于当时的工艺及技术―编者注),不过即使有这些不利因素限制,六核平台的待机功耗仍要比i7-920低一些。
在拷机满载状态下,伊斯坦布尔表现出了惊人的能耗比,伊斯坦布尔在大多数多线程应用中胜出X4 965,而满载功耗要大幅低于X4 965。与i7-920相比其在功耗方面也更低,当然i7-920的性能更高,双方各有胜负。
为了准确得到单一处理器的实际功耗,我们单独测试了12V供电电路的功耗情况,为保证数据准确,主板以及主板供电线上都加装来电压调节器以保证电压恒定。
从测试结果来看,运行在2.4-2.6GHz的六核Opteron处理器的实际功耗确实要比3.4GHz的X4 965少三分之一。
除了CPU核心的功耗之外,考查主板的功耗也很有代表性,因为只有CPU的核心是通过12V供电的,CPU内部的其他部分如PCIE、HT(或QPI)等依然是通过24pin接口提供电力。测试的结果依然是六核伊斯坦布尔处理器表现优异,功耗水平要低于i7-920。由此看来,AMD的六核处理器每瓦性能比确实有了提高,或许将成为AMD出奇制胜的主要法宝。
[13.总结]虽然AMD和Intel的六核处理器要等到明年第二季度才会正式发布,消费者就可以利用目前已有的配件搭建一套六核平台,AMD的伊斯坦布尔处理器已经上市销售了半年了,市场也有针对工作站而推出的单路Socket F主板,这也为消费者配置六核平台提供了可能,我们的测试平台也是通过这个方式组建的。
购买买到六核处理器不是问题,重要的是这样的平台有没有实用意义。现在销售的六核伊斯坦布尔处理器频率要比桌面四核产品低,而且只能支持Socket F插槽和Registered DDR2 667内存,规格上要比当前主流平台不符。当然,六核产品也不是无用武之地,2.6GHz频率下的Opteron已经可以在多媒体创建、编辑,CAD以及3D渲染等多线程应用中明显超出频率更高的Phenom II X4处理器,同时在功耗方面表现优异。总体来说,六核处理器在多数日常应用表现不及Phenom II X4 965,但它仍是一种具备高能效比的多线程应用解决方案。
我们也不能因此高估桌面六核处理器的意义,它在多线程应用中表现良好,但在更具代表性的日常办公、游戏应用中尚不能完全发挥实力,相关应用有待软件厂商的优化,在此之前AMD和Intel双方不急于推出桌面六核处理器。
除了实用价值之外,时间因素也不可忽视。AMD和Intel正式发布桌面六核处理器的时间都是2010年第二季度,时间最多只有8个月,在这短短的时间内说服软件提供商为六核处理器提供优化几乎是不可能完成的事,而缺少了软件的优化支持,六核处理器只能是一个噱头。相比之下AMD的处境更为尴尬,频率较低的六核处理器在多数应用中相比四核产品并没有优势(部分测试还出现了倒退),Intel可以用先进的32nm生产出频率更高的六核Gulftown处理器弥补软件上的不足,AMD在这方面要慢一拍,Thuban依旧使用45nm工艺,继续提升频率较为困难,在市场竞争中AMD只有在性价比上找寻突破口。
正式发布时希望AMD能把Thuban处理器频率提至3.0GHz以上,不然的话Thuban不仅不能匹敌对手的六核处理器,面对支持超线程技术的i7也不一定有胜算。此外,AMD目前还缺少类似Turbo boost这样的自动超频技术以应对不支持多线程的运算,毕竟多数情况下频率要比核心数更重要。总之,六核Thuaban处理器不会帮助AMD登顶性能王座,但是凭借更低的功耗以及更低的价格Thuban依然会是一款很有竞争力的顶级处理器。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...