正文内容 评论(0)
18核心36线程、45MB三级缓存、DDR4内存……仅仅是这几个关键字,就足以让整个微处理器行业震撼不已。这就是Intel巨头的实力。
AnandTech第一时间搞到了这个传说中的18核心,以及它的14/12/8核心小弟,然后纠集了一帮其他同类产品,进行了一次决战紫禁之巅。
如果你是I饭,请按下激动的心,慢慢享受。如果你是A饭,承受能力一般的请默默走开。
【测试平台配置:双路顶级对决】
测试平台是三台双路服务器,主角是Intel提供的参考设计方案“Wildcat Pass”,处理器可选四颗:
- Xeon E5-2699 v3 (18核心/45MB/2.3-3.6GHz/145W)
- Xeon E5-2695 v3 (14核心/35MB/2.3-3.3GHz/120W)
- Xeon E5-2667 v3 (8核心/20MB/3.2-3.6GHz/135W)
- Xeon E5-2650L v3 (12核心/30MB/1.8-2.5GHz/65W)
内存自然是DDR4-2133,都来自三星,并分为两种规格:6GB×8 RDIMM、32GB×8 LRDIMM。
第二台是Supermicro 6027R-73DARF,处理器可选三颗,包括两颗Ivy Bridge-EP和一颗Sandy Bridge-EP:
- Xeon E5-2697 v2 (12核心/30MB/2.7-3.5GHz/130W)
- Xeon E5-2680 v2 (10核心/25MB/2.8-3.6GHz/115W)
- Xeon E5-2690 v1 (8核心/20MB/2.9-3.8GHz/135W)
内存是三星16GB×8 DDR3,频率v2 1866MHz、v1 1600MHz。
AMD方面是Supermicro 1022G-URG,配备两颗Opteron 6376,均为8模块16核心,主频2.3-3.2GHz,三级缓存16MB,热设计功耗115W。这并不是AMD最顶级的产品,旗舰是Opteron 6386 SE,也是16核心,但频率达2.8-3.5GHz,热设计功耗140W。
搭配内存是三星8GB×8 DDR3-1600。
硬盘都是两块Intel SSD 710 200GB,但因为控制器问题没有测试RAID模式。处理器节能技术全部开启。
因为是服务器性质的测试,具体原理、影响我们就不过多深究了,只是单纯地看看图表和数据,瞻仰一下18核心的威猛。
双路Xeon E5-2600 v3服务器(Intel参考设计)
IVB-EP 2600 v2、Haswell-EP 2600 v3型号规格对比
【内存带宽、延迟测试】
DDR4的高带宽优势凸显无疑,即便是在2133MHz的起步频率上,都比DDR3-1866增加了15-21%,对比DDR3-1600多了更是几乎50%。
2699 v3、2695 v3火力全开的同时,2667 v3却大失所望,成绩和上代2697 v3完全相同,这主要是它们其实是两种内核,环形总线、内存控制器分布设计不同所致,前者有四条总线、两个内存控制器。
LRDIMM、RDIMM带宽对比,这个我们就不管了。
三级缓存太大了真不见得就是好事儿。2699 v3 45MB的延迟为20-32ns,2690 20MB则只有15-20ns,分别相当于大约90个、60个周期。
但这也不是全部,2667 v3 20MB就只比2690慢一点点,仍然快于2697 v2 30MB。
DDR4-2133的速度也远远不及三级缓存,后者要快三四倍。
另一方面,DDR4-2133的延迟似乎和DDR3-1866差不多,因此如果前者频率超过2400MHz,性能优势将会彻底释放。
【单、多线程性能测试】
Intel这几年很好地把握了核心、频率之间的平衡,结果就是单线程性能变化并不大在只需要一两个核心全速运行的时候,大家拼的除了架构(IPC),还有睿频加速频率。举例来说,2690架构是老了,但是能持续加速到3.8GHz,多出来的200MHz使之基本和2600 v3处于同一档次。
解压缩方面其实在倒退。2690胜在高频率和低延迟,2600 v3则因为三级缓存、内存延迟相对较高而落败。
当然,这也证明Intel的睿频加速技术是很成功的,即便是在18核心和超大容量三级缓存的型号上,对服务器同样大有裨益。
真正体现18核心威力的时候终于到了!除了节能版之外,性能基本与核心数量成正比,18核心2699 v3已经是8核心2690的整整两倍!
Opteron 6376纯粹是打酱油的,空有所谓16个核心,但严格来说只是8模块而已,连人家的8核心或者节能版12核心都远远不如,2690都能完虐之。
【应用性能测试】
Linux内核编译:内核编译器对超多核心的支持一般并不好,但是18核心2699 v3仍然明显领先于14核心的小弟。Haswell架构对整数核心的改进也起到了重要作用,8核心的2667 v3都足以干掉12核心的2697 v2。值得一提的是,前者无法在开启所有核心时进行睿频加速。
相比于SNB-EP,性能在差不多的频率下更是提升了50%。
SAP S&D:18核心及其45MB三级缓存再次称霸,尤其是三级缓存容量对该项目很关键。
Java服务器:2695 v3都能干掉2697 v2,而二者功耗差不多,前者频率更低,性能领先13%后者持平。
Web性能:2600 v3全面领先,但是14/18核心的好处并不大,尤其是后者几乎没带来什么额外提升,原因不在处理器,而在测试程序不足:一是当前测试网站数据库太小,二是还需要进一步调整网站以适应更多核心。
OpenFoam高性能计算:因为是AVX代码,单线程性能完全看频率,多线程下18核心就只能仰视了,不过频率仍然重要,2667 v3就因此追平了2695 v3。
【功耗、能耗比测试】
待机功耗:2600 v3系列标准版都在100W左右,尤其是18核心的2699 v3,如此大的芯片竟然可以控制得如此之好,而且别忘了工艺和上代同为22nm,并没有变。32nm 2690就不说了,核心最少,功耗最高。
100ms响应功耗:2600 v3系列尽管性能强悍很多,代价也不菲,功耗非常突出。
Web能耗比:2695 v3凭借足够多的核心、足够高的加速频率,再次赢得掌声,能效很高。18核心的因为耗能太多,效率反而下来了。2650L v3作为节能版确实名副其实,12核心65W还是很不错的。
高性能计算功耗:2699 v3电老虎再次发威,峰值功耗比待机时高了几乎450W!如果风扇算100W,那么每路单颗处理器就是175W,即便这样的测量并不精确,还包括主板供电功耗,但仍然相当相当耗电。
高性能计算总能耗:低功耗版的2650L v3又赢了,而且赢得很轻松。18核心虽然耗电大,但毕竟性能也摆在那里,完成任务所需要的能量并不是很多。32nm SNB-EP 2690彻底老了。
【小结】
测试了这么多东西,究竟谁赢了?都没有。根据不同的环境、复杂,赢家也完全不同,多核心、高频率的区分也不再那么泾渭分明。
比如说内核编译测试通常喜欢高频率,但是18/14核心表现也不差,因为睿频技术越来越成熟了,完全可以弥补原始主频偏低的劣势。
E5-2695 v3非常值得关注。在高端领域,它的核心、频率、功耗比较均衡,耗电不是特别猛,但性能很出色,在几乎每个整数应用里都能处于领先地位。
E5-2650L v3也是个明星,它是名副其实的节能版,同时性能也不差,能耗比很高。
2699 v3就是个超级电老虎了,比以前的旗舰更耗电,145W的热设计功耗果然不是盖的。这再次证明,一旦超过130W,就是噩梦。
AMD?我们只能祈祷它撑过这两年,所谓的全新架构能真正有点起色,别再来个推土机第二。
延伸阅读——
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...