正文内容 评论(0

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
2021-04-08 21:54:33  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

说到处理器,对于大众用户而言,关注最多的自然是距离最近的桌面、笔记本消费级产品,而作为厂商最新技术的最强代表,服务器、数据中心才是真正的杀场。

3月16日,AMD发布了第三代霄龙7003系列(代号Milan),拥有7nm工艺、Zen3架构、64核心128线程等傲人规格。近几年,AMD在数据中心领域也是不断取得突破,市场份额已经从当初的0.7%,来到了7%之上。

但在这个庞大的市场上,Intel依然是王者一般的存在。虽然单看产品性能参数可能有些不敌,但无论是多达13倍的市场份额领先,还是全面丰富的技术特性,抑或更广阔的生态应用系统,都不是一个数量级。

事实上,这么多年来,Intel至强几乎已经等于服务器、数据中心的代名词,2013年至今累计云端部署超过10亿个核心,云服务商超过800家,发展了三代的可扩展至强累计出货也已超过5000万颗。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

现在,Intel终于带来了第三代至强可扩展平台Ice Lake-SP,再次将自己的优势展现得淋漓尽致,尤其是丰富的产品矩阵。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
本次中国区发布会选在了首钢园三高炉,颇有赛博朋克气息,也是冬奥会场地,往昔与未来在这里交织

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
Intel副总裁兼中国区总经理王锐发表主题演讲

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

新至强拥有全新的10nm制造工艺、最多40核心80线程、全新Sunny Cove CPU架构、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪称Intel至强近年来最大的一次飞跃。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

但是,新至强不是单打独斗,周边围绕着Intel GPU、XPU、FPGA、内存、存储、连接、安全等等各条产品线和技术,从而构成一个软硬结合的完整解决方案。

此前已经陆续发布的傲腾持久内存Pm200系列、傲腾SSD P5800X、闪存SSD D5-P5316/D7-P5510、20万兆以太网卡E810、Agilex FPGA等等,这些都是新至强的得力助手,互相结合大大拓展了整体平台的实力。

按照Intel的说法:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

需要指出的是,去年6月19日发布的Cooper Lake,也是属于第三代至强可扩展家族,区别在于Cooper Lake只用于四路、八路市场,而新的Ice Lake-SP则是针对单路、双路市场。

说起来,Ice Lake-SP可谓命运多舛,发布时间一再延迟,主要是和新上的10nm工艺有关,而且引入了全新架构(Cooper Lake还是14nm和老架构),导致同一家族的两个系列产品间隔了将近10个月。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

当然了,对于数据中心平台而言,正式发布并不是开始,事实上在发布之前,Ice Lake-SP已经出货了20多万颗,拥有了极为丰盛的产品、方案。

王锐也表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”

另外在新的CEO帕特·基因格上任后,Intel已经在大刀阔斧地变革自己,包括加速推进新架构新工艺新产品,强化制造和产能,开放代工和外包。

接下来,我们就从架构技术、性能、生态三个方面,深入了解一下Ice Lake-SP。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
Intel市场营销集团副总裁兼中国区数据中心销售总经理陈葆立展示Ice Lake-SP

一、架构技术:全面翻新、延迟优秀

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel提出,新至强最值得关注的变化,主要有三个方面,一是目前唯一內建AI加速的x86数据中心处理器,二是高级先进的安全解决方案,三是可扩展性、灵活性、可定制性。

接下来的解读中,我们也会逐一涉及这三个方面。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

架构方面,新至强引入了Sunny Cove,也就是轻薄笔记本上Ice Lake-U 10代低功耗酷睿平台的同款(事实上二者处理器代号都是相通的),都是首次结缘10nm,当然这次针对数据中心应用做了调整优化。

至于为何二者发时间错开了一年半,笔记本端去年都已经进化到第二代10nm Tiger Lake,架构也已升级为Willow Cove,你应该懂的。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

简单来说,Sunny Cove架构改进了前端部分,容量更大,分支预测更精准,加宽加深了流水线,结构和执行资源上规模更大,同时增强了TLB、单线程执行、预取等环节,还针对数据中心重点优化了缓存、矢量吞吐等部分。

对比二代可扩展至强Cascade Lake,新至强的最大核心数从28个增加到40个。

对于为何选择40核心这个节点,陈葆立表示,这是根据整个产品迭代所做的一个比较好的平衡,无论是核心数,还是不同工作负载的加速指令、配套的产品,设计芯片需要做很多事情,尤其是把功能做好是最优先的,能够更好地满足客户需要,而不是纯粹选一个核心数。

当然,不同的设计策略也决定了核心数量。AMD霄龙是多个小芯片组成,虽然每个小芯片最多也才8个核心,但可以通过“并联”轻松堆砌更多核心。

Intel则依然坚持单芯片设计,再加上制造工艺、内部架构,天然决定了不容易扩展太多核心,不过Intel也在不断推进各种先进封装技术,未来的芯片规模有望实现突飞猛进。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

每核心缓存一级从32KB增大一半来到48KB,二级从1MB增大四分之一来到1.25MB,三级而从1.375MB小幅增大1.5MB,并支持Hemisphere高性能交错模式。

内存支持从六通道DDR4-2933扩展到了八通道DDR4-3200,并改进内存调度器实现更低的延迟、更高的带宽,而且还有傲腾持久内存200系列这个杀手锏。

处理器间互连通道还是两条或三条UPI总线,但是带宽从10.4GT/s扩大到11.2GT/s,同时首次原生支持PCIe 4.0,通道数也从48条增加到64条。

独家的AVX-512指令集这次增加了大量的新指令,涉及到加解密、压缩解压、安全等各个方面,可扩大应用范围、提升性能,这也是Intel一贯的长项。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel还和新发布的AMD三代霄龙做了正面对比,强调了自己在缓存延迟、内存延迟方面的优势。

缓存延迟方面,新至强的一二级其实比三代霄龙还稍微高一些,但三级就完全不一样了,毕竟一个是单Die,一个是多芯片,不再同一个数量级,尤其是霄龙涉及到跨Die通信、跨处理器的时候,延迟可以达到新至强的两倍甚至五倍。

内存方面,新至强的通道数、频率算是追平对手,但是延迟低得多,而且有独家的傲腾持久内存加持,单颗处理器支持最多4TB DDR4内存,或者4TB DDR4+2TB傲腾内存。

三代霄龙最多支持3TB DDR4,其实也可以搭配傲腾内存,但最大容量仅为1.5TB,而且关乎运行模式、平台联动、指令和应用优化,估计几乎不会有客户会去这么搭配,AMD也坦承一切取决于客户自己的部署。——有点像Thunderbolt雷电技术。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

指令集这个东西,一直都是Intel占据领导地位,这次也新增了大量新指令,包括大数算数(AVX-512整数IFMA)、矢量AES、Caryy-less乘法指令、伽罗华域新指令、SHA-NI、VBMI等等,就不展开讲了,大家只要看看后边的性能提升就明白它们的威力了。

很多时候,一条指令的加入,很容易就可以在特定负载中带来数倍乃至数十倍的性能提升,远不是单纯改进硬件就能媲美的。

Intel技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”

Intel副总裁兼至强处理器与存储事业部总经理Lisa Spelman也强调说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

安全也是数据中心必不可少的关键一环,新至强的一大重点就是支持SGX软件防护扩展技术,它面世已经好几年,这是第一次登陆至强可扩展平台,用于双路系统。

它具备持续增强的安全能力,并通过了数百次的调研和生产部署,可大大缩小系统内的攻击层面,抵御各种攻击途径,保护敏感代码和数据,而且指定位址空间可隔离并处理最多达1TB的代码与数据,满足主流工作负载的需求。

尤为值得一提的是,SGX安全技术是独立于操作系统、硬件配置的,不受软硬件变动的影响和约束,部署更方便,效果也更明显,即便是操作系统、BIOS、驱动、虚拟机都被攻击了,它依然能保护数据。

再结合全内存机密技术、平台固件弹性技术,新至强可以真正解决敏感的数据保护问题。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

说了半天,大家可能会问,这次到底发布了什么产品?真的是相当相当丰盛。

如上图,最左侧一列是此前发布的四路、八路Cooper Lake,中间和右侧是新发布的单路、双路Ice Lake-SP,按照产品线分为铂金、金牌、银牌三个序列(没有了最低端的铜牌)。

按照应用方向,则分别注重单核性能、扩展性能、SGX安全性能、网络优化、云优化、媒体处理优化、长寿命、单路型、液冷散热等等,划分得非常细致,当然不同类型有所交错,有的型号可适用于多个方面。

Intel还为不同版本加上了不同的字母后缀,包括V(SaaS云)、P(IaaS云)、S(512GB SGX)、Q(液冷散热)、Y(SST-PP 2.0)、N(网络/网络虚拟优化)、M(媒体处理优化)、T(长寿命与扩展温度范围)、U(单路)等等,着实有点眼花缭乱。

顶级旗舰是至强铂金8380,40核心80线程,基准频率2.3GHz,全核加速3.0GHz、单核加速3.4GHz,二级缓存50MB,三级缓存60MB,热设计功耗270W,批发价8099美元。

相比之下,上代旗舰至强铂金8280 28核心56线程,频率2.7-4.0GHz,二级缓存28MB,三级缓存38.5MB,热设计功耗205W,批发价10009美元。

这代最强的28核心是至强金牌6348,频率2.6-3.5GHz,二级缓存35MB,三级缓存42MB,热设计功耗235W,价格3072美元。

两相对比,同样核心的时候,新一代频率低了不少,热设计功耗反而高了,这也是这代的普遍趋势,10nm对比炉火纯青的14nm还是差点劲,不过价格降到了只要三成!40核心也比上代28核心便宜了两成!

4/6核心型号取消,改为直接8核心起步,而基准频率最高3.6GHz的至强金牌6334,就是一款8核心,但这已经是极限了,最高加速此时也只有3.7GHz,而热设计功耗达到了165W,上代可是还有多款型号加速到了4.5GHz。

热设计功耗最低的也有105W,包括8核心的至强银牌4309Y、10核心的至强银牌4310T,频率分别为2.8-3.6GHz、2.3-3.4GHz。

另外注意有个特殊的液冷散热型至强铂金8368Q,38核心,频率2.6-3.7GHz,热设计功耗270W,可能是偏向OEM定制。

其他型号就不一一解读了,感兴趣的可以自己慢慢对比。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

二、性能对比:花式吊打竞品

无论技术如何,最终还是要落地到实际性能上,不过Intel也一再强调,性能不是唯一,跑分更不是唯一。

Lisa Spelman表示:“CPU是客户购买决策的关键部分,但是这不是唯一的因素,其中最酷的因素之一就是让客户看到我们提供的整个产品组合。通过使用整个产品组合,客户能完成复杂而重要的购买决策。”

Intel市场营销集团副总裁、中国区数据中心销售总经理陈葆立也说:“我们之前做过一些调查,企业购买一个服务器最关心的是可靠性、稳定性、大规模部署的实力。至强已经有5000万颗的出货量,非常多软件开发商已经有很多版本的优化软件,这对客户来而言是非常大的一个吸引力。对于至强或者是x86的竞争力,我们都非常有信心。

这也是刚才我们反复提到Intel同步在FPGA、内存、硬盘、网络等产品上更新换代的一个注脚,此外也少不了制造、产能、供应方面的优势。如今的Intel,打的是一套组合拳。

当然,性能是不能回避的,Intel也展示了一系列数据,突出了对比上代的巨大提升,以及对比竞品的优势。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

根据Intel给出的数字,Ice Lake-SP三代可扩展至强相比于Cascade Lake二代产品,性能提升的几何平均值是46%,这已经是飞跃一般的数字了,而且部分特定负载的提升幅度还更高,尤其是在AI人工智能、ML机器学习加速的情况下。

比如云负载提升最多达50%,5G网络提升最多62%,IoT物联网提升最多56%,HPC高性能计算提升最多57%,AI提升最多74%(但后边你会发现这个数字其实是很保守的),整数性能提升最多50%,浮点性能提升最多52%,内存带宽提升最多47%,LinPack计算性能提升最多38%,

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel甚至还对比了Skylake(六代酷睿)架构的一代可扩展至强,以及Broadwell(五代酷睿)至强E5 v4系列、Haswell(四代酷睿)至强E5 v3系列的提升幅度,自然是两三倍的变化。

你可能会觉得这样太欺负老平台了,只是为了彰显提升幅度巨大,其实非也。

即便在消费平台,绝大多数人都不会每代跟着升级,间隔一两代甚至三代换新的大有人在,用着五年前老机器的不在少数,追求稳定可靠、在意成本的服务器、数据中心领域就更是如此了,必须有足够让客户心动的变化才会促使更新换代。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

前文说到,Ice Lake-SP是目前唯一內建AI加速的x86数据中心处理器,这方面在特定负载上的提升是极为明显的,比如加密加速开启后可骤升4.2倍,VNNI深度学习学习指令集也能猛涨4.3倍。

机器学习和深度学习这块,也是效果斐然,包括图像识别、图像分类、语言处理,这种在我们日常应用背后默默工作的负载,都能轻松获得40-60%的大幅度提升。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

对比竞品,这种独有的优势更是碾压一般的存在,20项流行AI、ML负载负载相比于AMD顶级的霄龙7763、NVIDIA A100加速卡分别领先多达50%、30%,其中图像识别更是25倍于64核心的霄龙7763。

还有软件方面的广泛合作、深度优化,10倍、100倍的性能变化都不难。

Lisa Spelma直言:“在某些情况下,通过软件优化,我们的处理器的性能会比发布的时候有所提升。对我们来说,关键的改变重点和战略是在我们交付的产品性能基础之上进行部署优化,而不是让我们的客户或者是解决方案团队直接转移到下一代产品的开发上去。”

双路至强铂金8380对比双路霄龙7763,虽然核心数是80个对128个少了三分之一,但性能依然很秀,尤其是AI推理,最高的达到了恐怖的25倍。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

生态方面更不用说了,几乎没有不臣服于Intel平台的,新至强在全球已有超过5000个合作伙伴方案,从云端到边缘端全覆盖。

同时,50多家OEM/ODM伙伴已经准备好了超过250项设计、所有的顶级云服务商都正在或计划部署新至强、超过15家大型网络厂商已经初步或即将部署新至强、超过20家高性能计算厂商已经部署新至强、200多家独立软件供应商和伙伴已经支持SGX安全技术……

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

本次中国区发布会,就有多达42家中国合作伙伴云集,而在发布会上,阿里云、移动云、腾讯云、百度云等国内巨头,也纷纷介绍了自己的新至强平台方案,以及新平台带来的改进和提升。

最后,一图看懂Ice Lake-SP三代可扩展至强的主要亮点:

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q文章纠错

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...