正文内容 评论(0)
【P/E核架构解析:小核、超小核的雄起】
12代酷睿以来,Intel处理器一直坚持P+E核的异构混合架构设计,俗称大小核。
很多用户对此颇有微词,坦白来说,大小核在诞生初期确实也存在不少问题,其中之一就是E核性能偏弱。
但是多次迭代升级之后,E核早已不再是弱鸡,可以更灵活地承担更多的计算任务,贡献甚至超过了之前的虚拟超线程,这也是超线程取消的原因之一,等于让E核承担超线程的责任。
另外,LPE核也在最近几代成为标配,从开始的毫无存在感,到如今已经成为主力,完全可以独立应付日常多任务负载。
当然,线程调度管理也日益成熟起来,多种核心的调度分配越来越得心应手,尤其这一代又发生了很大变化,堪称一次飞跃!
可以说,经过多年发展,Intel的大小核战略终于初见成效,P核提升单线程性能和吞吐量,E核提升多线程性能和多任务并行能力,LPE核提升能效,彼此灵活搭配,用在笔记本上可以秒杀AMD,只是说实话,它并不太适合桌面领域,Intel不太应该强硬全面推广。
P、E、LPE核进化史,特别注意Lunar Lake。
当时官方称Lunar Lake由P核、E核组成,但现在修订为P核、LPE核的组合,从而让LPE核一直都在,E核则出现了一次缺席。
如何却分E核、LPE核?除了相对频率高低,更关键的是看三级缓存,E核和P核共享一组三级缓存,LPE则没有三级缓存。
另外,最早的Meteor Lake、最新的Panther Lake都是E核、LPE核采用相同架构,Arrow Lake则是唯一一次E核、LPE架构不同。
Panther Lake再次同时升级了P核、E核架构,代号分别为Cougar Cove、Darkmont,继续在保持高能效的同时提升性能,尤其是优化提升IPC。
同时,新架构都针对18A工艺做了针对性的设计和优化。
虽然说Intel如今的架构基本都和工艺实现了完全解耦,但仍然需要相应的优化才能将二者更好地结合在一起,对于提高性能、能效和良品率都有莫大好处,尤其是18A变化太大,首次引入了RibbonFET、PowerVia。
Cougar Cove P核的架构设计细节没有过多展开,只介绍了一些大概,包括优化PPA(性能功耗与面积)、增强分支预测、更宽调度(横跨分配/重命名/退休单元)、18个执行端口、升级TLB容量达50%、VEC/INT分离乱序执行引擎、AI电源管理、16.67MHz精细频率调节、内存消歧等等。
每个核心具备192KB一级指令缓存、48KB一级数据缓存、最多3MB二级缓存。
分支预测这个大家应该都不陌生了,是影响现代处理器性能的两大关键因素之一(另一个是缓存),是任何一次架构升级都要重点改进的地方,简单讲就是判断程序分支的进行方向。
显然,它的精度和准确率越高,整体的执行效率就越高,性能和能效自然也就越高。
Panther Lake的分支预测单元(BPU)很大程度上还是借鉴了Lunar Lake上的高效设计,并继续深入优化,精度、容量、效率、延迟全面增强。
所谓内存消歧,指的是访存指令数据依赖性是基于内存地址的,在重命名阶段无法确定,只有计算出地址之后才可以确定依赖关系,分为推测性、非推测性,这种机制可以让性能更加可靠。
值得一提的是,16.67MHz频率精度,这个来自于Arrow Lake。
另外,PPT上提到最大18MB共享三级缓存,应该指的是P核、E核集体共享的容量,毕竟二者不分家,也就是这代三级缓存最大就是18MB。
Arrow Lake-H上虽然有24MB,但是有6个P核,所以平均下来这代还是多了一点。
Darkmont E核因为也用在新一代至强Clearwater Forest的上边,所以介绍得很详细,正好也非常有必要让大家多了解了解E/LPE核,它们绝非累赘。
总的来说,这次E核的主要变化包括增强分支预测(寻找指令更迅速)、增强深度队列(并行更好)、增大二级缓存带宽(每时钟周期128字节)、动态预取器控制(不同负载的响应能力更好)、微代码性能提升(支持更多指令)、内存消歧、26个分派端口、AI吞吐量提升,等等。
在前端,Darkmont的主要变化有:更大的64KB一级指令缓存、更宽更深更精准的分支预测、提升50%的指令带宽(3×32-bit)、9宽度的乱序解码器(3×3)。
乱序执行引擎模块,具备8个宽度的分配与16个宽度的退休单元(增加33%)、416个入口的乱序窗口(增加62.5%),以及多达26个执行端口(增加53%)。
执行引擎部分,标量引擎具备8个整数ALU计算单元(增加100%)、3个载入与4个存储AGU端口、3个跳转端口、2个整数存储数据端口。
矢量引擎具备4个矢量与浮点ALU单元(增加100%)、2个矢量与浮点存储数据端口、4个矢量与浮点堆栈。
缓存子系统,二级缓存的缓存带宽从每时钟周期64B翻番为128B,具备3个载入与2个存储单元,而更深的存储与载入缓冲允许128个二级缓存未命中,还有更高级的预取器。
对比Meteor Lake/Arrow Lake里使用的Crestmont,这一代小核的变化可谓全方位的,从前到后整个架构都进行了全面增强。
当然,这里没有对比Lunar Lake里的Skymont,但同样有着全方位的进步。
另外,从这张图上可以清晰地看出,Lunar Lake、Arrow Lake与Panther Lake之间的CPU核心进化关系,这也是前边说Panther Lake是二者合体的原因之一。
基于全新的P核、E核架构,Panther Lake的单线程性能对比Lunar Lake、Arrow Lake有了最多10%的提升,但类似性能下的功耗骤然降低了最多40%,能效之高可见一斑。
多线程方面,Panther Lake对比Lunar Lake,类似功耗下的性能高了最多50%。
Panther Lake对比Arrow Lake,类似性能下的功耗又低了最多30%。
Intel还特别声称,这一代Darkmont E核的性能,相当于13代酷睿Raptor Cove P核在低功耗下的水准,可以用更低的功耗达成同样的性能,因此无论性能还是能效都强得可怕。
所以在下一节你将会看到,LPE都将承担起更多的责任,直接搞定日常多任务负载,更别提E核了。



















