正文内容 评论(0)
Intel称,Nehalem可同时处理128个微指令(micro-op),比Penryn的96个多出三分之一,再加上每个核心都能同时处理两个线程,因而可以实现更强大的指令级并行(ILP)。
Nehalem的其他架构改进还有:更快的缓存访问速度、更强的同步原语性能、每核心新增第二级分支预测、重命名堆栈返回缓存。
不过Nehalem的解码和前端设计没有显著变化,和Core架构一样还是4-issue设计。预计再次变革要等到32nm Sandy Bridge时代。
Nehalem还特别支持双路同步多线程(SMT)技术,和Pentium 4的超线程(HT)技术类似,但由于Nehalem的流水线比NetBurst更短、核心数据获取能力更强,因此Nehalem的多线程性能将得到明显提升。
缓存架构方面,Nehalem相比Penryn可以说是发生了翻天覆地的变化。除了32KB一级指令缓存和32KB一级数据缓存,二级缓存和三级缓存都是新的:每个核心都独自拥有256KB二级缓存,虽然容量比Penryn小,但延迟更低;共享缓存则变成了8MB三级缓存。
这种架构设计与AMD K10 Phenom类似,但其实大不一样:AMD采用了非独占(Exclusive)设计,Intel则是独占(Inclusive)设计,也就是每级缓存都保留来自低级缓存的数据拷贝。
此外Intel还加入了第二级TLB,与第二级分支预测类似。如果第一级TLB里找不到物理、虚拟地址映射,就可以在第二级TLB里寻找,而不必前往缓存,从而保持高性能和低延迟。
接下来看看Nehalem平台设计。桌面方面将集成DDR3内存控制器,最高DDR3-1333,每核心三通道,同时还有更大的带宽和更低的内存延迟。
服务器方面重点是QPI点对点总线设计,每路两个链接,每条链接最高带宽25.6Gb/s。