正文内容 评论(0)
四、伊斯坦布尔技术改进
与上海相比,伊斯坦布尔除了增加两个内核外变化并不大,主要有一下四个方面:
- 探测过滤器“HT Assist”:
之前多次介绍过这种探测过滤器技术,下边对比一下就更明白了。
上边是四核心上海简图。CPU 3可能需要CPU 1才有权访问的缓存行(cacheline),但事实上最近的数据在CPU 2的二级缓存里,这时候流程如下:
1、CPU 3向CPU 1请求数据(蓝色实心箭头)
2、CPU 1发出广播,看其它CPU核心谁有所需数据、谁的距离最近(三个红色实心箭头)
3、CPU 3等待问题解决(四个红色空心箭头)
4、请求数据从CPU 2传输给CPU 3(两个蓝色空心箭头)
这种广播式处理方法有两个严重缺点:一是简单的请求就需要十次处理,浪费大量带宽;二是这十次处理给CPU 3上的指令增加了大量延迟。
解决方案就是基于目录的探测式系统,AMD叫作HT Assist。它在每颗处理器上保留1MB三级缓存作为一个目录,跟踪系统其它地方使用的缓存行。这样,虽然三级缓存只剩下了5MB,但省去了大量的探测传输。
上边就是新的六核心伊斯坦布尔简图。还是之前的问题,流程就变成了:
1、CPU 3向CPU 1请求数据(蓝色实心箭头)
2、CPU 1检查三级缓存目录缓存来定位所需数据(鲜红色粗箭头)
3、直接向相关数据最近的CPU 2发送请求(深红色实心箭头)
4、请求数据从CPU 2发送到CPU 3(两个蓝色空心箭头)
处理次数从十次减少到了五次,可大大降低延迟、节省带宽。对于四路系统来说,内存带宽可以多出60%:没有HT Assist是25.5GB/s,有了就可以达到41.5GB/s。
特别指出,HT Assist只对四路、八路系统有用,特别是后者,对双路系统就完全没用了,因为只有两颗处理器。再加上HT Assist还会占用三级缓存,所以在双路系统里应该禁用它,在BIOS里显示为“Probe Filter”。
- X8 ECC:
内存条上的每一颗内存芯片都提供4-bit或8-bit位宽,分别叫作x4和x8,这样组成64-bit位宽就需要16颗x4芯片或8颗x8芯片,所以内存条上至少要有八颗芯片(单面或双面)。伊斯坦布尔的内存控制器现在支持x4和x8两种类型内存条的错误校验(ECC)了。
- 远程电源管理界面“APML”:
提供一个借助P-State电源状态限制来监视、控制平台功耗的界面,无需进入BIOS调教。对于大规模数据中心来说,逐台服务器进入BIOS调整电源管理参数是很恐怖的,APML就是个很方便的解决方法。
服务器系统需要一颗处理器和BMC(管理处理器)来支持APML,软件方面也有一定要求。软硬件都还在研发中,所以伊斯坦布尔发布之初该功能暂不可用。
- 更快的HT总线速度:
上海处理器的HT 3.0总线最高速度为2.2GHz DDR,每方向带宽8.8GB/s,伊斯坦布尔则提高到2.4GHz DDR,也就是9.6GB/s,和Nehalem Xeon低端版本的QPI总线带宽相同。
该功能要等到AMD的Fiorano平台才能完全实现,现在搭配NVIDIA MCP55平台还是限制在2.2GHz DDR。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...