正文内容 评论(0

AMD推土机处理器架构新细节、性能独家曝光
2010-04-02 13:04:56  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

AMDZone.com声称从AMD服务器与工作站全球业务经理John Fruehe那里独家获悉了有关其下一代处理器架构“推土机”(Bulldozer)的独家资料,包括更详细的架构技术和实际性能。

至于为什么现在公开,John Fruehe表示虽然推土机架构处理器还有一段时间才会发布,但他们对新品信心十足,相信Intel的下一代芯片(Sandy Bridge)也不是对手。

AMD推土机处理器架构新细节、性能独家曝光

一、推土机架构总览

去年11月底的年度分析师会议上,AMD首次公布了推土机架构的一些技术细节之后我们又做了补充分析。今天,AMD提供了更详细的架构图。

AMD推土机处理器架构新细节、性能独家曝光

每一个推土机模块都包括两个整数核心与一个浮点单元,其中每个整数核心有四条完整的整数管线,每条管线内又有一个算术逻辑单元(ALU)和一个地址生成单元(AGU),可以执行x86整数代码、存储指令以及合并执行SSE、AVX整数代码,这也是最大的变化。

浮点单元内有两个128位宽范围的FMAC单元,可以执行新的积和熔加运(FMA)指令或者浮点加法与乘法操作,这样既能降低功耗,也能提高简单操作的吞吐量。据AMD解释,两个FMAC单元既可以被两个核心整数的两个线程并行使用,也能被一个线程循环使用。

每个整数核心内还都有自己的16KB一级缓存和载入存储单元(LSU),其中后者负责管理来自自身所在整数核心以及浮点单元的所有存储请求,每个核心能执行两个在载入和一个存储操作,都是最高128-bit。相比于K10架构,推土机的LSU还能执行数据和地址的推测。

为了减少分支预测的错误和由此造成的拾取操作延迟,分支预测单元也有所改进,能够在每个时钟周期内预测多个分支并发送代码预取。

对性能提升贡献很大的另一个重要特性是各个单元能运行在不同频率上,可以关闭任何闲置的子单元并调整缓存容量(比如将一级缓存从四路16KB关闭成双路8KB),还有一个电源控制器负责跟踪每个子单元的载入和功耗情况,这叫作应用电源管理(APM)。

最后是五级缓存架构:

- 零级缓存:每个线程(或核心)4KB 8路关联;

- 一级缓存:每个核心16KB 4路关联数据缓存,延迟1个循环;每个模块128KB 4路关联;

- 二级缓存:每个模块2MB 8路关联,两个核心共享,全速;

- 三级缓存:所有核心共享8MB,延迟24个循环,每个时钟循环可同时处理最多两个请求;

- 四级缓存:桌面黑盒版以及服务器Opteron都将通过芯片堆栈新增四级缓存,容量32MB或者64MB。

二、新接口新工艺

推土机核心在基于32nm SOI工艺得初期试产中表现得异常可靠,因此AMD正在试验使用28nm Bulk工艺进行小批量生产,但既未确认也未否认最终是否会使用28nm。

AMD推土机处理器架构新细节、性能独家曝光

不过AMD确认,推土机处理器将采用Socket AM3+接口,941个针脚,不同于目前938个针脚的Socket AM3接口,其好处是可以支持DDR3-1866内存和高级节能技术,而且AM3+将是。

AM3+将是AMD的最后一代针脚栅格阵列(PGA)封装,之后将改用触点栅格阵列(LGA),等到Fusion融合处理器降临的时候就会使用LGA AF1新接口,触点多达1591个,支持DisplayPort 1.2标准、PCI-E 3.0规范(32条信道)、四通道内存。

三、智能加速

Intel Core ix家族支持Turbo Boost,AMD Phenom II X6也祭出了Turbo Core,都是多核心智能加速技术,可以自动关闭部分核心,并提高剩余核心的频率。

推土机则提供了两个级别的智能加速,其一是在每个模块内,可以动态调整每条整数管线的能耗,能将其中一个整数核心彻底关闭,并加速另一个整数核。

AMD保证这会带来0.6-1.6GHz不等的模块核心频率提升,幅度30-35%,比如:

2.0GHz->2.6GHz +30%
2.4GHz->2.6GHz +33%
2.8GHz->3.8GHz +35%
3.2GHz->4.2GHz +31%
3.6GHz->4.6GHz +33%
4.0GHz->5.6GHz +30%

第二个级别则是针对整体主频,会在高负载的时候有规律地逐步提高200MHz,直到上限。如果一个模块在最低能耗状态,其他模块就能超频两三个级别。

一旦超过功耗或者散热限制,主频就会自动递减200MHz,直到低于限制。比如:

2.0GHz->3.2GHz +60%
2.4GHz->3.8GHz +58%
2.8GHz->4.4GHz +57%
3.2GHz->4.8GHz +50%
3.6GHz->5.4GHz +50%
4.0GHz->5.8GHz +45%

四、性能实测

终于到了性能测试部分,考察对象包括基于推土机架构的桌面版Zambezi 2.8GHz、Zambezi 3.2GHz、Zambezi BE 3.2GHz(有四级缓存的黑盒版)以及服务器版Interlagos 3.2GHz。柱状图可以说明一切,就不废话了。

AMD推土机处理器架构新细节、性能独家曝光

AMD推土机处理器架构新细节、性能独家曝光

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...