正文内容 评论(0)
甜品级首发,Pitcairn
Pitcairn构架与Tahiti以及Cape Verde同属GCN体系,它拥有212平方毫米的尺寸和28亿晶体管的总规模。定位于旗舰及中端之间的Pitcairn拥有更加合适的规模及芯片面积,同时具备了Tahiti架构的绝大多数技术革新。
基于Pitcairn架构的HD7870规格
Pitcairn拥有20组结构上同Tahiti相同的CU单元,每组CU单元拥有4个SIMD Core,每组SIMD Core包含16个Vector ALU,因此其运算资源总规模为1280个Vector ALU。除了Vector ALU之外,每组CU单元还包含4个Texture Filter Unit和16个Texture Fetch Load/Store Unit,因此Pitcairn拥有80组Texture Arroy。后端方面,Pitcairn的ROP阵列规模与Tahiti相同,均为32个,而显存部分则由4个64bit MC进行管理,构成256bit的显存位宽。不难看出,HD7870的规格是旗舰级的HD7970的62.5%,同时刚好是Cape Verde的整整一倍。
游戏玩家是HD7800的目标用户
由于同属GCN体系,Pitcairn的宏观结构同Tahiti保持了一致,但由于双ACE的宏观对称格局下辖了比Tahiti更少的运算资源,后端的比例也因此而灯下的获得了放大,这些要素配合高频让Pitcairn获得了相当不错的架构效率和性能。在此基础上,Pitcairn的成本控制和功耗表现较之Tahiti也有了更大的提升,无论板卡物料成本还是芯片良率,Pitcairn都具备成为AMD盈利重点的资质。以甜品级架构而言,Pitcairn的结构和性能/功能表现全面完善,是一款相当合格的架构。
削减后的开普勒,GK106
由于NVIDIA在2012年中将产品线的常规架构总量从4个变更到了3个,对抗Pitcairn也就变成了GK104和GK106共同完成的任务。基于开普勒图形构架的GK106核心拥有221平方毫米的芯片面积。与完整规格的GK104相比,GK106运算资源总量从1536个ALU下降到了960个,Texture Filter Unit由128个减少到了80个,构成后端的ROP为原生24个。与ROP相对应的,GK106的MC结构也变成了3个64bit双通道显存控制器,显存位宽192bit。GK106拥有2048/3096MB两种显存容量搭配方案,其中2048MB采用了非对称显存布局体系。
NVIDIA公布的GK106架构
GK106架构具备5组SMX单元,分别居于3个GPC中来组成并行结构。3 GPC的传统结构让它具备了3套前端以及光栅化处理部分,其单周期的几何输出以及光栅化能力为同频旗舰级架构的75%。更好的几何性能、更低的时间成本以及研发成本是它的优势。GK106架构让NVIDIA在下位甜品级以及上位中端产品区间里拥有了更好的产品可操作性,同时在面积和成本空间层面获得了较好的平衡。
我们预期中的完整GK106架构
GK106可以被看做是削减一组GPC之后“再砍一刀”的开普勒。除了规模之外,它的各种结构细部特征均与开普勒架构保持一致。与微观结构进行了一定调整的GCN系列架构不同,开普勒系列架构保持了高度的一致性,它们之间仅有的规模差异表现出了高度的模块化特征,我们甚至可以从一款架构的表现以及特定的规模限定规则来推定出其他所有开普勒架构产品的大致性能。只要规则合理,开普勒系列架构的性能控制会更加容易且具有规律性。
与之相对应的,GCN架构内部的表现就要相对差一些,Pitcairn在宏观结构上虽然保持了与Tahiti的一致,但它的微观结构却存在着与Tahiti架构的不同,而Pitcairn较之Tahiti更加优秀的综合表现,正是这一不同所导致的。
为什么甜品架构更“健康”?
相对于Tahiti高达43亿晶体管的规模以及365平方毫米的核心面积,仅有28亿晶体管规模和212平方毫米的Pitcairn要小上很多。但Pitcairn顶级产品HD7870的绝对性能,却并未因此而落后Tahiti的次级旗舰产品HD7950很多,它与GK104/GK106架构的NVIDIA甜品级产品在性能层面上的竞争也并未落得下风,我们完全可以讲Pitcairn看做是与GK106乃至整个开普勒架构表现相当的架构,其性能功耗比更是超越了整个Tahiti架构。无论从何种角度来讲,Pitcairn都要比Tahiti“健康”很多。是什么让同属GCN架构,采用几乎完全相同技术的两款架构表现出了迥异的结果呢?
答案还是万恶的源头——寄存器。
HD7870满载功耗相当“正常”
Pitcairn的定位在游戏级的甜品市场,它不需要承担旗舰级架构探索和收集经验的负担,只需要利用现有技术更加合理的打造产品即可。所以Pitcairn的双精度浮点运算能力仅有单精度浮点运算能力的1/16,更低的DP性能目标让它卸下了沉重的寄存器负担,进而也就避免了每个ALU多50万晶体管的窘境。
利用这部分晶体管所换来的空间,Pitcairn维持了与Tahiti接近的后端规模,这种等效放大后端/ALU比例的做法强化了Pitcairn在“纯图形”层面的表现,而更少的晶体管总量又让Pitcairn更加远离D线,这使它获得了更好控制的功耗以及挑战更高频率的机会,规模和高频率的交替作用进一步增加了Pitcairn的图形以及综合表现的得分。我们完全可以把Pitcairn看作是AMD版本的开普勒,它不仅在甜品级架构之战中为AMD守住了阵地,更为我们展现了如果Tahiti没有遇到问题时所可能的表现。
Pitcairn特性一览
以GPU这种简单单元大规模并行的逻辑结构而言,决定性能的根本要素其实就是并行度和缓冲机制。大家的ALU结构,尤其是进入到Tahiti/开普勒时代之后的ALU结构和能力基本上都是相当的,谁能为ALU提供更好的缓冲并让其获得更高的复用率,谁就能获得更好的效率。Tahiti和Pitcairn同属GCN,在结构和技术应用上基本相当,唯一造成两者不同命运的重要诱因就是寄存器层面的差异。另外,历史上并不是没有出现过因为寄存器导致的悲剧,名留GPU展史册的NV3X就结结实实的栽在了寄存器使用经验不足上。命运在10年后的今天只是改改演员和台词,就把一幕内容相同的悲喜剧本拿来再一次的重演,这不能不让我们唏嘘。
本文收录在
#显卡
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...