显示世界的2012：说说这一年的显卡市场--快科技--科技改变未来

正文内容 评论（0）

显示世界的2012：说说这一年的显卡市场

2012-11-16 09:41:08 编辑：上方文Q 评论(0)

早产儿VS足月儿

2002年是一个值得纪念的年份，在这一年里，人们迎来了“理论上可以实现一切视觉效果”的DirectX 9.0，同时也迎来了接下来长达10年、令人眼花缭乱的GPU架构更新。如果我们将逻辑结构的调整而非单纯规模放大和工艺改进作为一代架构进化的标志，那么整个这10年的图形架构历史可以被浓缩成以下两条时间轴。

显示世界的2012：说说这一年的显卡市场
18个月的健康周期让NVIDIA在NV30的失败后推出了扭转局面的NV40

ATI/AMD线：R300（2002年8月）——R420（2004年5月）——R520（2005年11月）——R600（2007年5月）——RV770（2008年7月）——RV870（2009年9月）——Cayman（2010年12月）——Tahiti（2012年1月）。

NVIDIA线：NV30（2002年11月）——NV40（2004年4月）——G80（2006年11月）——GT200（2008年6月）——Fermi（GF100/GF110，2010年3月/2010年11月）——Kepler（2012年3月）。

有意思的现象出现了——ATI/AMD线的GPU架构发展明显经历了两个阶段，在R600之前的ATI时代，其GPU架构的更迭要经历一个18个月左右周期，而R600之后这一周期缩短到了12~14个月。NVIDIA这边则从NV30开始一直维持了18个月左右的研发周期，期间的Fermi架构虽然被分割成了GF100和GF110两款产品发布并造成了时间上的些许混乱，但如果我们取两者的中值也就是2010年6月的话，混乱便会消除。

显示世界的2012：说说这一年的显卡市场
GeForce GTX 480

换句话说，自R600以来，AMD一直在用12~14个月研发的产品，去对抗NVIDIA用18个月甚至更长时间研发出来的产品，这就是所谓小核心策略的组成部分之一。

同时，从R600进入这样的节奏一直到Tahiti为止，AMD每次架构更迭所缩短或者说“缺失”的时间周期，累加在一起刚好是一个NVIDIA架构更迭周期。

AMD的目的是明显的，它希望以更短的研发周期和急促的架构更迭速率来打乱对手的节奏。只要将NVIDIA拖入到自己的节奏中，战略主动便唾手可得，最起码也可以阻滞甚至阻止对手在适当的周期内推出适当的产品，只要连续在节奏上压制对手，打乱对手架构演进的方向和节奏，胜利似乎应该是属于AMD的。

但最终，AMD没有达成自己的目的。

纵观整个架构线，AMD最大的机会来自RV870时代，如果快速先发的RV870能够干扰NVIDIA的节奏、影响Fermi架构的完整度，甚至干脆让NVIDIA放弃Fermi转而以其他手段来同自己进行周旋，那么AMD无疑将从2009年底开始取得主动。可惜，RV870没有达到这样的目的。

尽管从时间线上看，NVIDIA有可能陷入过短时间的慌乱和抉择（从GT200到Fermi“正常”推出时间的间隔略长于18个月），但最终NVIDIA依旧选择了坚持自身固有的架构更迭周期。尽管Fermi先期的GF100在EDA层面存在问题，但其架构本身的逻辑结构设计已经顺利完成并凝固，并未受到来自RV870的影响，而NVIDIA也未被拖入到AMD设置好的节奏中。作为代价，NVIDIA在这一时期用市场策略和成本出血（GeForce GTS 250以及低价GeForce GTX 260+）换取了自身架构的正常更迭。

显示世界的2012：说说这一年的显卡市场
Radeon HD 5870

反观AMD，在没有达成“将NVIDIA拖下水”之战略目的的基础上，RV870的出现打乱了自身的架构演进节奏，直接影响了Cayman、Tahiti甚至是Tahiti之后GPU架构的发展。

科技的进步不是一蹴而就的过程，它需要一个健康、有序同时有规律可循的积累过程，只有充分的时间和资源积累才能创造出切实的进步。即便存在加速发展，这种加速也应该是循序渐进的。18个月这样一个与摩尔定律偶合或者必然相符的周期，就是显卡架构健康发展所必需的周期。挑战这一周期是一种巨大的冒险，成功之后能够获得多少好处无法确定，但如果失败，其结果必定是非常严重的。

好了，别光说大道理了，让我们来看看节奏贸然缩短并且战略目的没有达成的后果吧。

学费早晚要交，不交就毕不了业

我们曾经围绕Tahiti的架构问题提出过很多疑问：Tahiti背负了寄存器的负担，那是谁给了Tahiti寄存器的负担？为什么Tahiti要去背负这样的负担？为什么是现在？我们为什么称其为“AMD的致命伤”而不是“Tahiti的致命伤”？这负担对今后的AMD图形架构发展有什么影响？为什么Kepler不用面对同样的问题？现在，我们可以来回答这些问题了，因为这些问题的答案，都藏在前页我们所总结的架构更迭时间轴以及节奏当中。

同所有技术进步一样，对寄存器的使用也是一个积累和循序渐进的过程，只有经历过落后算法+低密度大寄存器总量的搭配和不断改进，在GPU这样的并行架构中为大量ALU和Thread提供先进的寄存器算法并降低寄存器总量/提高密度的目的才能够达成。双精度浮点运算只是一种数据精度，并不是什么实现数学运算过程的方法或者结构，它不能代表“通用计算”本身，但这种精度却是大量HPC领域应用的基础。想毕业并搭上HPC这辆通往利润的列车，任何人都是要交学费的。为NVIDIA交了学费的架构，是2008年6月的GT200。

显示世界的2012：说说这一年的显卡市场
GT200架构图

在GT200中，NVIDIA展开了一系列大并行度架构吞吐及运算保障体系的研究和实践。NVIDIA为GT200中ALU所配置的寄存器总量达到了1920K，这让它的寄存器密度直接上升到了8K per ALU的等级，而这样的密度，仅能保证GT200获得1/12速的DP性能，NVIDIA甚至为如此大量寄存器带来的晶体管负担而大幅踩过了D线（什么是D线？），并受到了来自可制造性和功耗问题的强力压迫，但正是GT200的牺牲以及18个月以上充分的消化/转化周期，为之后的Fermi架构积累了充足的寄存器使用经验，并让NVIDIA在其后的2个架构更迭周期中分别完成了4K per ALU VS 半速DP以及1.33K per ALU VS 1/3速DP的寄存器密度与双精度运算能力。Kepler之所以能够避免寄存器带来的晶体管负担，正是GT200的努力，以及NVIDIA持续坚定贯彻架构演进路线和步骤没有变更的结果。

同一时期，AMD所要面临的问题与NVIDIA并不相同，R600选择ILP的战略错误需要纠正，市占率下挫的压力需要纾解，因此AMD没有NVIDIA那样充裕的时间和空间去推陈出新。它在GT200同时代所推出的RV770是一款没有对架构进行过多革新，仅是部分弥补了缓冲体系缺陷等设计问题之后大幅放大规模的产物。RV770的选择是正确的，没有温饱做基础，大谈进步显然是苍白的，所以我们先快速的取得资源并收复失地，然后在慢慢迎头赶上也不错。但在RV770取得了市场认可，成功缓和了AMD市占率和利润压力之后呢？

显示世界的2012：说说这一年的显卡市场
Tahiti晶体管负担的起点——RV870

在落后GT200一代之后，AMD本应该在进入DirectX 11的首款架构中完成一系列的任务，包括新的D线的划分（设计更大尺寸的芯片并掌握可制造性信息）、对宏观并行度结构的实践（类似NVIDIA的GPC并行结构）、unified cache等先进多级公共缓冲体系的导入、对DirectX 11中最新出现的compute shader的研究以及寄存器使用模式的深入探索。如果AMD能够在此时出现的架构中完成哪怕上述一半的任务，尤其是开始进行GT200类似的对寄存器使用方式的探索的话，今天的Tahiti都将会免于承受来自大量寄存器所导致的沉重的晶体管压力，而压力转化成性能和效率将让Tahiti变成一款更具竞争力的产品。

但最终，AMD推出的却是几乎没有任何改进，完全可以被视作“支持DirectX 11特性的放大版RV770”的RV870……

AMD在RV870上选择了不对任何特性进行探索和改进，并维持了12个月左右的快速架构更迭周期，这一决定连同时间不足的研发周期让AMD的改进和探索又被推迟了一次。它导致AMD在寄存器算法改进的节奏上落后了NVIDIA两个架构更迭周期，并直接导致了Tahiti在寄存器层面上仅仅达到了介乎于GT200/Fermi架构之间水平的结局。Tahiti今天的命运，它所背负的晶体管负担，以及整个AMD的节奏性致命伤，甚至是几乎已经注定将会继续受困的AMD未来图形及运算架构发展过程，都起源于RV870。

显示世界的2012：说说这一年的显卡市场
AMD欠缺的经验：G80~GF100寄存器密度变迁（图片引自后藤弘茂先生博客）

时间对于任何人来说都是公平的，对于同时研究相似内容的两个实力相当的群体来说，达成相同目的所花费的时间应该是接近的。相比对于NVIDIA和前ATI来说很健康的18个月的研发和架构更迭周期，AMD当前采用的12~14个月的研发周期必然会产生研发不足，这种不足会被转化到技术层面并被不断的积累，所以经由R600至今的积累，AMD已经有了相当于一个产品更迭周期的技术空缺，而RV870的出现又在节奏上再次为AMD带来了整整一个产品更迭周期的节奏问题。用最通俗的话说，就是这一系列的问题让AMD落后了接近2代，并且这种落后会在未来进一步扩散自己的负面影响。所以尽管Tahiti相对于AMD其他架构而言转身转的漂亮，但处在GT200/Fermi之间的寄存器水平“伙同”包括D线在内的诸多事端一起消弭了转身带来的积极意义。

责任编辑：