正文内容 评论(0

冷静面对新世代 堆叠显存若干流言解读
2015-01-21 05:00:00  出处:中关村在线   编辑:快科技     评论(0)点击可以复制本篇文章的标题和链接

1每个流言都需要终结者

    只要XX一出,明天XX就要倒闭,XX就要去卖羊肉串儿了!

    想来也是欢乐,虽然这算是个不怎么光彩的事儿,但我们的确会依据自己的理解对某个事物“脑补”出许多不存在的细节,然后按照自己的喜好或者需求将这些脑补广泛地传播出去,这就形成了一个独特的现象——当某个新生事物即将出现时,流言和夸大其词往往会在第一时间冒出来并且以旺盛的生命力茁壮成长。

冷静面对新世代 堆叠显存若干流言解读

    之所以说是欢乐的事儿,是因为这些流言经常光怪陆离,其中相当一部分甚至在其后相当长一个时间里冒充“真相”继续存在下去。在信息传播速度更快的IT界和消费电子领域,这样的现象尤其明显。几乎每个即将出现的新技术都被传得神乎其神,每个新产品都成了中兴的希望或者对手的丧钟。别管什么科技最后都能变成黑科技,甚至换个贴商标的姿势都能撼动竞争对手的根基。在这些流言的夹击之下,本来严肃且意义深远的技术和产品最后也都失去了自己的严肃性,成了一个又一个被人揶揄的笑柄。最近一个躺枪倒霉鬼,就是即将列装的HBM堆叠显存。

冷静面对新世代 堆叠显存若干流言解读 流言遍地时最重要的问题——是真是假?(图片源自网络)

    早在出现之前半年,HBM就成了流言滋生的温床之一,从技术细节到特点,人们无所不用其极的挖掘关于它的传闻并辅以各种佐料进行加工,甚至连求职简历里不甚言尽的只言片语都成了重要的证物。“AMD翻身在此一举”、“‘船长’将凭借堆叠显存击溃一切对手”。“X狗终于可以去死了”……技术本身在喧嚣的空气中仿佛并不重要,让自己讨厌的厂商和拥趸尸骨无存才是HBM值得关注的最大原因。对于显卡史上最重要的节点技术而言,这显然并不公平。

冷静面对新世代 堆叠显存若干流言解读 HBM显存需要被公正的看待

    科技需要理智,每一个值得尊重的产品和技术都不希望自己被人欢愉的杜撰,所以流言得有终结者站出来予以制止。那么到底哪些关于HBM堆叠显存的传闻是流言,哪些又是真实且重要的呢?接下来,就让我们理性的审视HBM堆叠显存,一起去看看那些应该知道的真相吧。

2堆叠显存等于SoC?

    堆叠显存等于SoC?

    关于堆叠显存,最先流传开来的流言便是与封装形式相关的部分。流言的内容相当精彩且令人神往——因为某位先生的简历里写了SoC三个字,所以采用2.5D封装模式的HBM堆叠显存就是跟GPU封装在一起的单芯片了。

    果真如此么?要搞清楚这个留言的真伪,我们首先要明白什么事2.5D封装模式。

一场“站起来”的革命 堆叠内存技术解析 2.5D/3D封装堆叠内存

    与楼房按建筑形式分为板楼和塔楼一样,堆叠内存也会按存在形式不同而被人为的分类,视堆叠方式及位置的不同,堆叠内存体系可以被分为2.5D和3D两种存在形式。如果堆叠内存颗粒以及Base Die被封装在PCB上并通过普通线路与运算核心完成水平互联,这种封装模式就是2.5D,我们即将见到的堆叠内存/显存体系基本上均采用此种形式;如果堆叠内存颗粒及Base Die被直接封装在运算核心上层并通过TSV与核心直接垂直互联,这种封装模式就是3D,SoC等需要更高集成度,同时对能耗及延迟十分敏感的场合将会是这种形式的理想方向。

一场“站起来”的革命 堆叠内存技术解析
不同的封装形式决定了堆叠显存的应用范围

    由此可见,2.5D封装是一种将堆叠显存颗粒置于PCB上的水平封装形式,在2.5D封装形式当中,显存颗粒与GPU芯片是独立且平行存在的。采用2.5D封装形式的HBM显存不可能与GPU封装在同一枚芯片内,即便封装的很近,甚至置于同一个保护盖下,两者也不可能融合成同一枚芯片。只有3D封装形式的堆叠显存,才有可能被纳入到SoC芯片当中与GPU形成一个整体。

    SO~关于堆叠显存的第一条留言被终结了,基于2.5D封装模式的HBM内存属于片外水平封装模式,它不可能也无法与GPU合并成同一枚SoC芯片。至于3D封装模式的HBM会不会出现,那将是另一个话题所要讨论的内容,我们将会在以后的文章中对其进行探讨。

3四千……比特位宽?

    四千……比特位宽?

    在所有关于HBM显存的传言当中,最“惊悚”的莫过于位宽的部分了——在先期版本当中,HBM显存的总位宽将可以达到4096bit这一令人瞠目结舌的数字。在当前这个显存位宽最大512bit的时代,一下子上调八倍的位宽数字冲击性实在太强,以至于大部分人都不相信这是真的。

    那么事实上呢?

一场“站起来”的革命 堆叠内存技术解析 2.5D的HBM解决方案(是的,它们是独立的,没有被封装进SoC芯片内部)

    按照海力士以及AMD公布的试产产品数据,HBM在作为显存出现时可以提供8通道1024bit起跳的显存位宽,搭配适当频率颗粒(初始等效频率在2000~2200MHz左右,约等于GDDR4的水平)时可以提供超过128GB/s,最大可至四倍于此的512GB/s的等效带宽,按照最大带宽增长4倍的情况来看,4096bit位宽并不是一件出人意料的事。

    与之相对的,虽然HMC阵营目前尚未提供具体的技术细节,但根据镁光的样品显示,HMC同样可以以4颗堆叠颗粒的模式来实现480GB/s的等效带宽,这一数字还将继续增长。尽管HMC拥有更高的频率,可以在等效带宽层面抵消位宽造成的影响,但按照这一最终带宽估算,其最大位宽仍将在2048bit以上。

一场“站起来”的革命 堆叠内存技术解析 复杂的垂直互联是堆叠显存实现大并行存储的基础

    简而言之,低频率高位宽是堆叠显存的重要特点。由于堆叠内存体系引入了多层大并行存储和二级内存控制机制,HBM颗粒可以在较低的运行频率下以更高的位宽来获取更高的等效带宽。2048甚至4096bit的总位宽,对于HBM显存而言并不是不可达成的数值。

    所以起码在技术层面上,这条流言是具有真实性的。

4功耗问题再见?

    功耗问题再见?

    天下没有不要钱的午餐,位宽的激增以及带宽的暴涨当然是好事,但其背后会不会对应的带来功耗的激增呢?流言可不这么认为——根据传闻,HBM堆叠显存在提供大带宽的同时还能降低功耗,这是真的么?

    这次的答案很明确:这一流言是真的。

一场“站起来”的革命 堆叠内存技术解析 堆叠显存可以明显降低单位功耗

    根据海力士官方提供的资料,HBM在作为显存出现时不仅可以提供最多高达512GB/S的理论带宽,在此基础上还能实现40%的功耗下降。HMC阵营虽然没有实际的数据,但同样宣称可以在提升带宽的同时大幅降低内存颗粒的总功耗和发热。以官方姿态来看,堆叠显存比现行的普通GDDR5显存颗粒单位功耗更低基本已成定局。

    为什么堆叠内存能够在大幅提升位宽和带宽的同时同样大幅地降低功耗和发热呢?答案就在堆叠内存的基本运作机制上。我们在前页已经提到,无论HBM还是HMC,现有的堆叠内存/显存体系都是在较低的运行频率下以更高的位宽来获取更高的等效带宽,大并行存储的基本特点让堆叠内存可以运行在更低的频率上,这就给颗粒的低整体功耗打下了基础。

一场“站起来”的革命 堆叠内存技术解析 Logic Layer包含的二级存储管理机制是堆叠显存实现大并行存储的基础

    正因为此,HBM显存巧妙的绕开了高性能必然需要高频率的传统定势,实现了低功耗与高性能的统一。我们曾经说过,这种不依赖工艺制程,而是转向以逻辑结构和设计来实现高性能的方式才是半导体领域正确的前进方向。堆叠显存之所以被称为显卡史上至关重要的节点技术进步,最大的原因就在于此。


5HBM比HMC更先进?

    HBM比HMC更先进?

    从时间点上来看,HBM应该会是最先到来的堆叠显存解决方案,海力士声称2015年1月起HBM显存已处在可以供货的状态。HMC阵营的动作相对更慢,起码要到今年第三季度之后才能开始出货相应的显存及内存颗粒。有介于此,HBM比HMC更成熟甚至更先进的流言,也就很自然的在坊间流传开来了。

    那么先发的时间点,与HBM方案的先进性和成熟度是否有必然联系呢?

一场“站起来”的革命 堆叠内存技术解析
拥有Base Die的8通道HBM DRAM颗粒
(图片源自后藤弘茂blog)

    无论HBM还是HMC,在基本结构上都属于原教旨型的2.5D/3D堆叠内存,它们均采用多片DRAM+Base Die/Logic Die垂直堆叠封装的形式,可以以2.5D的形式被用于内存以及显存等场合,也可以以3D的形式与SoC芯片封装在一起。两者的主要区别体现在DRAM运行频率、总位宽、发热以及扩展性层面。相比于HMC,HBM的先期频率和带宽相对较低,但与之相对应的,HBM因此而获得了更低的工作电压,在能耗及发热表现上应该会有值得期待的表现,同时在部署时机上也具有优势。

一场“站起来”的革命 堆叠内存技术解析 镁光提供的HMC解决方案

    在支持情况上,HBM内存目前只有海力士和AMD明确支持,HMC则拥有包括Intel,微软,NVIDIA,ARM,IBM,HP,三星以及镁光等在内的一系列厂商所组成的联盟,海力士也包含在其中。所以以目前的状况来看,HMC可能会在未来统一堆叠内存业界,包括AMD在内的几乎所有人都将会提供支持。

    由此可见,HBM并不比HMC更加成熟或更为先进,但相对于HMC联盟,HBM更加“单纯”和“直接”,相对较低的初始频率以及简单的联盟关系让HBM获得了时间上的优势。

6GPU新时代大幕将启

    新时代需要的不是鼓噪,是理智

    四个关于HBM的流言,我们今天终结了其中的两个,证实了其中的一个,还在技术上确认了一个——由HBM显存的2.5D封装形式和某人简历当中的只言片语推导出其将会与GPU封装在同一颗核心里是不正确的,由部署时间断定先进性同样不科学,所以这两条流言被终结了。HBM显存确实可以以更低的运行频率来获取极低的运行功耗,而4096bit的显存位宽在技术层面也是可以实现的。无论终结还是论证,我们都希望今天的努力能够让您认识一个更加真实的HBM显存。

    毫无疑问,HBM/HMC显存将成为显卡历史上最重要的节点技术进步之一,随着HBM显存产品,也就是AMD新一代旗舰级架构的日益临近,很多过去仅存在于想象当中的意义将会变的具体,我们将会很快亲身体会到堆叠显存为我们的生活带来的变化。

一场“站起来”的革命 堆叠内存技术解析 不同的封装形式能够进一步拓展堆叠内存的应用范围

    首先,HBM显存能够以大并行存储模式大幅提升存储带宽,同时通过减少互联线长明显降低了信号延迟,这将对显存体系的性能提升产生明显的推动作用,GPU的设计将会因此而面临新的机会。由HBM显存带来的更大的显存带宽会给GPU的更高效运算提供保障,而且还将直接改变GPU内部占比巨大的MC单元的设计,这会深刻的影响GPU逻辑结构的研发方向以此为契机,AMD列装HBM显存的第一代架构以及NVIDIA列装3D Memory的Pascal架构,将成为双方划定新一代D线的起点之一(“之一”的原因将会在接下来的文章中予以解析)。GPU的全新时代,将会以此为开启大幕的起点。

    其次,HBM显存可以在同样的PCB面积占用量上实现翻倍甚至数倍的显存容量提升,而且并不会因此而导致功耗及发热的激增,这将大幅提升显存/暂存体系的容量提升速度,同时进一步拉低存储体系的单位成本。游戏制作者将可以更方便地使用更大的高分辨率材质来表现更加完美的视觉效果,这对于需求的刺激将无疑是一大利好。

一场“站起来”的革命 堆叠内存技术解析 应用堆叠NAND颗粒的固态硬盘产品已经问世

    除此之外,得益于容量的激增、性能的提升以及功耗的降低,堆叠显存对HPC领域的影响将前所未有的巨大。GPU节点突破存储墙瓶颈将变得更加容易,这能够直接加速百亿亿次运算目标的达成并促成新的技术发展,对PC领域的中长期影响是无可估量的。

    在经历了多年单纯的速度/频率/信号传输模式发展之后,显存体系终于从2维走向了3维空间,实现了存储模式的本质变化,我们甚至可以认为这是显存体系发展史上的“第一次直立行走”。可以预见的是,一旦堆叠内存正式部署,GPU乃至整个PC业界将再也离不开这项技术了。这种关键的时刻,我们需要的不是鼓噪或者尽情的YY,而是客观且理智地看待这次革命。流言并不会让HBM显存变得更加强大,却能让相信流言的人失望并产生负面情绪,这对如此重要的技术革命显然并不公平。

一场“站起来”的革命 堆叠内存技术解析 丢掉流言,耐心等待新的革命到来吧

    我们在今后的文章中将会进一步详尽的介绍HBM/HMC堆叠显存体系的技术特点,并为您带来关于下一次GPU革命,也就是新一代D线的更多细节。接下来的日子里,就请您忘掉那些不实的流言,尽可能心平气和的迎接那令人期待的未来吧。

    

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#电脑

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...