正文内容 评论(0

3倍性能哪里来?开普勒GK110架构探秘
2012-05-17 16:25:09   编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

这两天时值GTC 2012大会,NVIDIA在会上公布了一系列软硬件平台,既有涉及云计算的GeForce GRID、VPX GPU虚拟化技术,也有CUDA 5.0、GPU编程这样针对开发者的应用。当然,对普通玩家来说最主要的是开普勒架构、GK110核心的Tesla K20加速卡。

虽然NVIDIA没有公布,但是我们可以猜测一下,GK110架构肯定也会有对应的消费级GeForce显卡产品,只不过具体命名就有多种可能了:循序渐进的GTX 685还是更直接的下一代GTX 780?考虑到GK110要到第四季度才会发布,到时可能会直面AMD的海岛家族Radeon HD 8000系列,估计命名为GTX 780的可能性更大,这也符合NVIDIA在显卡命名上一贯“激进”的做法。

3倍性能哪里来?GK110 SMX单元升级3.5代

PCGH网站报道称,开普勒架构的两名开发人员Lars Nyland、Stephen Jones花了近一个小时的时间详细讨论了GK110的架构设计。GK110的SMX单元设计虽然跟GK104一样都是192个CUDA核心,但是GK104是第三代SMX架构(前两代是GF100的32个、GF104的48个),而GK110可以哦算是3.5代,其每组SMX单元增加了4个额外的16-block双精度浮点单元,大幅提升了双精度浮点运算能力,DGEMM性能也因此增加,比上一代高出80%以上。 

3倍性能哪里来?GK110 SMX单元升级3.5代

第二个重要的改变是GK110核心中运行的每个线程现在可以分配多达255个32位的寄存器(register),而费米架构只有63个。即便寄存器的总数没有变化,双精度浮点运算也会因此受益。 

3倍性能哪里来?GK110 SMX单元升级3.5代

另外,NVIDIA官方资料上显示的GK110核心有15组SMX单元,但是围绕这个15组SMX的具体争论也没有停止。昨天的资料显示GK110只有15组SMX单元,只不过实际启用的可能是14组,CUDA核心为2688个,而今天Guru3D又爆料称,GK110实际上还是16组SMX单元,官方资料上的15组是屏蔽后的结果,也就是理论上是3072个CUDA核心,实际启用了2880个,NVIDIA直接说15组大概是有些“不好意思”。 

3倍性能哪里来?GK110 SMX单元升级3.5代

其它方面上该介绍的也介绍了,这里就看一下图片报道吧。 

3倍性能哪里来?GK110 SMX单元升级3.5代
格点管理单元

3倍性能哪里来?GK110 SMX单元升级3.5代
开普勒GK110:性能、能效、可编程性

3倍性能哪里来?GK110 SMX单元升级3.5代
从SM到SMX

3倍性能哪里来?GK110 SMX单元升级3.5代
资源均衡的SMX

3倍性能哪里来?GK110 SMX单元升级3.5代
Hyper-Q技术

3倍性能哪里来?GK110 SMX单元升级3.5代

3倍性能哪里来?GK110 SMX单元升级3.5代

3倍性能哪里来?GK110 SMX单元升级3.5代
动态并行

3倍性能哪里来?GK110 SMX单元升级3.5代

3倍性能哪里来?GK110 SMX单元升级3.5代
GeForce GTX 680对应的Quadro 5100专业卡,但显存只有768MB GDDR5

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#NVIDIA

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...