正文内容 评论(0

Tegra K1架构探析:NVIDIA心很野
2014-01-08 15:12:04  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

【GPU:牛X的开普勒】

此前四代Tegra使用的图形核心都叫做GeForce ULP,是基于古老NV40架构而来的,非统一渲染,技术特性也很差,尤其是不支持OpenGL ES 2.0,好在性能还算不错。

Tegra K1上,NVIDIA发狠首次借鉴了桌面级GPU,这在整个行业也是头一遭,而且看上去Tegra未来会一直这么做,比如下代架构麦克斯韦就也会很快进入Tegra。

Tegra K1架构探析:NVIDIA心很野

Tegra、GeForce的开普勒在架构上是差不多的,拥有同样大小的寄存器文件、共享的一级缓存,100% ISA(指令集架构)兼容,这说明开普勒的设计本身就很高明,直接就能拿过来用到移动端。

当然规模小多了,只有一个阵列、192个流处理器(不过叫192核心芯片就太二了),而桌面和笔记本上至少两个阵列、384个流处理器。我们看看笔记本上的GeForce 740M,功耗大约19W,其中包括3W左右的内存IO、PCI-E和其它非GPU模块,如果能再去掉6W的漏电,那就只剩下10W。

两个阵列变成一个,功耗再降一半来到5W,而频率和电压再控制一下(核心频率应该是950MHz),2-3W是非常有可能的。NVIDIA宣称的则是GPU部分低于2W。

曲面细分、几何引擎都没有删减。FP64支持也在,相当于FP32 1/24。纹理单元8个,ROP单元4个,只有PC版的四分之一。

Tegra K1架构探析:NVIDIA心很野

Tegra K1架构探析:NVIDIA心很野

DirectX 11、OpenGL 4.4、OpenGL ES 3.0、CUDA 6.0,这些在桌面上有的,Tegra里一个不缺,号称有史以来最先进的移动GPU并不为过,还添加支持了自适应可伸缩纹理压缩(ATSC)。

Tegra K1架构探析:NVIDIA心很野

192个流处理器×2GFlops浮点性能每核心×950MHz核心频率,Tegra K1的原始性能达到了365GFlops,远远超过Xbox 360、PS3,同时在纹理过滤、内存带宽上也都明显胜出。单从指标上看,Tegra K1已经超越了上代游戏机。

Tegra K1架构探析:NVIDIA心很野

或许是吃了Tegra 4高功耗的亏,NVIDIA这次非常注重能效,包括电路/电源/多层时钟栅极、互连和数据路径优化、空闲/轻负载/高负载管理、二级缓存与压缩、后端处理等等。

桌面上的开普勒拥有众多计算单元和模块,彼此高效互连非常重要,而移动版规模大大缩减,这方面的压力也就轻了很多。

Tegra K1架构探析:NVIDIA心很野

NVIDIA还提出,开普勒的色彩压缩技术可以有效降低内存带宽占用,而且不仅仅是3D游戏里,UI界面渲染同样如此,可节省43-76%。

Tegra K1架构探析:NVIDIA心很野

NVIDIA宣扬的另外一个数据是,在GFXBench 3.0 Manhattan OpenGL ES 3.0测试中,Tegra K1的能效是骁龙800、苹果A7的1.5倍。

Tegra K1架构探析:NVIDIA心很野

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#NVIDIA#CPU处理器

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...