正文内容 评论(0

江湖门派镇山之宝 五大移动GPU厂商论剑
2013-06-17 15:32:45   编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

后来居上的爆发户——NVIDIA的GeForce ULP

在移动处理器这个江湖里NVIDIA算是后起之秀,前一篇的移动处理器门派划分中我们将其归为“峨嵋派”,虽然开宗立派时间短,但是后来居上,再加上NVIDIA在PC市场的影响力,他们虽然是资历最浅的外来户,但在GPU技术上实力雄厚,前途无量。

Tegra系列从AP2 2500开始到现在也出过四代产品了,其GPU核心也沿用了GeForce的命名,一般称为GeForce ULP(Ultra-low power),超低功耗之意。第一代的Tegra虽然也曾被微软的Zune HD青睐,不过目前来说已经是古董级产品了,NVIDIA官网也将其除名,介绍的只有Tegra 2、Tegra 3和Tegra 4,我们也从他们说起吧。

主力产品:Tegra 2、Tegra 3、Tegra 4/4i

NVIDIA的移动处理器往往是发布最早的,Tegra 2是世界首款双核Cortex-A9架构处理器,Tegra 3是首款四核Cortex-A9处理器,Tgera 4则是发布最早的世界首款四核Cortex-A15处理器,这也算是Tegra系列的一个前期优点吧。

双核的Tegra 2频率为1.0-1.2GHz,Cortex-A9架构,GPU中有8个图形单元,分为4个顶点单元和4个像素单元,运行频率则有300、333及400MHz三个版本,支持OpenGL ES 2.0、OpenVG 1.1及EGL 1.4规范,目前依然有少部分手机在用。

Tegra 3是我们的老朋友了,也是NVIDIA目前的绝对主力,四核Coretx-A9架构,GPU中有12个图形单元,分为4个顶点单元,8个像素单元,运行频率有416MHz及520MHz两种,其中微软Surface RT、Google Nexus 7使用的就是416MHz版本,高端手机和平板中使用的则是520MHz版本。

Tegra 4现在已经发布,不过还没有具体产品上市,只能说是今年下半场的主力。与Tegra 3相比,它的架构、工艺都有升级,制程升级到28nm HPL工艺,CPU核心升级为四核Cortex-A15,GPU单元数量则从前代的12个跃升到了72个,实际运行频率约为672MHz。

Tegra 4完整支持OpenGL ES 2.0,并支持大部分的OpenGL ES 3.0技术,除了fp32浮点。

另外还有一个精简版的Tegra 4i,制程工艺也是28nm,CPU核心为四核Cortex-A9 r4p1改进版,GPU单元减少到60个,不过它整合了LTE基带,功耗和发热更适合手机使用。

架构设计:源自NV4x

江湖门派镇山之宝 五大移动GPU厂商论剑江湖门派镇山之宝 五大移动GPU厂商论剑
Tegra2(左)与Tegra 3(右)的GPU架构

江湖门派镇山之宝 五大移动GPU厂商论剑
Tegra 4i的GPU架构

江湖门派镇山之宝 五大移动GPU厂商论剑
Tegra 4的GPU架构

Anandtech此前针对Tegra 2、3、4的GPU架构做了一番分析。Tegra的核心依然是传统的顶点和像素单元分离设计,即便是新一代的Tegra 4也不例外,并没有使用统一渲染架构。

Tegra 2有一组顶点和一组像素单元,每组各有4个ALU运算单元,Tegra 3的顶点单元不变,增加了一组像素单元,变成4+8形式。Tegra 4的顶点单元有6组,24个ALU单元,像素单元则由4组,每组包含12个ALU单元,24+48的形式组成了72个图形单元。

Tegra 4i则在Tegra 4的基础上砍掉了三组顶点单元,还剩下12个定点单元,48个像素单元不变,总结是60个图形单元,不过砍掉了一半的顶点单元意味着其三角形生成率会大幅下降。

NVIDIA这几代的Tegra处理器的GPU核心架构其实没什么变化,都源于早期的NV4x架构,每个ALU单元每周期可执行4个MAD指令,Tegra 4的顶点单元规模是Tegra 3的6倍,像素单元管线是Tegra 3的2倍,不过每组管线的规模又是Tegra 3的3倍,像素单元的规模总体还是Tegra 3的6倍。

不过Tegra 4的GPU核心也在效能方面做了改进,增加了L2纹理缓存,提升了像素渲染的最大寄存器(从16提高到24)等等,

另外,Tegra 4的672MHz的运行频率也比Tegra 3的520MHz要高,因此理论性能方面的提升如下:

江湖门派镇山之宝 五大移动GPU厂商论剑
Tegra 4相对Tegra 3的GPU性能提升

最后,Tegra 4虽然不能完整支持OpenGL ES 3.0规范,不过其中的大部分技术都是支持的,比如多目标渲染、遮蔽查询等新增技术都有支持。

江湖门派镇山之宝 五大移动GPU厂商论剑
Tegra 4支持OpenGL ES 3.0中的大部分技术规范

Tegra系列GPU优势与不足

1、坚持小核心战略,单位面积性能取胜

与桌面/专业卡中更追求性能的战略不同,NVIDIA在Tegra处理器上反倒谨慎了许多,非常注重控制芯片的核心面积,Tegra 4在规格大幅提升的同时依然将核心面积控制在了80mm2左右,其中GPU核心面积只有10.5mm2,与竞争对手相比小了许多。

江湖门派镇山之宝 五大移动GPU厂商论剑
GPU核心面积都被换算到了等效28nm工艺下

这就给NVIDIA带来一个宣传上的优势——单位面积性能足以秒杀目前的竞争对手,不论是高通的APQ8064还是苹果的A5X、A6X,在这个指标上都被斩落马下。

当然了,Tegra 4的绝对性能也不差,此前官方公布及现场演示都表明其安兔兔得分高达3.6万左右,比目前的跑分天王APQ8064最高2.1万分的成绩高了50%。

2、游戏优化不错,THD专属给力

虽然NVIDIA在PC平台的游戏优化被AMD的Gaming Evolved慢慢超越,但是移动平台是他们的心头肉,跟厂商合作的优化还会继续深入,Tegra系列还有专属的THD游戏,专门为NVIDIA的处理器优化。

此前的一个例子就是EPIC的《史诗城堡》demo,虽然Tegra 3的理论性能被高通APQ064打个落花流水,不过在这个demo测试中Tegra 3的成绩普遍好于APQ8064,更大幅领先三星的Exynos 4412等处理器。

江湖门派镇山之宝 五大移动GPU厂商论剑
没有Tegra 4,你游戏中的妹子都不够靓

Tegra处理器其实还有一个最大的优点,那就是相关设备价格比较便宜。以四核Tegra 3为例,它已经在两千甚至一千元内的四核手机中有过应用,北斗小辣椒、中兴V985、天语大黄蜂等等其中的代表,影驰的999元四核平板使用的也Tegra 3处理器,看来黄总为了出货量也在价格上拼了。

说到Tegra处理器的不足,那就是发布早上市晚的惯性了,很容易让后来者超越。Tegra 3是最早的四核Cortex-A9,但是等到上市铺货的时候别的厂商的28nm四核都来了,Tegra 3性能上不再有优势了,40nm制程的功耗也比别人高。Tegra 4现在也是差不多的情况,1月份发布的,平板和手机要想用上Tegra 4恐怕得到下半年甚至年底了。

另外一个让人揪心的就是功耗了。Tegra 4迟迟不能应用就多少受到了这方面的影响,据分析Tegra 4的TDP功耗高达5W,用在手机和平板中还有很大的难度。公平地说,功耗升高是所有四核Cortex-A15处理器都要面对的问题,但是谁让Tegra 4最早发布呢,它必然第一个承受这个非议。

未来展望及点评

Tegra 4还没有上市,NVIDIA又在前不久的GTC 2013大会上规划好了Tegra 5以及Tegra 6了,与目前的架构相比,后两者的变化可谓革命性的。

江湖门派镇山之宝 五大移动GPU厂商论剑

Tegra 5代号Logan,它将会进入统一渲染时代,使用Kepler核心,OpenGL ES规范上一跃升级为OpenGL 4.3,同时还支持CUDA on ARM,意味着移动处理器上也能用上CUDA加速了,再加上OpengGL 4.3支持,Tegra 5明年有可能成为最先进的移动GPU之一。

回头来看,随着GPU在移动处理器中分量越来越重要,在GPU技术上有先天优势的NVIDIA未来还是值得看好的,目前的Tegra 3和Tegra 4还是小改款,但是明年的Tegra 5意义大不同了,超强的技术规范及GPU通用计算的加入有望大幅提升GPU的应用范围,这在ARM处理器阵营中可算是蝎子尾巴——独一份了。

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#CPU处理器

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...