江湖门派镇山之宝五大移动GPU厂商论剑--快科技--科技改变未来

正文内容 评论（0）

江湖门派镇山之宝五大移动GPU厂商论剑

2013-06-17 15:32:45 编辑：上方文Q 评论(0)

后来居上的爆发户——NVIDIA的GeForce ULP

在移动处理器这个江湖里NVIDIA算是后起之秀，前一篇的移动处理器门派划分中我们将其归为“峨嵋派”，虽然开宗立派时间短，但是后来居上，再加上NVIDIA在PC市场的影响力，他们虽然是资历最浅的外来户，但在GPU技术上实力雄厚，前途无量。

Tegra系列从AP2 2500开始到现在也出过四代产品了，其GPU核心也沿用了GeForce的命名，一般称为GeForce ULP(Ultra-low power)，超低功耗之意。第一代的Tegra虽然也曾被微软的Zune HD青睐，不过目前来说已经是古董级产品了，NVIDIA官网也将其除名，介绍的只有Tegra 2、Tegra 3和Tegra 4，我们也从他们说起吧。

主力产品：Tegra 2、Tegra 3、Tegra 4/4i

NVIDIA的移动处理器往往是发布最早的，Tegra 2是世界首款双核Cortex-A9架构处理器，Tegra 3是首款四核Cortex-A9处理器，Tgera 4则是发布最早的世界首款四核Cortex-A15处理器，这也算是Tegra系列的一个前期优点吧。

双核的Tegra 2频率为1.0-1.2GHz，Cortex-A9架构，GPU中有8个图形单元，分为4个顶点单元和4个像素单元，运行频率则有300、333及400MHz三个版本，支持OpenGL ES 2.0、OpenVG 1.1及EGL 1.4规范，目前依然有少部分手机在用。

Tegra 3是我们的老朋友了，也是NVIDIA目前的绝对主力，四核Coretx-A9架构，GPU中有12个图形单元，分为4个顶点单元，8个像素单元，运行频率有416MHz及520MHz两种，其中微软Surface RT、Google Nexus 7使用的就是416MHz版本，高端手机和平板中使用的则是520MHz版本。

Tegra 4现在已经发布，不过还没有具体产品上市，只能说是今年下半场的主力。与Tegra 3相比，它的架构、工艺都有升级，制程升级到28nm HPL工艺，CPU核心升级为四核Cortex-A15，GPU单元数量则从前代的12个跃升到了72个，实际运行频率约为672MHz。

Tegra 4完整支持OpenGL ES 2.0，并支持大部分的OpenGL ES 3.0技术，除了fp32浮点。

另外还有一个精简版的Tegra 4i，制程工艺也是28nm，CPU核心为四核Cortex-A9 r4p1改进版，GPU单元减少到60个，不过它整合了LTE基带，功耗和发热更适合手机使用。

架构设计：源自NV4x

江湖门派镇山之宝五大移动GPU厂商论剑
Tegra2(左)与Tegra 3(右)的GPU架构

江湖门派镇山之宝五大移动GPU厂商论剑
Tegra 4i的GPU架构

Tegra 4的GPU架构

Anandtech此前针对Tegra 2、3、4的GPU架构做了一番分析。Tegra的核心依然是传统的顶点和像素单元分离设计，即便是新一代的Tegra 4也不例外，并没有使用统一渲染架构。

Tegra 2有一组顶点和一组像素单元，每组各有4个ALU运算单元，Tegra 3的顶点单元不变，增加了一组像素单元，变成4+8形式。Tegra 4的顶点单元有6组，24个ALU单元，像素单元则由4组，每组包含12个ALU单元，24+48的形式组成了72个图形单元。

Tegra 4i则在Tegra 4的基础上砍掉了三组顶点单元，还剩下12个定点单元，48个像素单元不变，总结是60个图形单元，不过砍掉了一半的顶点单元意味着其三角形生成率会大幅下降。

NVIDIA这几代的Tegra处理器的GPU核心架构其实没什么变化，都源于早期的NV4x架构，每个ALU单元每周期可执行4个MAD指令，Tegra 4的顶点单元规模是Tegra 3的6倍，像素单元管线是Tegra 3的2倍，不过每组管线的规模又是Tegra 3的3倍，像素单元的规模总体还是Tegra 3的6倍。

不过Tegra 4的GPU核心也在效能方面做了改进，增加了L2纹理缓存，提升了像素渲染的最大寄存器(从16提高到24)等等，

另外，Tegra 4的672MHz的运行频率也比Tegra 3的520MHz要高，因此理论性能方面的提升如下:

Tegra 4相对Tegra 3的GPU性能提升

最后，Tegra 4虽然不能完整支持OpenGL ES 3.0规范，不过其中的大部分技术都是支持的，比如多目标渲染、遮蔽查询等新增技术都有支持。

Tegra 4支持OpenGL ES 3.0中的大部分技术规范

Tegra系列GPU优势与不足

1、坚持小核心战略，单位面积性能取胜

与桌面/专业卡中更追求性能的战略不同，NVIDIA在Tegra处理器上反倒谨慎了许多，非常注重控制芯片的核心面积，Tegra 4在规格大幅提升的同时依然将核心面积控制在了80mm²左右，其中GPU核心面积只有10.5mm²，与竞争对手相比小了许多。

GPU核心面积都被换算到了等效28nm工艺下

这就给NVIDIA带来一个宣传上的优势——单位面积性能足以秒杀目前的竞争对手，不论是高通的APQ8064还是苹果的A5X、A6X，在这个指标上都被斩落马下。

当然了，Tegra 4的绝对性能也不差，此前官方公布及现场演示都表明其安兔兔得分高达3.6万左右，比目前的跑分天王APQ8064最高2.1万分的成绩高了50%。

2、游戏优化不错，THD专属给力

虽然NVIDIA在PC平台的游戏优化被AMD的Gaming Evolved慢慢超越，但是移动平台是他们的心头肉，跟厂商合作的优化还会继续深入，Tegra系列还有专属的THD游戏，专门为NVIDIA的处理器优化。

此前的一个例子就是EPIC的《史诗城堡》demo，虽然Tegra 3的理论性能被高通APQ064打个落花流水，不过在这个demo测试中Tegra 3的成绩普遍好于APQ8064，更大幅领先三星的Exynos 4412等处理器。

没有Tegra 4，你游戏中的妹子都不够靓

Tegra处理器其实还有一个最大的优点，那就是相关设备价格比较便宜。以四核Tegra 3为例，它已经在两千甚至一千元内的四核手机中有过应用，北斗小辣椒、中兴V985、天语大黄蜂等等其中的代表，影驰的999元四核平板使用的也Tegra 3处理器，看来黄总为了出货量也在价格上拼了。

说到Tegra处理器的不足，那就是发布早上市晚的惯性了，很容易让后来者超越。Tegra 3是最早的四核Cortex-A9，但是等到上市铺货的时候别的厂商的28nm四核都来了，Tegra 3性能上不再有优势了，40nm制程的功耗也比别人高。Tegra 4现在也是差不多的情况，1月份发布的，平板和手机要想用上Tegra 4恐怕得到下半年甚至年底了。

另外一个让人揪心的就是功耗了。Tegra 4迟迟不能应用就多少受到了这方面的影响，据分析Tegra 4的TDP功耗高达5W，用在手机和平板中还有很大的难度。公平地说，功耗升高是所有四核Cortex-A15处理器都要面对的问题，但是谁让Tegra 4最早发布呢，它必然第一个承受这个非议。

未来展望及点评

Tegra 4还没有上市，NVIDIA又在前不久的GTC 2013大会上规划好了Tegra 5以及Tegra 6了，与目前的架构相比，后两者的变化可谓革命性的。

Tegra 5代号Logan，它将会进入统一渲染时代，使用Kepler核心，OpenGL ES规范上一跃升级为OpenGL 4.3，同时还支持CUDA on ARM，意味着移动处理器上也能用上CUDA加速了，再加上OpengGL 4.3支持，Tegra 5明年有可能成为最先进的移动GPU之一。

回头来看，随着GPU在移动处理器中分量越来越重要，在GPU技术上有先天优势的NVIDIA未来还是值得看好的，目前的Tegra 3和Tegra 4还是小改款，但是明年的Tegra 5意义大不同了，超强的技术规范及GPU通用计算的加入有望大幅提升GPU的应用范围，这在ARM处理器阵营中可算是蝎子尾巴——独一份了。

责任编辑：