细数Tegra 4的几大失望之处：GPU架构还是NV4x--快科技--科技改变未来

正文内容 评论（0）

细数Tegra 4的几大失望之处：GPU架构还是NV4x

2013-01-14 15:16:09 编辑：上方文Q 评论(0)

两年前NVIDIA的Tegra 3是世界首款四核Cortex-A9处理器，今年的CES前夕NVIDIA又顺利地抢先发布了世界第一款四核Cortex-A15处理器，而且借着Tegra 4的强大性能，NVIDIA还推出了代号Project Shield的游戏机，左手持Tegra 4利刃，右手握游戏机盾牌，杀向了今年的移动处理器市场。

发布几天来，我们也陆续了解了一下Tgera 4处理器的一些规格以及跑分性能，不过它背后还有很多不为人知的秘密。超能网综合了多方来源对Tegra 4处理器的介绍与分析，还有各种吐槽，大家也可以从多个角度来了解一下NVIDIA 2013年的第一款明星产品。

文中提到的内容及数据主要来源于几家国外权威媒体，包括Anandtech、Extremetech、Heise以及“毒舌”BSN，下文不再一一提及。

Tegra 4基本情况：四核Cortex-A15架构、频率最高1.9GHz

NVIDIA的Tegra 4是世界首款四核Cortex-A15架构ARM处理器，此前唯一的Cortex-A15处理器是三星的Exynos 5 Dual双核，Nexus 10上使用的正是1.7GHz频率的Exynos 5250，因此在四核架构方面Tegra 4还是比较领先的，不过三星今年将推出big.LITTLE架构的八核处理器，内有4个Coretex-A15和Cortex-A7核心，华为据说也在开发Cortex-A15架构的K3V3处理器，Tegra 4还要加速上市速度才行。

Tegra 4处理器核心架构图

Tegra 4使用的是TSMC的28nm HPL HKMG工艺，相比HPM工艺它主要优化了漏电流和峰值频率，比Tegra 3使用的40nm LPG工艺优秀得多，所以Tgera 4的最高频率达到了1.9GHz，核心面积约为80mm²，低于苹果A6X的124mm²，基本维持在了Tegra 3的80mm²量级，只不过晶体管规模肯定更高，具体数值未知。

此外，Tgera 4依然沿用了Tegra 3的4-Plus-1设计，也就是说实际上有5个核心，另外一个隐藏核心也是Cortex-A15架构的，不过频率、电压以及功耗要低得多，主要用来应付一些不需要高性能的应用，这样可以降低功耗，延长续航时间。

这个隐藏/伴生核心在系统里也是不可见的，而且它也不是三星那样的big.LITTLE架构，工作原理应该跟Tegra 3里的隐藏核心类似。

内存方面，Tegra 4终于一改Tegra 3只支持单通道内存的不足了，开始支持双通道LP-DDR3/DDR3L/LPDDR2，不过内存频率还没有准确数据，三星Exynos 5的DDR3频率达到了800MHz，Tegra 4至少也该有这个水平。

续航与功耗：功耗减少45%，TDP大约8W

新工艺的直接好处就是降低了处理器功耗，Tegra 4的功耗号称比Tegra 3减少了45%，视频播放续航时间为14小时。

芯片的TDP参数未知，不过Heise从Project Shield游戏机中估算了一下，它配备的是38Wh电池，续航时间是5-10小时（在掌机中这个续航算是很低了），因此功耗大约是3.8-7.6W左右，如果算上内存、WiFi之类的消耗，那么实际功耗在5W左右。

这个功耗是什么概念呢？结合之前Anandtech做过的芯片级功耗测试来看，三星的Exynos 5250处理器的典型功耗在4W左右，最大功耗约为8W，因此四核的Tegra 4控制的还算不错，只不过这个“不错”的前提只适用于配备大容量电池的平板上。

我们把Project Shield游戏机看作一个5英寸720P、38Wh电池的手机，其游戏续航时间是5-10个小时，然后以小米2手机为参照对象，其电池容量为2000mAH，电压3.7V，电池容量是7.4Wh，在我们的测试中GLBenchmark放电时间是3小时27分，那么，使用与小米2手机同样容量电池的Tegra 4手机游戏续航时间恐怕只有1-2个小时，只有小米2手机的一半左右，而且这还没考虑手机里各种信号芯片的消耗。

小米2满载时游戏续航时间大约是3个半小时

当然，这个换算是比较粗放的，手机/平板的真实续航时间还要看屏幕以及厂商的优化，但是从NVIDIA官方给出的数据换算来看Tegra 4用在手机上恐怕需要在续航上作出一些妥协。

GPU：非统一渲染架构，核心源于NV4x架构

Tegra 4的CPU架构部分是基于Cortex-A15指令集的，32位ARM架构上NVIDIA还不会开发自己的指令，Project Denver计划的产品倒是有可能跟高通一样自主开发ARM兼容架构，所以Tegra 4的CPU架构不做介绍了，GPU部分是NVIDIA自己开发的，这个才是重点。

先说Tegra 4问世之前的一个小插曲。NVIDIA今年推出的Kepler架构功效非常高，一改Fermi时代的高发热高功耗旧貌，黄仁勋在公司内部邮件中表示Kepler架构如此高效甚至可以用到移动处理器上，而许多人确实很期待Tegra 3之后的产品会升级到统一渲染架构。

等Tegra 4露面了，统一渲染架构的设想已经被证实不可能了。NVIDIA市场总监Nick Stam证实，Tegra 4的72个GPU核心由48个PS像素顶点单元和24个VS顶点着色单元组成，延续了Tegra 2/3使用的GeForce ULP核心，其中Tegra 3上的PS、VS单元分别是8个、4个。Tegra 4的规模正好是Tgera 3的6倍，当然还有一些渲染管线以及缓存容量的调整，不过纹理单元规模没有提及。

GeForce ULP架构源于GeForce 6/7时代的NV4X架构，是2004年的产品了，PS3中使用的RSX架构其实就是GeForce 7800 GTX的NV47核心的改款。

Tgera 3处理器的跑分，Tegra 4在GLBencmark中的性能是前者的2.5倍左右

在统一渲染架构支持方面走的比较靠前的是PowerVR，SGX 5系列开始就已经支持统一渲染架构了，这都是几年前的事了，新一代SGX 6系列还会继续提升。

不过监Nick Stam认为，苹果的处理器中图形核心占据了太多面积，而实际游戏“并不是那么让人着迷”，而NVIDIA的长处不是堆硬件，而是软件和驱动优化，通过与游戏开发商的合作与优化是可以打败iPad的。

GPU虽然是NVIDIA的强项，但是Tegra 2/3使用的都是很古老的核心，性能参数都低于同时代的移动处理器，Tegra 4没想到也是如此

不管哪种种架构，具体的性能上NVIDIA宣传的都是6倍提升，具体的游戏测试中应该能达到3-4倍性能提升（NVIDIA语）。从日前曝光的性能测试来看，GLBenchmark 2.5中现在的Tegra 4跑分已经达到Tegra 3的2.5倍左右，相当于A6X的62%，优化之后得分应该还会有所提升。

API规范：不支持OpenCL也没有CUDA，甚至不支持OpenGL ES 3.0

GPU架构的硬件设计先不去管它，再来看Tegra 4最为人诟病的地方——那就是作为新一代的移动处理器，它竟然不支持现有的技术规范，GPU计算方面完全不支持OpenCL，NVIDIA自家的CUDA也不支持，图形规范上也不支持OPenGL ES 3.0（NVIDIA的宣传中都没提这一点，Heise上说的是不支持，应该还是停留在Tegra 3的ES 2.0规范上），微软的DX10/DX11.1也不要指望了。

高通骁龙S4系列的处理器已经通过OpenCL这样的规范实现GPU和GPU同时加速性能提升，NVIDIA在这方面反倒保守了

BSN对这个问题很在意，特地询问了NVIDIA官方，后者在回复中表示：“现在的移动应用中根本无法利用OpenCL、CUDA以及更高级的OpenGL规范的优势，Tegra 4的GPU性能非常强劲，我们的目标是致力于提高终端用户的真实体验。”

NVIDIA没说出口的深层原因也许是Tegra 4的GPU架构实在太老了，还是GeForce 6/7时代的，那时候OpenCL以及自家的CUDA恐怕还在酝酿阶段，所以干脆不提这些技术规范了，这一举动也让BSN大加吐槽，这跟NVIDIA在桌面及HPC领域中推崇GPU计算的表现完全不符啊。

BSN还举例称不支持OpenCL这样的规范已经对NVIDIA的Tegra造成了影响，在宝马新一代硬件竞争中NVIDIA就败给了飞思卡尔，后者使用的Vivante图形核心支持最新的OpenGL ES 3.0以及OepnCL规范，而NVIDIA的不行，这就是他们出局的原因。

另外，不支持这些规范对NVIDIA未来的市场竞争也很不利，Futuremark即将推出新一代跨平台测试软件，Rightware的Basemark X也会如此，他们都要求更高的API规范支持。实际上从CES展会上的现场测试来看也是如此，对OpenCL、OpenGL ES 3.0支持较好的高通APQ8064处理器手机以及iPad得分都比较靠前，而Tegra 3处理器就非常靠后。

还有Windows RT设备上的，高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范。据说高通没能入选Surface RT平板处理器是因为当时他们没搞定驱动，所以微软才选了Tegra 3，而且有消息表示下一代Surface RT平板将使用高通、AMD以及Intel的芯片，毕竟这三家的移动GPU核心对DX11规范支持的更好。

结语

在Tegra 4没公开之前，传闻中的各种规格确实让人很兴奋，四核Cortex-A15核心，统一渲染架构，72个图形单元，支持DX11、OpenCL、OpenGL 4.x以及CUDA规范，但是最终有些变成现实了，而有些落空了，特别是API规范方面与大家的预期相比是一落千丈。虽然NVIDIA嘴硬说这些规范没什么意义，他们更关注用户体验，但是作为新一代的移动处理器，Tegra 4至少也要在市场上撑两年，别人已经支持的规范你却不支持，这在宣传上已经吃亏了。

还有就是Tegra 4处理器的功耗和续航，作为一个四核Cortex-A15架构的处理器来说，4-8W的功耗跟现在的三星Exynos 5双核差不多，看起来已经很不错了，不过三星的双核Cortex-A15处理器目前只用在了平板中，依然没能进入手机市场。目前使用Tegra 4处理器的设备也主要是平板，用在智能手机上恐怕还得优化一下功耗管理，该降频就得降频。

最后就是上市时间了，这个问题甚至要比规格性能高低的影响还要大，目前能提供28nm四核处理器的主要是高通一家（其实国内的瑞芯也推出了28nm工艺的四核Cortex-A9处理器了），无论是平板还是手机，现在不用APQ8064都不好意思说自己是旗舰了。

NVIDIA如果能在未来两三个月内将大批Tegra 4设备推向市场，那么跟高通还有的一拼，如果要拖到年中或者下半年了，那么三星的28nm HKMG工艺的四核Cortex-A15处理器、高通的骁龙600/800处理器也要问世了，到时候竞争烈度就会更高，Tegra 4的优势还有多少呢？

【本文结束】如需转载请务必注明出处：快科技

责任编辑：