全面了解AMD Zen5架构CPU：架构革新性能飞跃--快科技--科技改变未来

正文内容 评论（0）

全面了解AMD Zen5架构CPU：架构革新性能飞跃

2024-07-18 21:48:50 出处：太平洋科技作者：YIHAN 编辑：振亭评论(0)

早在今年的COMPUTEX 2024上，AMD就给诸位玩家带来了Zen 5架构与锐龙9000系处理器的前瞻信息，同时也正式发布了第三代 Ryzen AI 处理器——Ryzen AI 300 系列移动平台，此外还宣布了800系主板的AMD X870 / X870E 芯片，支持USB 4.0 和 PCIe 5.0 标准，以带来更高的性能和更好的兼容性体验。

最近AMD召开了一场技术分享会，针对这些即将上市的硬件做了更全面的技术解析，在现场我们还看到了最新的Ryzen R9-9950X处理器，只能说性能真的很顶！等等党这回真的等到了！那关于新的处理器系列都有哪些提升，性能表现如何？Zen5结构又有哪些改进，别着急，下面我们一一解析。

Zen 5架构

AMD将Zen 5架构称为“巨大的飞跃”，与Zen 4相比，Zen 5架构的升级幅度要大得多，堪比Zen 3时期的变化。其中Zen 5架构相比前代的改变主要集中在优化计算单元、提高带宽、增强指令集吞吐量以及AI性能几个方面。

详细一点解析，首先Zen 5架构在指令获取与解码上均有改进，处理器采用了32KB的一级指令缓存，通过8路并行处理和32字节的双倍数据获取速率，显著提升了指令流的处理效率。

此外，还引入了更加先进的高级分支预测技术，来猜测接下来需要执行的指令，这样处理器就可以提前做好准备，大幅提高效率。

在整数执行方面，处理器进行了多项优化。L1指令缓存容量保持32KB不变，但通过增加到8宽，提高了整数运算的并行度。除此之外，ALU调度器包含6个ALU单元和3个乘法器，这不仅提升了整数运算能力，也增强了执行单元的灵活性。

处理器在加载和存储数据方面也变得更高效了。它有一个48KB 12路并行设计的快速数据缓存区，大大加快了数据的加载速度。同时，通过增加数据带宽和改进预取算法，处理器能够更有效地预测和加载即将使用的数据，减少了等待时间。

最后，处理器在处理复杂的浮点和向量运算时也变得更快了。众所周知，Intel因为大小核设计放弃了对AVX-512指令集的支持，AMD就不一样了，Zen 5架构一样支持AVX-512指令集，配备完整的512bit数据路径，以及8宽的调度能力。这也意味着处理器可以同时处理更多复杂的数学运算。

除了架构的大幅改进外，Zen5相比于Zen4的IPC性能平均提高了约16%，数据相当可观。加速单元的数学性能相比Zen 4的提升更大，单核在机器学习方面，提升高达32%；针对AES-XTS 加密算法，性能提升更是涨幅35%。

总的来说，Zen 5架构的提升主要展现在数据带宽、调度执行单元优化、更精准的分支预测以及解码缓存方面。另外，得益于Zen 5架构采用TSMC 3nm与4nm的领先工艺，因此更低的功耗但却有更高的性能，未来Zen 5架构也将应用于多个种类的产品中。

目前应用Zen 5架构的包括锐龙9000系处理器以及锐龙AI 300系列处理器，而应用Zen 5架构的EYPC处理器将在2024年下半年推出，最高可实现192核384线程的恐怖规模。同时未来还会有Zen 5c架构推出，均采用TSMC 3nm和4nm打造，至于Zen 6或Zen 6c架构，AMD暂未公布什么时候发布。

Ryzen 9000系列桌面处理器

讲完了Zen 5架构，再来看看首款应用了Zen 5架构的锐龙9000系桌面级处理器。如无意外，锐龙9000系处理器最快将在这个月底（即7月31日）与大家见面。

本次发布的锐龙9000系处理器共有四款，分别是旗舰级的锐龙9 9950X、锐龙9 9900X、锐龙7 9700X以及锐龙5 9600X，详细规格如下，这里就不过多赘述了，可以看到新的锐龙9000系性能更强的同时，TDP还降低了，能效比将极其惊人，可见Zen 5确实黑科技满满。

在COMPUTEX 2024时，我们就给大家展示了锐龙9 9950X的性能。在性能层面上，锐龙9 9950X可以说是遥遥领先，根据AMD提供的数据来看，锐龙9 9950X在生产力创作领域，相比隔壁Intel的i9-14900K平均领先30%左右，在Blender里最高可以领先至56%以上。游戏的表现也不错，像赛博朋克2077，锐龙9 9950X有13%的领先优势，在地平线：零之曙光里，性能可以超越Intel i9-14900K 23%以上。

这次技术分享会，AMD给我们带来了剩下三款处理器的性能表现。锐龙9 9900X一样可以轻松挑落i9-14900K。生产力层面，基本领先竞品10%以上，在Handbrake项目里的领先幅度直接来到了夸张的41%。游戏领域也追上来了，在地平线：零之曙光里，性能可以超越Intel i9-14900K 22%以上，即便是在网游Dota2里，性能也比竞品强7%，测试的6款游戏中，锐龙9 9900X平均性能领先14%。

定位高端的锐龙7 9700X的对手自然是隔壁的i7-14700K了。不过i7-14700K似乎不是锐龙7 9700X的对手，单是GeekBench单核测试得分，锐龙7 9700X就比i7-14700K高17%，同样看中单核性能的Puget Photoshop测试里，也是19%的领先优势。再看游戏性能，在地平线：零之曙光里，领先程度来到了31%，而压力更大的赛博朋克2077里，锐龙7 9700X领先12%，确实惊人。

最后是主流玩家关注的锐龙5 9600X，它的生产力表现应该说爆杀i5-14600K，在GeekBench单核测试、Puget Photoshop以及7-Zip的测试里，性能领先均在20%左右，在Handbrake里就离谱了，直接跑出了94%领先的表现。在实测的6款游戏里，锐龙5 9700X也是全面领先，平均性能领先14%以上。

性能出众只是锐龙9000系处理器的优势之一，能效比才是重头戏。锐龙9000系处理器的热阻提升了15%，这也就意味着在同一TDP下，新款处理器温度能够降低7℃左右。

据AMD放出的信息来看，65W的锐龙7 9700X的游戏表现要远强于105W的锐龙7 5800X3D，后者还被誉为“游戏神U”。实测锐龙7 9700X在战锤3里，性能要比5800X3D高出30%，平均性能要领先12%左右。

大家从一开始的规格配置图里也知道了，全新的锐龙9000系处理器除旗舰级的锐龙9 9950X外，都降低了TDP，但是性能不降反升，更低的功耗实现更强的性能，AMD Yes！

另外，锐龙9000系处理器在超频方面也有提升，内存方面支持DDR5-8000MHz的超高频率。

PBO的提升就更大了，由于锐龙9000系处理器的默认TDP都比较低，因此开启PBO后提升幅度巨大，根据AMD给的信息，锐龙7 9700X开启PBO后，性能提升高达15%，而锐龙9 9900X和锐龙5 9600X开启后也有6%的性能提升。

另外，AMD还在现场进行了手动超频，使用的是旗舰级的锐龙9 9950X。

AMD的工作人员将该处理器在液氮下超频至6.3GHz！CineBench R23的多核得分直接冲到了52197！

800系主板

与锐龙9000系配套的主板则是800系，从锐龙7000系开始，AMD开始换用AM5接口，曾经的AM4接口支持145款CPU或APU处理器，而最新的AM5接口目前已有38款CPU或APU应用，AMD承诺AM5接口将沿用至2027年，准备换装新装备的玩家大可放心冲！

在COMPUTEX 2024时，AMD只介绍了顶级的X870E以及X870主板，现在AMD公布了800系主板的完整芯片组，包含X870E、X870、B850以及全新的B840。

其中顶级的X870/X870E支持USB 4.0、显卡和固态硬盘接口均支持PCle 5.0，同时支持运行频率更高的内存。而B850与现在的B650/B650E类似，分为PCIe 5.0和PCIe 4.0两种版本，支持USB 3.2 20Gbps，CPU和内存均可超频。

而最新的B840则有点像B850的缩水版，不支持PCle 5.0，只支持PCle 4.0，并且不支持处理器超频。至于H810虽然世面上有主板厂商有泄露一些信息，但在AMD的信息里没有列出，后续有更新，我们也会第一时间同步。

关于主板上市时间，目前据说800系列主板中的高端型号X870E和X870系列主板将于9月下旬推出，也就是说，在锐龙9000系列处理器发布两个月之后才会发布，至于B850和B840主板的发布时间，大概率只会更晚。

Ryzen AI 300系列移动处理器

继续来看看移动端的处理器，此次推出的锐龙AI 300系列，也是第三代AMD Ryzen AI，采用了Zen 5架构，内置XDNA2 NPU，GPU则升级为RDNA 3.5 显卡，号称面向下一代 AI PC / Copilot+ PC的最强处理器。

目前锐龙AI 300系列已经广泛支持Windows生态，有超过10万+游戏、3500万+Apps、6亿设备适配。

在COMPUTEX 2024时，AMD就预告过将有100款以上的搭载AMD Ryzen AI 300系列处理器的OEM产品陆续上市。

除了我们常见的笔记本形态，锐龙AI 300系列还可以其他形态呈现。目前AMD正在持续不断地推进端到端 AI 基础设施，全面涉及云、高性能计算平台、企业级、嵌入式和个人电脑等终端产品，使AI能够更好地为数十亿的用户在日常生活和工作中提供强大的动力。

说了那么多，接下来该说说硬件配置了，首先锐龙AI 300系列处理器同样基于Zen 5架构打造，CPU核心数量最高达到了12核24线程，多线程性能进一步提升。锐龙AI 300系列的GPU则基于RDNA 3.5架构打造，计算单元提升到16个，图形性能进一步增强。

首发型号分别是锐龙AI 9 HX 370和锐龙AI 9 365，均定位高端型号。顶级旗舰的锐龙AI 9 HX 370处理器，拥有12核心、24线程，L2+L3 缓存36MB，最大频率5.1GHz，GPU升级至Radeon 890M，CU单元数量也从12个增至16个，NPU AI算力达到50TOPS。

锐龙AI 9 365拥有10核心20线程，二级缓存10MB，三级缓存仍为24MB，最高频率5.0GHz。GPU为Radeon 880M，12个CU单元，NPU算力50TOPS保持一致。

性能层面，锐龙AI 300系列可以说是遥遥领先了，在生产力领域，Ryzen AI 9 HX 370全面领先，应用启动速度是Intel Core Ultra 9 185H的1.07倍，如果是网页浏览的话，这颗处理器的性能更强，性能可以达到后者的1.3倍。

在视频编辑、多线程性能以及3D渲染性能方面，对比酷睿Ultra 185H处理器，Ryzen AI 9 HX 370更是逆天，仅Blender BMW渲染项目，性能领先就有3.8倍之多。

游戏加速方面，全新的RDNA 3.5架构iGPU带来了更强的图形性能，同样对比酷睿Ultra 185H处理器，Ryzen AI 9 HX 370在《古墓丽影：暗影》、《刺客信条：幻景》、《孤岛惊魂6》、《F1 2022》、《无主之地3》、《赛博朋克2077》《GTA5》等游戏上的性能表现相当出色，平均性能领先均在20-30%以上。

AMD还与众多厂商合作，全面扩大AI技术应用范围，深入到全领域，逐渐构建完善的AI环境，打造前所未有的Windows AI PC生态。

例如，AMD与微软深度合作，锐龙AI 300系列将为Copilot+带来全新的AI功能，如：实时字幕、文生图等。未来，还会有更多OEM厂商将基于锐龙AI 300系列实现更多AI体验。

同时AMD在会上还预告了AMUSE 2.0即将上线，Amuse是一款专业且直观的Windows UI，其借助ONNX（开放式神经网络交换）平台，可实现各种AI加持下的文生图、图生图、重绘等操作，且具备模型管理功能。

总的来说，锐龙AI 300系列将为你带来完整的生态系统体验、丰富多样的产品形式、强悍极致的AI应用、卓越的性能表现以及超长的电池续航。

AMD RDNA 3.5架构

从锐龙AI 300系列处理器中我们已经简单的见识到了RDNA 3.5架构的性能表现，下面就详细的介绍一下RDNA 3.5架构的相关信息。

RDNA 3.5架构相比前代有三大优势，第一点是能效比有了明显提升，其次是优化了内存管理，使得访问内存的频率更低，但能够实现更高的效率，最后一点则是更智能的GPU电源管理，可以节省功耗，实现更长的续航。

具体来说，AMD通过改进的调度器和电源管理，提升了GPU在移动设备上的性能和功耗效率。这样GPU在保持高性能的同时，还能延长电池寿命。另外，AMD对最常用的纹理采样操作进行了优化，实现了双倍的采样率，有助于提升游戏的图形质量和性能。

同时还增强了向量指令集架构（ISA），提高了插值和比较的速率，从而提升了图形渲染的效率。内存管理方面也进行了大刀阔斧的改进，AMD对图形数据结构进行了优化，包括L2缓存和SoC（System on Chip）总线，以减少内存访问次数，提高数据压缩技术和工作负载的优化。

具体到实际应用层面，根据AMD的说法，全新的RDNA 3.5架构与上一代Ryzen CPU相比，同样的TDP下，每瓦性能最大可提升超过32%，能效比相当逆天。

不得不说，AMD在图形处理技术上确实有着深厚的积累，RDNA 3.5架构无疑将为用户带来更加流畅和高效的使用体验。

AMD XDNA 2架构

最后一部分是关于XDNA 2架构的内容，这主要与锐龙AI 300系列的NPU有关。根据我们上面的介绍可知，锐龙AI 300系列集成了最先进的Zen 5架构CPU核心，还拥有XDNA 2架构的NPU以及RDNA 3.5架构的GPU，在三大核心处理单元的加持下，为其带来强大的运算和AI计算能力。

AMD XDNA架构与传统多核处理器完全不同，从下面的架构图就可以看出，XDNA架构有更为灵活的计算单元和内存层次结构，与传统多核处理器相比，XDNA架构能够根据AI工作负载的特定需求，动态调整计算资源和内存访问，从而实现更优的性能和更低的延迟。

另外，XDNA架构还有高度可编程的互连和分区能力，该架构能够适应各种复杂的AI工作负载，提供实时视频处理和内容创作的强大支持。针对内存也进行了优化，AMD XDNA架构可以有效减少了内存带宽的需求，同时消除了缓存缺失的问题，确保了多任务处理的高效性和实时性能的稳定性。

XDNA 2架构在设计上相比XDNA 1有明显进步，首先AI engine Tiles由原来的20个增加至32个，因此AI算力直接翻了5倍，由原来的10 TOPS提升至50 TOPS。另外，XDNA 2的性能提升还源于多项创新，如：扩大内存容量、引入高效的数据传输技术，以及优化内存管理等。

与Ryzen 7040系列相比，AMD XDNA 2架构提供了高达5倍的AI计算能力。并且在相同性能下，能效比是前代产品的2倍，这也就意味着其续航能力也有大幅提升。

目前使用XDNA 2架构NPU的锐龙AI 300系列处理器在AI性能层面，有着无可比拟的优势，即便是最新推出的苹果M4也不是它的对手，50 TOPS的算力表现绝对称得上是目前最强大的NPU。

另外，XDNA 2架构还创新性的使用了Block FP16数据模型，这是一种新型的数据类型，专为AI设计，它不像其他数据模型需要进行量化，因此在保证计算准确性的同时，还能大幅提升性能，它的出现可以说代表了AI数据处理的一大进步。

根据AMD给出的数据可知，Block FP16在保持与FP32相当的高准确度的同时，还能提供更高的吞吐量和更小的模型尺寸，因此可以有效减少模型的存储需求。

此外，Block FP16的灵活性允许它作为FP32的直接替代品，并且几乎不损失准确度，软件厂商完全能够无缝地将现有模型迁移到AMD平台，Block FP16的高效性和兼容性，将推动AI技术在更广泛的应用场景中实现创新和突破。

目前Block FP16已经可以应用于Stable Diffusion XL Turbo模型。另外，得益于Block FP16高准确度的优势，在Llamav2 7B模型的响应速度测试中，拥有XDNA 2 NPU的锐龙300 AI 系列足足比Intel Core Ultra 7 155H快了5倍之多。卓越的AI能力，进一步证明了XDNA 2架构在AI领域的先进技术和性能优势。