正文内容 评论(0)
早在今年的COMPUTEX 2024上,AMD就给诸位玩家带来了Zen 5架构与锐龙9000系处理器的前瞻信息,同时也正式发布了第三代 Ryzen AI 处理器——Ryzen AI 300 系列移动平台,此外还宣布了800系主板的AMD X870 / X870E 芯片,支持USB 4.0 和 PCIe 5.0 标准,以带来更高的性能和更好的兼容性体验。
最近AMD召开了一场技术分享会,针对这些即将上市的硬件做了更全面的技术解析,在现场我们还看到了最新的Ryzen R9-9950X处理器,只能说性能真的很顶!等等党这回真的等到了!那关于新的处理器系列都有哪些提升,性能表现如何?Zen5结构又有哪些改进,别着急,下面我们一一解析。
Zen 5架构
AMD将Zen 5架构称为“巨大的飞跃”,与Zen 4相比,Zen 5架构的升级幅度要大得多,堪比Zen 3时期的变化。其中Zen 5架构相比前代的改变主要集中在优化计算单元、提高带宽、增强指令集吞吐量以及AI性能几个方面。
详细一点解析,首先Zen 5架构在指令获取与解码上均有改进,处理器采用了32KB的一级指令缓存,通过8路并行处理和32字节的双倍数据获取速率,显著提升了指令流的处理效率。
此外,还引入了更加先进的高级分支预测技术,来猜测接下来需要执行的指令,这样处理器就可以提前做好准备,大幅提高效率。
在整数执行方面,处理器进行了多项优化。L1指令缓存容量保持32KB不变,但通过增加到8宽,提高了整数运算的并行度。除此之外,ALU调度器包含6个ALU单元和3个乘法器,这不仅提升了整数运算能力,也增强了执行单元的灵活性。
处理器在加载和存储数据方面也变得更高效了。它有一个48KB 12路并行设计的快速数据缓存区,大大加快了数据的加载速度。同时,通过增加数据带宽和改进预取算法,处理器能够更有效地预测和加载即将使用的数据,减少了等待时间。
最后,处理器在处理复杂的浮点和向量运算时也变得更快了。众所周知,Intel因为大小核设计放弃了对AVX-512指令集的支持,AMD就不一样了,Zen 5架构一样支持AVX-512指令集,配备完整的512bit数据路径,以及8宽的调度能力。这也意味着处理器可以同时处理更多复杂的数学运算。
除了架构的大幅改进外,Zen5相比于Zen4的IPC性能平均提高了约16%,数据相当可观。加速单元的数学性能相比Zen 4的提升更大,单核在机器学习方面,提升高达32%;针对AES-XTS 加密算法,性能提升更是涨幅35%。
总的来说,Zen 5架构的提升主要展现在数据带宽、调度执行单元优化、更精准的分支预测以及解码缓存方面。另外,得益于Zen 5架构采用TSMC 3nm与4nm的领先工艺,因此更低的功耗但却有更高的性能,未来Zen 5架构也将应用于多个种类的产品中。
目前应用Zen 5架构的包括锐龙9000系处理器以及锐龙AI 300系列处理器,而应用Zen 5架构的EYPC处理器将在2024年下半年推出,最高可实现192核384线程的恐怖规模。同时未来还会有Zen 5c架构推出,均采用TSMC 3nm和4nm打造,至于Zen 6或Zen 6c架构,AMD暂未公布什么时候发布。
Ryzen 9000系列桌面处理器
讲完了Zen 5架构,再来看看首款应用了Zen 5架构的锐龙9000系桌面级处理器。如无意外,锐龙9000系处理器最快将在这个月底(即7月31日)与大家见面。
本次发布的锐龙9000系处理器共有四款,分别是旗舰级的锐龙9 9950X、锐龙9 9900X、锐龙7 9700X以及锐龙5 9600X,详细规格如下,这里就不过多赘述了,可以看到新的锐龙9000系性能更强的同时,TDP还降低了,能效比将极其惊人,可见Zen 5确实黑科技满满。
在COMPUTEX 2024时,我们就给大家展示了锐龙9 9950X的性能。在性能层面上,锐龙9 9950X可以说是遥遥领先,根据AMD提供的数据来看,锐龙9 9950X在生产力创作领域,相比隔壁Intel的i9-14900K平均领先30%左右,在Blender里最高可以领先至56%以上。游戏的表现也不错,像赛博朋克2077,锐龙9 9950X有13%的领先优势,在地平线:零之曙光里,性能可以超越Intel i9-14900K 23%以上。
这次技术分享会,AMD给我们带来了剩下三款处理器的性能表现。锐龙9 9900X一样可以轻松挑落i9-14900K。生产力层面,基本领先竞品10%以上,在Handbrake项目里的领先幅度直接来到了夸张的41%。游戏领域也追上来了,在地平线:零之曙光里,性能可以超越Intel i9-14900K 22%以上,即便是在网游Dota2里,性能也比竞品强7%,测试的6款游戏中,锐龙9 9900X平均性能领先14%。
定位高端的锐龙7 9700X的对手自然是隔壁的i7-14700K了。不过i7-14700K似乎不是锐龙7 9700X的对手,单是GeekBench单核测试得分,锐龙7 9700X就比i7-14700K高17%,同样看中单核性能的Puget Photoshop测试里,也是19%的领先优势。再看游戏性能,在地平线:零之曙光里,领先程度来到了31%,而压力更大的赛博朋克2077里,锐龙7 9700X领先12%,确实惊人。
最后是主流玩家关注的锐龙5 9600X,它的生产力表现应该说爆杀i5-14600K,在GeekBench单核测试、Puget Photoshop以及7-Zip的测试里,性能领先均在20%左右,在Handbrake里就离谱了,直接跑出了94%领先的表现。在实测的6款游戏里,锐龙5 9700X也是全面领先,平均性能领先14%以上。
性能出众只是锐龙9000系处理器的优势之一,能效比才是重头戏。锐龙9000系处理器的热阻提升了15%,这也就意味着在同一TDP下,新款处理器温度能够降低7℃左右。
据AMD放出的信息来看,65W的锐龙7 9700X的游戏表现要远强于105W的锐龙7 5800X3D,后者还被誉为“游戏神U”。实测锐龙7 9700X在战锤3里,性能要比5800X3D高出30%,平均性能要领先12%左右。
大家从一开始的规格配置图里也知道了,全新的锐龙9000系处理器除旗舰级的锐龙9 9950X外,都降低了TDP,但是性能不降反升,更低的功耗实现更强的性能,AMD Yes!
另外,锐龙9000系处理器在超频方面也有提升,内存方面支持DDR5-8000MHz的超高频率。
PBO的提升就更大了,由于锐龙9000系处理器的默认TDP都比较低,因此开启PBO后提升幅度巨大,根据AMD给的信息,锐龙7 9700X开启PBO后,性能提升高达15%,而锐龙9 9900X和锐龙5 9600X开启后也有6%的性能提升。
另外,AMD还在现场进行了手动超频,使用的是旗舰级的锐龙9 9950X。
AMD的工作人员将该处理器在液氮下超频至6.3GHz!CineBench R23的多核得分直接冲到了52197!
800系主板
与锐龙9000系配套的主板则是800系,从锐龙7000系开始,AMD开始换用AM5接口,曾经的AM4接口支持145款CPU或APU处理器,而最新的AM5接口目前已有38款CPU或APU应用,AMD承诺AM5接口将沿用至2027年,准备换装新装备的玩家大可放心冲!
在COMPUTEX 2024时,AMD只介绍了顶级的X870E以及X870主板,现在AMD公布了800系主板的完整芯片组,包含X870E、X870、B850以及全新的B840。
其中顶级的X870/X870E支持USB 4.0、显卡和固态硬盘接口均支持PCle 5.0,同时支持运行频率更高的内存。而B850与现在的B650/B650E类似,分为PCIe 5.0和PCIe 4.0两种版本,支持USB 3.2 20Gbps,CPU和内存均可超频。
而最新的B840则有点像B850的缩水版,不支持PCle 5.0,只支持PCle 4.0,并且不支持处理器超频。至于H810虽然世面上有主板厂商有泄露一些信息,但在AMD的信息里没有列出,后续有更新,我们也会第一时间同步。
关于主板上市时间,目前据说800系列主板中的高端型号X870E和X870系列主板将于9月下旬推出,也就是说,在锐龙9000系列处理器发布两个月之后才会发布,至于B850和B840主板的发布时间,大概率只会更晚。
Ryzen AI 300系列移动处理器
继续来看看移动端的处理器,此次推出的锐龙AI 300系列,也是第三代AMD Ryzen AI,采用了Zen 5架构,内置XDNA2 NPU,GPU则升级为RDNA 3.5 显卡,号称面向下一代 AI PC / Copilot+ PC的最强处理器。
目前锐龙AI 300系列已经广泛支持Windows生态,有超过10万+游戏、3500万+Apps、6亿设备适配。
在COMPUTEX 2024时,AMD就预告过将有100款以上的搭载AMD Ryzen AI 300系列处理器的OEM产品陆续上市。
除了我们常见的笔记本形态,锐龙AI 300系列还可以其他形态呈现。目前AMD正在持续不断地推进端到端 AI 基础设施,全面涉及云、高性能计算平台、企业级、嵌入式和个人电脑等终端产品,使AI能够更好地为数十亿的用户在日常生活和工作中提供强大的动力。
说了那么多,接下来该说说硬件配置了,首先锐龙AI 300系列处理器同样基于Zen 5架构打造,CPU核心数量最高达到了12核24线程,多线程性能进一步提升。锐龙AI 300系列的GPU则基于RDNA 3.5架构打造,计算单元提升到16个,图形性能进一步增强。
首发型号分别是锐龙AI 9 HX 370和锐龙AI 9 365,均定位高端型号。顶级旗舰的锐龙AI 9 HX 370处理器,拥有12核心、24线程,L2+L3 缓存36MB,最大频率5.1GHz,GPU升级至Radeon 890M,CU单元数量也从12个增至16个,NPU AI算力达到50TOPS。
锐龙AI 9 365拥有10核心20线程,二级缓存10MB,三级缓存仍为24MB,最高频率5.0GHz。GPU为Radeon 880M,12个CU单元,NPU算力50TOPS保持一致。
性能层面,锐龙AI 300系列可以说是遥遥领先了,在生产力领域,Ryzen AI 9 HX 370全面领先,应用启动速度是Intel Core Ultra 9 185H的1.07倍,如果是网页浏览的话,这颗处理器的性能更强,性能可以达到后者的1.3倍。
在视频编辑、多线程性能以及3D渲染性能方面,对比酷睿Ultra 185H处理器,Ryzen AI 9 HX 370更是逆天,仅Blender BMW渲染项目,性能领先就有3.8倍之多。
游戏加速方面,全新的RDNA 3.5架构iGPU带来了更强的图形性能,同样对比酷睿Ultra 185H处理器,Ryzen AI 9 HX 370在《古墓丽影:暗影》、《刺客信条:幻景》、《孤岛惊魂6》、《F1 2022》、《无主之地3》、《赛博朋克2077》《GTA5》等游戏上的性能表现相当出色,平均性能领先均在20-30%以上。
AMD还与众多厂商合作,全面扩大AI技术应用范围,深入到全领域,逐渐构建完善的AI环境,打造前所未有的Windows AI PC生态。
例如,AMD与微软深度合作,锐龙AI 300系列将为Copilot+带来全新的AI功能,如:实时字幕、文生图等。未来,还会有更多OEM厂商将基于锐龙AI 300系列实现更多AI体验。
同时AMD在会上还预告了AMUSE 2.0即将上线,Amuse是一款专业且直观的Windows UI,其借助ONNX(开放式神经网络交换)平台,可实现各种AI加持下的文生图、图生图、重绘等操作,且具备模型管理功能。
总的来说,锐龙AI 300系列将为你带来完整的生态系统体验、丰富多样的产品形式、强悍极致的AI应用、卓越的性能表现以及超长的电池续航。
AMD RDNA 3.5架构
从锐龙AI 300系列处理器中我们已经简单的见识到了RDNA 3.5架构的性能表现,下面就详细的介绍一下RDNA 3.5架构的相关信息。
RDNA 3.5架构相比前代有三大优势,第一点是能效比有了明显提升,其次是优化了内存管理,使得访问内存的频率更低,但能够实现更高的效率,最后一点则是更智能的GPU电源管理,可以节省功耗,实现更长的续航。
具体来说,AMD通过改进的调度器和电源管理,提升了GPU在移动设备上的性能和功耗效率。这样GPU在保持高性能的同时,还能延长电池寿命。另外,AMD对最常用的纹理采样操作进行了优化,实现了双倍的采样率,有助于提升游戏的图形质量和性能。
同时还增强了向量指令集架构(ISA),提高了插值和比较的速率,从而提升了图形渲染的效率。内存管理方面也进行了大刀阔斧的改进,AMD对图形数据结构进行了优化,包括L2缓存和SoC(System on Chip)总线,以减少内存访问次数,提高数据压缩技术和工作负载的优化。
具体到实际应用层面,根据AMD的说法,全新的RDNA 3.5架构与上一代Ryzen CPU相比,同样的TDP下,每瓦性能最大可提升超过32%,能效比相当逆天。
不得不说,AMD在图形处理技术上确实有着深厚的积累,RDNA 3.5架构无疑将为用户带来更加流畅和高效的使用体验。
AMD XDNA 2架构
最后一部分是关于XDNA 2架构的内容,这主要与锐龙AI 300系列的NPU有关。根据我们上面的介绍可知,锐龙AI 300系列集成了最先进的Zen 5架构CPU核心,还拥有XDNA 2架构的NPU以及RDNA 3.5架构的GPU,在三大核心处理单元的加持下,为其带来强大的运算和AI计算能力。
AMD XDNA架构与传统多核处理器完全不同,从下面的架构图就可以看出,XDNA架构有更为灵活的计算单元和内存层次结构,与传统多核处理器相比,XDNA架构能够根据AI工作负载的特定需求,动态调整计算资源和内存访问,从而实现更优的性能和更低的延迟。
另外,XDNA架构还有高度可编程的互连和分区能力,该架构能够适应各种复杂的AI工作负载,提供实时视频处理和内容创作的强大支持。针对内存也进行了优化,AMD XDNA架构可以有效减少了内存带宽的需求,同时消除了缓存缺失的问题,确保了多任务处理的高效性和实时性能的稳定性。
XDNA 2架构在设计上相比XDNA 1有明显进步,首先AI engine Tiles由原来的20个增加至32个,因此AI算力直接翻了5倍,由原来的10 TOPS提升至50 TOPS。另外,XDNA 2的性能提升还源于多项创新,如:扩大内存容量、引入高效的数据传输技术,以及优化内存管理等。
与Ryzen 7040系列相比,AMD XDNA 2架构提供了高达5倍的AI计算能力。并且在相同性能下,能效比是前代产品的2倍,这也就意味着其续航能力也有大幅提升。
目前使用XDNA 2架构NPU的锐龙AI 300系列处理器在AI性能层面,有着无可比拟的优势,即便是最新推出的苹果M4也不是它的对手,50 TOPS的算力表现绝对称得上是目前最强大的NPU。
另外,XDNA 2架构还创新性的使用了Block FP16数据模型,这是一种新型的数据类型,专为AI设计,它不像其他数据模型需要进行量化,因此在保证计算准确性的同时,还能大幅提升性能,它的出现可以说代表了AI数据处理的一大进步。
根据AMD给出的数据可知,Block FP16在保持与FP32相当的高准确度的同时,还能提供更高的吞吐量和更小的模型尺寸,因此可以有效减少模型的存储需求。
此外,Block FP16的灵活性允许它作为FP32的直接替代品,并且几乎不损失准确度,软件厂商完全能够无缝地将现有模型迁移到AMD平台,Block FP16的高效性和兼容性,将推动AI技术在更广泛的应用场景中实现创新和突破。
目前Block FP16已经可以应用于Stable Diffusion XL Turbo模型。另外,得益于Block FP16高准确度的优势,在Llamav2 7B模型的响应速度测试中,拥有XDNA 2 NPU的锐龙300 AI 系列足足比Intel Core Ultra 7 155H快了5倍之多。卓越的AI能力,进一步证明了XDNA 2架构在AI领域的先进技术和性能优势。
当然,AMD不仅在硬件上进行了创新,它还构建了一个广泛的AI PC平台生态系统。通过与150多家AI驱动的独立软件供应商(ISVs)合作,AMD正在重塑游戏、娱乐、个人AI助手、创新创作和编辑以及企业生产力等多个领域。
总的来说,AMD XDNA 2架构的推出,不仅展示了AMD在AI计算领域的领先地位,也为未来的AI应用提供了强大的硬件支持,预示着个人电脑在智能化方面将迈出更大的一步。
随着AI技术的不断进步,XDNA 2架构有望在游戏、娱乐、企业生产力等多个领域带来革命性的体验。
结语
随着AMD Zen 5架构、锐龙9000系列处理器以及锐龙AI 300系列处理器的推出,我们再次见证了个人计算性能的一次巨大飞跃。
这些创新不仅在传统的CPU性能上取得了突破,更在AI计算、图形处理和能效比方面树立了新的标杆。除此之外,AMD的XDNA 2 NPU和RDNA 3.5 GPU架构的融合,预示着一个全新时代的到来,在这个时代中,AI将无处不在,为用户带来更加个性化、智能化的体验。
通过与众多独立软件供应商的合作,AMD正在构建一个强大的AI PC平台生态系统,这不仅将重塑游戏和娱乐行业,也将在企业生产力和个人创作领域引发变革。
未来,随着AI技术的不断发展和普及,我们有理由相信,AMD势必将为我们的工作和生活带来更多的便利和惊喜。