正文内容 评论(0)
总体架构设计:极具创意、极高效率的分离式模块
酷睿Ultra处理器是Intel在消费级市场上第一次采用分离式模块化架构,将传统的单芯片一分为四,分别叫做计算模块(Compute Tile)、SoC模块(SoC Tile)、图形模块(GPU Tile)、IO模块(IO Tile),如同搭积木一般。
这其实就是我们已经见过很多次的Chiplet(小芯片/芯粒),Intel Sapphire Rapids第四代可扩展至强处理器、Ponte Vecchio GPU加速器就都是这种设计,AMD更是锐龙、霄龙、Radeon、Instinct全线都在用。
酷睿Ultra当然不是简单粗暴地将整个芯片分开,而是精心地进行了各种优化设计,比如重组计算密集型IP、增加低功耗AI核心、重建电源管理模块、提升IO带宽与扩展性等等,再结合不同的先进制造工艺、封装技术,实现了性能、能效的飞跃。
计算模块,就是CPU核心与缓存,包括最多6个全新Redwood Cove架构的P核(性能核)、最多8个全新Crestmont架构的E核(能效核)。
它首次采用了Intel最先进的Intel 4制造工艺,也是酷睿Ultra四大模块中唯一使用该工艺的。
其他三个模块的具体情况暂未公开,目测大概率是台积电的5-7nm,甚至不排除IO模块使用更成熟的12nm。
图形模块就是核显,升级到了全新的Xe LPG架构,和桌面上的锐炫Arc A系列的Xe HPG架构同宗同源,并针对低功耗做了优化,性能和能效都有了飞跃。
但是,这里只有GPU图形渲染相关单元,以前在一起的媒体引擎、显示引擎都搬到了SoC模块,显示物理层则搬到了IO模块。
SoC模块不是传统意义上的System on Chip,但同样集成了众多功能模块,包括低功耗E核(LPE)、NPU AI独立引擎、内存控制器、无线控制器、媒体引擎、显示引擎、安全引擎、图像信号处理器、电源管理单元、系统代理、IO缓存(IOC)等等。
尤其是其中的两个低功耗E核,也就是LPE核,和计算模块的P核、E核联合构成了全新的3D高性能混合架构。
这也是Intel 12代酷睿首次引入混合架构之后,最为重大的一次变革。
IO模块当然就是负责输入输出连接了,包括雷电4控制器、PCIe 5.0控制器,但不仅于此。
如前所述,Chiplet设计不是简单地把一颗大芯片拆成多颗小芯片那么简单,需要在多个层面进行新的思考与优化。
首先就是不同芯片、不同功能单元之间的通信如何才能达到最高效率,不能出现“交通拥堵”反而造成通信效率的下降,直接拖累性能。
比如在以往的设计中,媒体引擎、显示引擎一直都和图形引擎同时集成于图形模块之中,以至于我们一直默认它们就是一个整体,而且通过同一条环形交叉总线和CPU核心、缓存、内存相连,仿佛“华山一条道”。
但其实,它们都是在不同场景下执行不同的工作,并不需要同时开启,比如看视频和玩游戏就是完全不一样的。
同时,无论图形引擎还是媒体引擎,但它们需要访问内存的时候,CPU核心就不得不都陪着保持开启状态。
酷睿Ultra将媒体引擎、显示引擎都转移到了SoC模块中,而且彼此是独立的,也不再依赖于CPU核心即计算模块。
如此一来,所有的IP都可以通过单独的路径分别访问内存,也都可以独立开启或者关闭。
比如看视频的时候,只需要开启显示引擎、媒体解码,其他部分就都可以关掉。
随着芯片规模的增大、功能的丰富,无论是单芯片设计还是多芯片设计,都面临同样的IO通信带宽与效率问题,稍有不慎就容易成为瓶颈。
酷睿Ultra这样的分离式模块架构上,随着媒体与显示引擎分离、低功耗E核加入、NPU AI单元加入,依次连接不同单元的的传统单一直连总线显然已经无法满足如此众多、多样的通信需求。
一种解决方法是为每个IP单元加入相应的通信通道,但这一方面会大大增加设计的复杂度,另一方面也不够灵活,未来如果要调整或加入更多单元又得重新设计。
Intel的解决方案分为两部分,一是带宽高达128GB/s的全新可扩展交叉总线,以其为中心直连各个单元模块,二是单独设计的IO缓存(IOC),统一管理所有的IO排序与寻址转换。
这种设计不仅可以解决传输带宽与延迟问题,而且是非常弹性的,未来有更高的需求,可以轻松提升带宽、增加缓存。
12代酷睿引入的混合架构,提高了不用负载计算的灵活性,但也存在一个问题,那就是哪怕轻量级负载,也得让整个CPU计算部分保持开启状态,造成极大的浪费,这也是12/13代酷睿笔记本续航普遍不佳的一个关键原因。
酷睿Ultra的解决方法是在SoC模块中,引入了一个低功耗计算岛,包括2个低功耗E核,它的架构和常规E核相同,只是频率和功耗更低,专门负责单独处理一些连常规E核都用不到的特别轻的负载任务。
比如看视频的时候,有了低功耗E核的掌控,不但SoC模块里的其他单元可以休息,媒体模块、计算模块、IO模块更是可以全部关掉,从而节省非常可观的功耗,极大地延长续航。
然后是电源管理部分,进行了彻底的重组,随着不同芯片的分离而分离,在四大模块中都有单独的电源管理单元。
其中,SoC模块上的处于核心地位,不但管理所在的SoC模块,还通过新的高带宽、低延迟、可扩展交叉总线,与其他模块上的电源管理单元联系在一起,起到协调沟通的作用,保证集体行动的一致性。
另外,SoC上的电源管理单元还负责与系统、软件层面的联络,实现软硬件的协调一致和高效率。
总的来说,酷睿Ultra在非核心部分做了大量的改进工作,成就了有史以来最高效的设计,尤其是在架构、电源管理方面做了多方面的大胆尝试,也为未来发展奠定了基础。
接下来,我们再深入各个不同的模块,看看它们都是怎么设计和工作的。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...