正文内容 评论(0

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇
2022-03-30 23:00:03  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

【内核架构:这次完全变了】

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

Intel Arc锐炫显卡基于高性能的Xe HPG架构,基本组成单元包括Xe内核、Xe媒体引擎、Xe显示引擎、Xe图形流水线等,我们逐一来看。

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

大家知道,Intel GPU多年来的基本模块一直都是“执行单元”(EU),Xe HPG架构上变成了全新的“Xe核心”(Xe Core)。

Xe核心中又包含16个256位矢量引擎(XVE)、16个1024位矩阵引擎(XMX)、192KB共享缓存、载入存储单元等等,其中缓存可以根据工作负载,在一级缓存、共享本地内存(SLM)之间动态分配。

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

Xe核心的上一层级是渲染切片(Render Slice),每个包含4个Xe核心、4个光追单元、4个纹理采样器、几何前端、光栅前端、HiZ单元、2个像素后端。

渲染切片可以多组结合扩展,Arc显卡最多有8个。

Arc显卡完整支持DX12 Ultimate、Vulkan,并且同时支持DXR光追、Vulkan光追。

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

这就是Arc显卡完整的内部架构图。

等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇

矢量引擎改进了ALU单元,提供专用的FP浮点执行接口,共享的INT/EM整数执行接口,每个时钟周期可以执行16个FP32操作、32个FP16操作、64个INT8操作。

由于AI算法核心几乎完全围绕矩阵乘法、累加算法,所以Xe核心里加入了单独的矩阵引擎,专门用于执行XMX指令。

它具备独立的执行端口,每个时钟周期可以执行128个FP16/BF16操作、256个INT8操作,512个INT4/INT2操作。

责任编辑:上方文Q

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#Intel#显卡#Arc锐炫

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...