正文内容 评论(0)
随着14nm Broadwell-U的发布,Intel核芯显卡也进化到了第八代,目前已有Iris 6100、HD 6000/5500等不同型号,最多达48个执行单元,那么除了规模增大之外,技术上有什么新鲜的地方呢?
首先在API支持上有DirectX 11.2、OpenGL 4.3、OpenCL 2.0,特别是最后一个可用于并行计算,而且这一代支持CPU/GPU之间共享内存一致性,能在一定程度上实现异构计算。
Intel还宣称,新核显其实已经做好了支持DirectX 12的准备,只等微软的新规范最终落地。换句话说,微软已经公布的DX12技术现在都支持了,未来有什么变化也都可以调整兼容。
HDMI输出不算很先进,还是没有HDMI 2.0,仅支持到HDMI 1.4b,因此4K输出的刷新率局限在24Hz。
新的多媒体编码器支持VP8、VP9、H.265(HEVC),但最后一个并非全程硬件加速,而是软硬件结合的方案。
以上就是新核显的架构图,可以看到48个执行单元其实分成了相对独立的两部分(所以能砍掉一半用在中低端型号上),并且各自又分成了三个子区块(sub-slice),每一块里8个单元。
如果配置为128×SIMD8 32-bit,每个单元可以同时执行最多7个线程。
同时,每个子区块的像素、Z轴填充率也都得到了提升,前端几何单元也加速了。
如果你还记得Haswell的核显架构,会发现每个子区块的单元数其实减少了,以前有10个。这是一个很大的变化,线程分派、数据端口、一级和二级缓存采样都要随之调整,而且由于数据带宽压力降低了,不同子区块对共享内存的争夺减轻了,会有利于提升整体执行效率。
三级数据缓存也分成两块,对应每个部分,各自的容量都是576KB,其中384KB用于三级缓存内部通信,每个子区块得到64KB。
这是各级缓存的架构图,注意右上角的128MB eDRAM嵌入式缓存,还是存在的,但依然仅限于最顶级的Iris Pro,暂时还未现身。
第八代核显还原生支持半精度的16位浮点、整数,而根据Intel给出的计算规则,可以算出不同型号的32位浮点、64位浮点、32位整数性能如下:
48单元的规模更大,频率也更高,性能自然在24单元的两倍之上。
更多介绍可以参考此前的Broadwell GPU架构预览文章。
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...