正文内容 评论(0

图形、计算齐头并进:AMD全新架构详解
2011-06-17 15:59:52  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

AMD Fusion开发者峰会上,AMD首席技术官兼图形业务执行副总裁Eric Demers登台演讲,揭开了下一代图形和计算架构的神秘面纱,拉开了R600 Radeon HD 2000以来最大规模的变革。

AMD的新架构大大加强了加速计算能力,但依然称为“AMD Graphics Next”,可见传统的图形仍会有相当高的的地位,事实上AMD也在演讲中强调了3D图形仍然会继续进化。另一方面,AMD图形和计算架构并不是单独进化,而是隶属于更大的体系“Fusion系统架构”(FSA)的一部分,也就是说今后GPU、CPU会联系得越来越紧密,共同加速。

这里我们就再结合Eric Demers的演讲幻灯片看看AMD的图形核心架构是如何从昨天走到今天,又是准备如何一步一步走向明天。由于各方面的限制,这里不太可能做太详尽的介绍,只是走马观花预览一下,对更深入细节感兴趣的同学可以对着幻灯片好好研究研究。

图形、计算齐头并进:AMD全新架构详解
Eric Demers

图形、计算齐头并进:AMD全新架构详解
GPU演化第一阶段:2002年前,固定功能,专为图形服务,没有通用计算能力

图形、计算齐头并进:AMD全新架构详解
第二阶段:2002-2006年,简单的Shader,以图形为主,支持浮点处理

图形、计算齐头并进:AMD全新架构详解
DX8、DX9下的第一代Shader

图形、计算齐头并进:AMD全新架构详解
第三阶段:2007年至今,图形并行核心,图形仍是关键,统一Shader架构,基本的通用目的计算

图形、计算齐头并进:AMD全新架构详解
第三阶段进化:2010年至今,GPU计算,图形还是很重要,但也针对计算优化,实现高性能计算

图形、计算齐头并进:AMD全新架构详解
VLIW5架构

图形、计算齐头并进:AMD全新架构详解
对称的VLIW4架构

图形、计算齐头并进:AMD全新架构详解
GPU计算能力的进化

图形、计算齐头并进:AMD全新架构详解
AMD Fusion系统架构(FSA)路线图:物理集成(当前阶段)、平台优化、架构集成、系统集成

图形、计算齐头并进:AMD全新架构详解
新架构中占据核心地位的计算单元(CU)

图形、计算齐头并进:AMD全新架构详解
每个计算单元中都有四个SIMD单元(共享16KB一级只读缓存和32KB一级指令缓存),各自可处理10个Wave,总计40个;一个矢量单元,每时钟周期可处理四个线程 

图形、计算齐头并进:AMD全新架构详解
全面的可读写缓存设计,每个计算单元16KB一级数据缓存、64KB二级缓存,而且后者可与所有前者互连

图形、计算齐头并进:AMD全新架构详解
CPU使用MMU(内存管理单元),GPU使用IOMMU(输入输出内存管理单元);CPU、北桥和GPU使用统一寻址空间,都使用相同的x86 64位指针,无需转移数据

图形、计算齐头并进:AMD全新架构详解
Fusion系统架构特点总结:GPU全面支持C/C++和其它高级语言,CPU/GPU统一虚拟寻址空间,GPU可以访问所有系统内存并处理分页错误,CPU/GPU之间保持内存一致性,GPU具备优先调度和上下文切换,FSA可同时用于独立显卡和Fusion APU,今后每年都会增加新特性

图形、计算齐头并进:AMD全新架构详解
3D图形自然不会背抛弃,也会随同进化,而且GPU内仍会有固定功能硬件,未来还会实现FSA、3D的融合,让计算能力为3D图形服务

图形、计算齐头并进:AMD全新架构详解
AMD下一代图形和计算架构要点

图形、计算齐头并进:AMD全新架构详解
多任务统一计算:异步计算引擎(ACE)、多重并发上下文 

图形、计算齐头并进:AMD全新架构详解
可扩展的多任务图形引擎

图形、计算齐头并进:AMD全新架构详解
原语管线和像素管线都可以灵活扩展

图形、计算齐头并进:AMD全新架构详解
但是它们都使用统一Shader核心

图形、计算齐头并进:AMD全新架构详解
异步计算引擎控制各个计算单元:命令管理器、独立和并发网格/团体调度器、实时任务调度、后台任务调度、计算任务图形处理、错误检测与校正(EDCC)

图形、计算齐头并进:AMD全新架构详解
计算单元详细架构

图形、计算齐头并进:AMD全新架构详解
计算单元详细架构 

图形、计算齐头并进:AMD全新架构详解
指令缓冲与预取

图形、计算齐头并进:AMD全新架构详解
指令仲裁与解码

图形、计算齐头并进:AMD全新架构详解
分支与信息单元

图形、计算齐头并进:AMD全新架构详解
整数标量单元

图形、计算齐头并进:AMD全新架构详解
矢量ALU单元

图形、计算齐头并进:AMD全新架构详解
非VLIW矢量引擎 

图形、计算齐头并进:AMD全新架构详解
本地共享内存(LDS)

图形、计算齐头并进:AMD全新架构详解
矢量内存操作

图形、计算齐头并进:AMD全新架构详解
可读写缓存

图形、计算齐头并进:AMD全新架构详解
多级可读写缓存

图形、计算齐头并进:AMD全新架构详解
标量+矢量

图形、计算齐头并进:AMD全新架构详解

【本文结束】如需转载请务必注明出处:快科技

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...