正文内容 评论(0)
ECC全称是Error Checking and Correcting(错误检查与纠正),相比以往的奇偶校验技术ECC不仅能检查出错误还能自动纠正,提高了计算的可靠性,如果没有ECC校验人们需要计算出两次相同的结果之后才能确认计算成功。之前的GPU都不支持ECC技术,很难在商业计算中立足。Fermi的一大改进则是增加了ECC支持,而且核心内的register、cache和DRAM中都提供了ECC支持。
普通用户对ECC或许没有什么概念,但是在商业计算上ECC却是不可或缺的功能,GT200虽然实现了双精度浮点运算,但是并没有支持ECC,所以使用GT200的Tesla 10系列服务器只适合做小规模的集群,要想真正冲击高性能计算机领域只有靠Fermi架构的服务器了。
Fermi与前两代架构中的存储系统的不同(图片来源于realwordtech)
随着CUDA编译的程序越来越大,GT200中每SM单元16KB的共享内存已经不能满足需要,Fermi架构中每SM单元的可用内存/缓存提高到了64KB,而且配置方式非常灵活,既可以是48KB shard memory加16KB L1缓存也可以是16KB shard memory加48KB L1缓存,这样无论是对shard memory需求高或不高的程序都能从中受益。
Fermi中的L2缓存容量达到了768KB,而且是所有SM单元共享的,每一个SM单元都能从中获得最新数据,实现了GPU内的高速数据共享。
外部显存上,Fermi选择了GDDR5显存,拥有6条GDDR5内存控制,每条位宽为64-bit因此总位宽为384-bit,比GT200中的8条内存控制器512-bit位宽要少一些,不过GDDR5的传输速率要高于GDDR3,所以总带宽还有大幅增加,如果搭配1050MHz的GDDR5显存总带宽将达到201GB/s,显存容量也达到了1536MB,最高可达6GB。考虑到ECC显存不菲,桌面级Fermi可能去掉ECC支持。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...