驱家通行证
联系我们 | 镜像合作
 
首页 | 资讯 视点 评测 | 产品体验 | 驱动中心 更新 搜索 分类 查询向导 订阅向导 驱动精灵 | 软件之家 硬件工具 | 社区 | 手机版
Blog版本
文章索引
核心硬件 常用配件 掌上设备 数码影音 网络设备 办公外设 游戏相关 OS/软件 业界科学 品牌整机
当前位置 > 新闻中心 > 核心硬件 > 显卡 > 斯坦福大学:ATI GPU具有最好通用计算性能
关键字: 搜索

斯坦福大学:ATI GPU具有最好通用计算性能

2006-09-30 08:28:00 Loading 作者:且听枫吟/Rookie 编辑:且听枫吟/Rookie

Beyond3d采访了Stanford大学的Mike Houston,讨论了ATi刚刚宣布的Folding@Home项目。Houston表示目前ATI芯片具有最好的GPGPU架构,同时他还透漏NVIDIA GPU进行通用运算的劣势所在。

Beyond3D:是不是X1K系列GPU的动态分支性能可以让你们真正挖掘R580(和R520)的GPGPU功能,特别是BrookGPU的GROMACS(分子动力学软件)。那么这种方式是否可以在当前其他的硬件上实现?除此之外,X1K还有哪些功能是GROMACS性能的关键?是否在fragment硬件中接近峰值性能?内存带宽如何?GROMACS的什么功能让芯片工作负荷严重?你们是如何挖掘芯片在该应用中的潜力的?

Mike Houston:所有的GPU都是SIMD,所以分支肯定会有相应的性能结果。我们仔细设计了代码,具有很高的分支统一性。代码严重依赖于shader中巨大的循环数目。对于ATi而言,循环和分支运算可以通过数学来处理。我们有很多数学计算。我们所运行的fragment shader非常接近所使用的指令顺序峰值。但是,我不能说分支就是该应用实现的关键。我认为是X1K令人难以置信的内存系统和线程设计使得它成为了最适合GPGPU的架构。这允许我们以接近峰值的速度运行fragment引擎。

ATi所能实现而NVIDIA却无法做到的原因是因为运行Folding代码需要在每个fragment中动态执行许多指令。而对于NVIDIA来说,在指令大于64K后,shader终止并在Color[0]->Color[3]中以R0->3退出。所以,对于NVIDIA显卡,我们必须执行多通道运算,这可能导致缓存崩溃并增加芯片外部带宽要求。

另外一个对我们很重要的是ATi硬件中纹理延迟隐藏的方式。通过数学计算,我们可以消除所有纹理读取的成本。我们可以在很宽范围内进行海量计算,我们可以在同一内存系统中驱动更多ALU。NVIDIA则无法隐藏纹理延迟率,更重要的是,即使发出一个float4取回命令也要花费4个周期。所以NVIDIA的成本=ALU+纹理+分支,而ATi则可以将GPGPU性能发挥到最好。

在当前NVIDIA硬件上运行代码还不可能,我们必须对代码做出巨大变化,即便如此,性能还是不理想。我们将关注NVIDIA的下一代架构并作出评估。ATi和NVIDIA的下一代芯片都引人注目。

斯坦福科研项目Folding@home先驱者Vijay Pande表示,他的团队还优化了GPU中心软件的运算法则,将让现有GPU速度再提高“10至15倍”。

另外Rage3d刊登了一些ATi显卡GPGPU性能信息:

●是常规GPU峰值性能的100倍。

●X1900XT运算性能为500 GFlops,相比而言Cell处理器只有220 GFlops,Core 2 Duo处理器更是只有25 GFlops。

●10000台配备X1900XT显卡的客户机性能相当于一台PetaFlop的超级计算机。

●目前支持X1900、X1950等级显卡,不久后就支持X1800。

●X1900XT folding时功耗为80W,比3D运算时还少 。

如果你有一款X1900显卡,有多余的处理资源,为什么不加入Folding@Home,为人类健康事业做出自己的贡献呢?

目前Folding@home进行中的研究:

阿兹海默症

癌症

亨廷顿病

成骨不全症

帕金森氏症

核糖体与抗生素

我们也同时期待NVIDIA、Intel、AMD等业内芯片厂商能够开发出类似的流运算技术,让计算机技术更直接地造福人类。

点击这里进入Folding@home中文页面


斯坦福大学:ATI GPU具有最好通用计算性能


收藏本文】 【手机看新闻】【意见反馈】【   】【关闭本页
相关新闻
· CREATIVE新品发布试听暨媒体交流会 (07-11) · 蓝宝ATI FirePro V3800显卡试用 (07-08)
· 索尼新掌机PlayStation Vita真机试玩图赏 (06-08) · 索尼宣布新一代掌机PlayStation Vita (06-07)
· HTC Sensation中文版售价出炉 (05-30) · 港行Sensation、Galaxy S II发布在即 (05-29)
· HTC首款双核机Sensation中文版将售 (05-23) · HTC双核机Sensation加入禁止刷机队伍 (05-15)
· HTC双核机Sensation接受预订 (05-05) · 索尼称PlayStation网络一周内部分恢复 (04-29)
网友点击排行
HD7950比HD7970还快?Tahiti构架奥义探秘
iPad 3再曝光:9.7寸高分屏效果令人惊叹
QQ2012 Beta 1开测 快来下载!
跳票四年:三菱节能激光电视终上市
2012款MacBook Pro猜想:新模具长续航
完爆HD6870!HD 7770/7750完全规格泄露
联想这三年
京东商城开始卖车了
2012先兆?黄石公园火山隆起速度破纪录
无摄像头版iPhone 4S真机亮相
网友评论排行
券商看低NVIDIA:Tegra/GeForce都不给力
完爆HD6870!HD 7770/7750完全规格泄露
NVIDIA GeForce GTX 680预览
跳票四年:三菱节能激光电视终上市
开普勒GK104详细规格亦曝光:1536核心
HD7950比HD7970还快?Tahiti构架奥义探秘
iPad 3再曝光:9.7寸高分屏效果令人惊叹
苹果封杀富士康题材游戏
Intel Haswell上市时间首曝:IVB的悲剧?
中移动为何无缘iPhone:谁都不愿低头
科学·精彩
更多>>

揭秘《碟中谍4》中的壁虎手套

雷神公司夺标:电磁炮离现实又近了一步

暗物质图像首次绘制出炉

自我修复芯片重大突破 太空旅行会很轻松

详解宇宙究竟有多大

雷诺大叔再卖萌 丰田超强OLED概念车广告

堪比科幻大片:南极死亡冰柱沉入海底奇景

丰田造世界首辆意志控制变速自行车

今日要闻 更多>>
· 扎克伯格历史上所做11件蠢事
· Windows 7官方主题:《鸡不会飞》
· 2012索尼世界摄影比赛作品精选
· 盒装版C2步进i7-3960X/3930K双双驾到
· HD7950比HD7970还快?Tahiti构架奥义探秘
· SNS、微博“挤死”校园BBS
· 最古老情歌:1.65亿年前蟋蟀叫声再现
· NVIDIA GeForce GTX 680预览
· “真正”Radeon HD 7700规格及非公版亮相
· 2012款MacBook Pro猜想:新模具长续航
新闻视点 更多>>
QQ2012 Beta 1开测 快来下载!
完爆HD6870!HD 7770/7750完全规格泄露
· 跳票四年:三菱节能激光电视终上市
· 无摄像头版iPhone 4S真机亮相
· Intel Haswell上市时间首曝:IVB的悲剧?
· iPad 3再曝光:9.7寸高分屏效果令人惊叹
阅读排行
周阅读排行
月阅读排行
评 论
 
热门评论
一周热评
最新评论
 
· 驱动之家月招聘
· 铭鑫1GB军团登场
· 抢鲜试用华硕液晶VH232H
· 雷柏7100无线鼠90元
· 驱动精灵2010正式版
· 猜对得分就送铭鑫4850
· 华硕主板倡导DIY2.0时代
· MSN就你最牛专区