正文内容 评论(0)
NVIDIA两年前公布的这张路线图应该还有人记得吧,按照当时的规划,Fermi架构之后NVIDIA显卡将进入Kepler时代,原本预计是在2011年底发布的,不过受限于TSMC台积电28nm工艺进展不利等多方面因素,Kepler一直拖到这个月才能发布。
早在Fermi显卡未发布之前,NVIDIA就公布了大量有关显卡架构的信息,有关Fermi的PDF资料非常详尽,NVIDIA乐此不疲地在多个场合公开展示Fermi显卡,即便黄总手中拿的只是个模型。那时NVIDIA的表现很高调,因为Fermi确实是划时代的变化,无论是游戏还是计算都让人刮目相看。
当然,首发的GTX 480/470作为显卡的表现是低于预期的,并非性能有问题,而是显卡的功耗和发热太高了,还好NVIDIA后续优化了工艺,微调了GF110架构推出的GTX 580/570,这种两款显卡的表现就好多了,可以为市场和消费者接受了。
面对HD 7970的进攻GTX 580的性能还是略输一点,NVIDIA也要升级架构了
时光荏苒,现在又到了架构升级的时刻了。只是与Fermi时代相比,NVIDIA的表现显得低调了许多,Kepler直到这个月才在GDC 2012大会上展出,现场演示了EPIC的《Samaritan》demo,不过还是封闭系统,看不到实卡。
官方闭口不言,我们能获得有关Kepler显卡的来源就只有媒体传闻以及各路“大神”的私下爆料了,有关Kepler的新闻大都是“传xxxxx”,简单来说就是只能在各种传闻和泄露中捕捉有关Kepler的信息。
传闻不一定是可靠的,不过IT媒体的传闻并非简单的谣言,除了一部分哗众取宠的臆造(比如Kepler的PhysX模块)之外,很多传闻应该是空穴来风,是厂商或者知情人士放出来探口风,里面当然有真有假,只要多多对比、小心分析还是能从中得到一些准确信息的。
现在里Kepler正式发布只有一周的时间了,不过有关Kepler的性能、架构、核心以及价格等方面的信息还没有准确的消息,今天我们就从各种传闻中摸清Kepler显卡的底细,看看NVIDIA低调的背后是惊人的爆发还是真的技不如人。
Kepler能否重新夺回世界最快的显卡称号?
显卡的名字就跟人名一样,名字好坏给人的第一印象也会大相径庭,同一个人叫“高富帅”还是“高二狗”是有明显区别的。当然,显卡的命名更简单了一些,一般就是字母+数字的形式,但是在GK104身上,显卡命名的跌宕回肠足以媲美国产谍战剧。
我们都知道这一代NVIDIA显卡属于“Kepler”家族,架构代号也不再是GF开头,而是代之以GK。按照惯例,首先出的应该是旗舰级的GK110架构,据传它有1024个CUDA核心,60亿个晶体管,512bit显存,规格基本是GTX 580的翻倍,甚至还泄露了它的GPU-Z信息图。
早期流传的GK110核心GPU-Z规格图
早期都认为NVIDIA将跳过GTX 600命名,GK110将直接进入GTX 700序列,不过GTX 700的流言只存在了很短时间,因为NVIDIA并没有打算跳过GTX 600系列,而且初期发布的并非GK110核心,它将让位于中端的核心GK104。除了NVIDIA自己,没人知道他们为什么要先发GK104,GK110难度太大还是TSMC工艺不给力,或许两者兼有。
既然首发的是GK104,那么它又叫什么呢?对比当前的核心以及显卡命名,有人称GK104将命名为GTX 660 Ti,并有衍生版本GTX 660,这个流言既贴近现实,又符合传统,按理来说应该是最可能的,遗憾的是你猜中了开头,却猜不到结尾。
进入2月之后,GK104的具体名称锁定在了GTX 670 Ti以及GTX 680身上,SA网站也报道过说GK104将有两种核心,完整版的为GK104-400,拥有8组SM单元,将命名为GTX 680,而次阶的为GK104-335,拥有7组SM单元,将成为GTX 670(当时没说带Ti后缀),关系有点类似目前的GTX 580以及GTX 570。
再往后,Sweclockers援引台湾某显卡厂商的消息称GK104将以GTX 670 Ti的名义在CeBIT展会之后发布。
从本月初开始曝光的实物图开始增多,首先是RedQUASAR论坛曝光了GTX 670 Ti显卡实物照片,从上面的印记来看,显卡确实是GTX 670 Ti,既然官方都写上名字了,看来GTX 670 Ti确有其事。
不幸的是,GTX 670 Ti没活几天,各路达人又爆料说GTX 670 Ti只是NVIDIA的烟雾弹,刷BIOS之后就会变成GTX 680,性能暴增40%,而这才是它的正式身份和能力。(现在来看显卡上雕刻GTX 670 Ti字样的做法也太明显了,之前的N卡上只有贴纸,没有这样的字样)
这么多名称到底哪个是对的?该到揭晓答案的时刻了,GK104发布时的名字确实就是FeForce GTX 680,GTX 670 Ti只是NVIDIA迷惑对手的工具。当然后续可能还是有GTX 670 Ti这个型号的显卡的,不过首发时没有GTX 670 Ti的份。
回顾有关Kepler显卡的命名一事,你会发现这里面谋略重重,一环扣一环。从早期的GTX 700若隐若现到GTX 600浮出水面,从GTX 660 Ti的合理推断到GTX 670 Ti的出其不意,最后又到了GTX 680尘埃落定,NVIDIA、现场厂商、媒体以及爆料达人把三十六计用得出神入化,故弄玄虚、声东击西、无中生有、浑水摸鱼等等一一呈现,除了迷惑对手之外,也吸引了大批“不明真相的群众”围观,闹得用户心神不定,到底是买已上市的HD 7000系列还是等待GK104上市呢。
当然这还只是显卡名称上的风波,如果再算上规格、性能、价格以及发布日期等方面的消息,这出戏还要精彩的多,要比《潜伏》、《窃听风云》这样的谍战剧还要刺激,这都是后话了。
规格:像雾像风又像雨在命名上做文章顶多是障眼法,规格上的泄露才有实质性意义,因为规格可以透露很多秘密,内容远比名称更丰富。在这一点上,GK104的规格泄密也像是挤牙膏一样,一点点爆料,但是各方来源又是欲说还休,最终也是像雾像风又像雨。
核心面积
也许是对前两代大核心战略显卡忍够了,Kepler最为人关注的一个问题就是核心面积,是继续Fermi那样的巨核高性能还是类似AMD这样的Smart Die呢?NVIDIA公开做的回应是选择了前者,依然是追求性能第一,不过这也不代表Kepler的核心会更大。
以GK104为例,核心面积一直秘而不宣,之前的爆料称其核心长宽约为18-19mm,面积在324-321mm2之间,比GTX 580的530mm2大大降低,而且低于HD 7970的365mm2。
GK104的PCB曝光之后,有人根据它与HD 7970显卡的PCB对比计算出其核心面积约为320mm2,符合之前的猜测。
前两天我们获得了GK104的核心图,显示GK104核心呈正方形,长宽都在17mm左右,核心面积大约是300mm2,比之前提到过的都要小。
现在可以确定的是GK104是小核心,比HD 7970还要低很多。同时,伴随核心面积降低的还有TDP功耗,3Dcenter的报道显示其TDP功耗只有190W左右,低于HD 7970的210W(最大功耗为250W),更低于GTX 580的244W。
核心频率:低频or高频?还有动态加速
小核心确定了,那么GK104的频率有多高?这一点有两个版本,首先是高频版,GK104的功耗和发热解决之后,显卡可以工作在更高频率,核心频率将超过900MHz甚至1GHz,而且shader频率也不再是原来的2:1分频模式,将会同频运行。
之前PCI论坛爆料GK104性能时显示频率达到1050MHz
另一种观点是GK104的核心频率不会太高,只有705MHz,但是Shader频率继续2:1模式从而达到1411MHz,VR-Zone报道过GK104的详细规格,而泄露的笔记本型号上使用的GK107架构也确实是原来的2:1分频模式。
NBR论坛上放出的GK107架构显示Kepler依然是2:1分频模式
显存的规格是NVIDIA早就确认了的,256bit位宽,2GB GDDR5显存容量,但是频率相比Fermi时代徘徊在1000MHz而言大幅提升,达到了1500MHz(等效6.0GHz)。
此外,NVIDIA并不满足固定的核心频率,GTX 680将支持动态超频技术(dynamic clocking),因为多数游戏中显卡并非满负载运行,距离TDP功耗还有一点空间,显卡频率还有提升的空间。这一技术类似CPU中的Turbo Boost加速,BIOS可以根据显卡负载动态调整频率,进而自动超频5%以提高性能。
泄露的NVIDIA官方文档显示核心频率确实过1G(来源:太平洋电脑网)
最后隔壁网站泄露了完整的GTX 680规格,频率确实达到了1GHz以上,动态加速还能继续提高5%左右。
PCB设计:使用均热板,横向排列的供电?
PCI论坛很快有人泄露了GK104的散热以及供电电路设计,显示GTX 680显卡的散热器与目前的GTX 580大有不同,首次使用类似均热板那样的嵌入式热管,散热鳍片也是单独定制的,排列更紧密。风扇还是涡轮式,但是经过噪音抑制处理,静音水平比前代要好。
随同曝光的还有显卡的PCB以及供电接口。
供电分为5+2相,5相GPU核心,2相显存,最奇特的是5相PCB供电电路改成横向排列,这几年的显卡里非常少见。
垂直排列的供电接口比传统方式占用空间更少
显卡的规格参数也确定了,核心架构也有了准确的消息。Kepler的流处理器单元(NVIDIA也叫CUDA核心,以下统称CUDA核心)也大幅攀升,GK104将拥有1536个CUDA核心,相比GTX 580提高了2倍,NVIDIA如何在芯片面积大降的同时塞入更多的核心呢
回想前两年的情况,对NVIDIA来说开发Fermi架构的过程无疑是艰难的,它太庞大了,但抛开难产的过程不谈,Fermi架构是NVIDIA的得意之作,无论是游戏还是通用计算上都能左右逢源,Kepler显卡的架构不可能重起炉灶,必然是在Fermi架构基础上修改而来。
众所周知,Fermi家族衍生出两大核心,一个是完整版的GF100以及后续的改进型GF110,另外一个就是GF104以及后续优化的GF114(其实GF114=GF104),Kepler更像哪一个架构呢?
GF110架构:高性能、高代价
GF100/GF100架构示意图
首先来看GF110,它分为4组GPC,每组下辖4组SM单元,每组SM单元又有32个CUDA核心,总计有512个CUDA核心,64个纹理单元,48个ROP单元,16个曲面细分单元,搭配6组64bit显存控制器,总计384bit位宽,1536MB显存。
GF110架构中的每组SM单元设计
这些是看得见的参数,实际上Fermi之所以这么设计主要是为了HPC高性能计算,具体到每组SM单元中又是由32个CUDA内核为基础运算单元,每个内核又包括完整功能的整数单元和浮点单元,配备64KB L1缓存,16个LD/ST存储单元以及四个SFU多功能单元。
GF100架构用在通用计算方面的确是最合适的,16组SM意味着16个运算单元(OpenCL计算中是以SM单元数量为计算单位的,GPLBench或者Luxmark中都要看SM单元数量,AMD的现在称为CU单元),GPU通用计算上比前代GT200架构有着质的提高。
当然,GF100的代价也是巨大的,核心面积达到530mm2,发热也很恐怖,第一代GTX 480显卡甚至需要阉割部分CUDA核心才能控制住功耗和发热。
实际上游戏运算跟GPU通用计算并不是一条路,Fermi架构的为了提高数据吞吐量配置了大容量L1、L2缓存对3D游戏用处并不大,所以NVIDIA为Fermi架构准备了B计划,精简规格,提高效率,推出了GF104架构。
GF104:精简,高效
GF114架构示意图
GF104架构首先应用与GTX 460显卡上,GPC只有2组,SM单元数量也从16组减少到8组,但是每组SM单元的CUDA核心数提高到48个,看起来是增加了,不过在其他单元如调度器、寄存器、L1缓存没有增加的情况这意味着资源争抢的情况也多了,对数据计算来说意味着削弱,但是对图形运算来说是增强。
除了CUDA数量变化之外,GF104的L2缓存也减少了,内存控制器减少到4组,位宽256bit,曲面细分单元也减少到8组,但是纹理单元依然维持在64个,ROP单元还有32个,图形性能受损不如规格精简幅度那样大,而功耗与核心面积却大大降低了,无论是GTX 460还是之后的GTX 560 Ti、GTX 560在温度与功耗上反倒比高端显卡还要好。
网上流传的一张GK104架构图,明显更像GF100架构一些
那么Kepler的架构应该源自哪一个?GK104架构确信有1536个流处理器,恰好是GF110的3倍,浴室上个月就有人PS了上面这张图,显示GK104将有16组SM单元,每组SM单元变成96个CUDA核心,恰好符合1536个流处理器的特征。
初看一下似乎也很合理,不过实际情况却不是这样。这么说似乎有些马后炮的感觉,但是GK104并非GF110那样的旗舰定位,而是类似GF114这样的中高端显卡,而且有GF104成功的先例在前,NVIDIA没理由去复制GF110架构设计。
实际上GK104的架构更像GF114
最终的结果就是GK104的架构更像GF104,它的每组SM单元中塞下了192个CUDA核心,是GF110架构的6倍,是GF104架构的4倍,SM单元总数也不是16组,还是8组,这样总计有1536个CUDA核心,1536的数值是这么算出来的,而非GF110乘以3那样。
目前知道的架构设计就是这些,纹理单元未知,不过纹理单元是跟SM中的SFU单元对应的,GF100架构中每组SM单元有4个TA纹理寻址单元、16个TF纹理过滤单元,GF104中每组SM提高到8个TA、32个TF,GK104的纹理单元有说是128个,也有说160个,目前还没有确切消息,需要等到GK104的架构完全公布才能知晓。
两个未解之谜,GK104的后续等等从这两三个月的各种流言蜚语以及爆料之中我们已经可以为GTX 680画像了,它使用TSMC 28nm工艺制造,核心面积约300mm2,TDP功耗195W。核心频率超过1GHz,显存频率达到1500MHz,标准2GB/256bit GDDR5显存。
其显卡为封闭式内排方案,使用了嵌入式热管设计,涡轮风扇做了噪音抑制改进,不过具体效果未知。显卡供电为5相GPU,2相显存,主供电搭配1上2下MOSFET,其他的还芯片还不太清楚,而供电接口只需要两个6pin,一改以往旗舰单卡的6+8pin标准配置。
只是我们还有两个最主要的谜题没能揭开,Kepler的性能和售价还没有准确消息。有人说NVIDIA凡是以80命名的显卡在性能上就没输过,从最早的DX10显卡GTX 8800 算起,在GTX 280、GTX 480、GTX580身上确实如此,这话还是蛮准的。由于HD 7970已经发布了三个月了,NVIDIA对其性能也是心知肚明,在这种情况下还把GK104命名为GTX 680说明他们还是有信心的。
具体的性能数据上小编没有,而且就算有也不能泄露,不过根据厂商的反馈,GTX 680轻松超过HD 7970是没问题的,至于能否达到40%的领先就不好说了,而且NVIDIA内部测试的驱动更新频繁,每次更新都有性能提升,尚不知测试时是哪个版本的驱动。
另一个关键问题是价格,看了前面的分析连小编也觉得GTX 680将是接近完美的一张卡,低发热、低功耗的同时高性能,这种情况下只有傻子才会制定出比HD 7970更便宜的价格,SA炮制出的299美元已成泡影,3DCenter给出的价格是549美元(人民币3500左右),与HD 7970同一水平,后者的国内定价是4299-4699元,GTX 680的国内售价就自己想吧。
Kepler一来,GTX 580已经开始降价了,支持4屏的影驰HOF GTX 580显卡只有3999元
当然,Kepler的消息一确定,最让消费者受益的还是当前的显卡大降价,欧洲市场上公版GTX 580的售价降到了339欧元(人民币2800元),非公版也有10-15%的降价。
GK104的问题到现在就算终结了,谈下一话题:那就是GK104的后续是什么?(先无视低端的GK107)
很多人会说这不明摆着呢吗,编号x04的核心只不过是中端定位,旗舰级的还是留给GK110核心,规格也都曝光过多次了,2304个CUDA核心,160个纹理单元,48个R0P单元,显存位宽、容量分别为384bit、3GB,将在今年8月份发布。
是的,很多消息都是这么说,但是谁说一定会有更高级别的核心?NVIDIA既然能在显卡命名上放烟雾弹,为什么GK110不是烟雾弹?仔细想下,GK104已经把旗舰级的GTX 680命名占用了,更高阶的显卡如何命名?GTX 685,这个也有可能,毕竟GTX 280以及GTX 285就同时存在过,但是GTX 680显卡在性能、功耗控制上表现都会比HD 7970要好,NVIDIA还有必要再出一款更高级别的核心吗?
啰嗦了这么多,个人的观点就是如果GTX 680的表现确实非常给力,那么GK110就没有理由这么快出现,而GK110很可能只是接下来的双芯卡的代号(你可以注意一下目前的新闻中提到GK104的双芯卡时从来就没有提到过它的架构代号),目前有关GK110规格的消息依然是烟雾弹。
这里并不否认更强的核心的存在,不过它应该是为了对付AMD HD 8000系列而来的,GTX 600系列已经被NVIDIA用完了,那么它很可能命名为GTX 700系列,类似NVIDIA之前对待GTX 480以及GTX 580一样,不同的是GTX 680不会有GTX 480那么杯具的功耗和发热。
PS:以上观点为个人猜想,没有内幕消息支持,至于实际情况会不会是这样我也先立贴为证,也欢迎大家提出自己的看法。
NVIDIA现在喜欢用物理学家的名字命名显卡架构,Kepler除了是物理学家之外还是天文学家。面对这个“浩瀚的宇宙“,我们目前只了解了一部分,还有更多的未知之谜需要等待实际评测才能解开。
Kepler家族将在3月22日太平洋时间早上6点、本地时间22日晚上9点解禁,到时超能网也会奉上详细的评测,为你揭秘最真实的GTX 680显卡。
Hello,Kepler。(文/超能网)
本文收录在
#NVIDIA
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...