显卡参数误导 读懂NVIDIA的数字游戏

2015-07-08 15:09专题 标签:误导 显卡 NVIDIA 破除迷信

显存对于显卡的作用,就相当于内存对于整个PC,虽然起不到最关键的性能提升,但如果搭配不当是会降低显卡的性能的。所以说不论内存还是显存都很重要,不能让他们成为木桶效应中的短板。NVIDIA这几年的显卡表现突出胜过竞争对手AMD不少,但这是在GPU核心方面,在显存方面确实搞了不少“乌龙”,让我们来看一看。

GTX 660/660ti的非对等显存

当时大红大紫的中端显卡GTX660/660ti,采用了2GB显存192-bit位宽的设计。众所周知显存与位宽是对等设计,一般来讲2GB显存的位宽一定是64-bit,或者是128-bit的整倍数才是对等设计,而这个192-bit设计一经推出就让很多发烧友感到困扰。

果不其然,这192-bit位宽对应2GB容量的话,最终三个显存控制器单元中的两个分别对应两颗256MB、另一个单独对应四颗256MB。最终这种略显“奇葩”的设计导致2GB显存中的1.5GB可以享受全速带宽的完全交错操作,剩余的512MB则只能面对1/3带宽的非交错操作。

最终造成的结果是比较严重的,在一些占用显存超过1.5GB的使用环境中,GTX660/660ti不同程度上出现了帧率下降、高分辨率下画面扭曲拉伸、爆显存后帧数达到个位数的现象。

17

图1 超过1.5GB后GTX 660系列帧数会降至个位数

18

图2 在某些高分辨率游戏中画面会被拉伸

辩证看GTX 970显存问题

目前NVIDIA中高端显卡GTX 970是一块能够用2300元左右购买到的显卡,但是其性能完全可以达到旗舰级别显卡的要求。不幸的是在这块显卡上同样出了显存问题,出问题的依旧是那最后的0.5GB,不过本次可能并没有上一次那么严重。

NVIDIA在Maxwell架构中使用了一种新的显存架构,当初的GTX 970规格说明是有错误的,4个ROP/显存控制分区中实际上有1个被禁用了,实际ROP单元只有56个,L2缓存也不是当初说的2MB而是1.75MB,少了1/8。

19

图3 GTX 970禁用三组SMM单元同时部分单元功能也受影响

GTX 970搭配了4GB显存,不过它跟GTX 980相比拥有更少的SMM单元,内存系统也因此有更少的交叉资源。为了优化显存管理,NVIDIA将GTX 970的显存分为3.5GB和0.5GB两个部分,GPU会优先访问3.5GB那部分。NVIDIA会通过驱动程序让系统较少地访问那512MB分区的显存,实际在高负载当中游戏确实很难突破3.5GB,也没有出现当年GTX 660系列显卡那样的帧数暴降。

20

图4 GTX 970的规格同样骗过了不少检测软件比如GPU-Z