持续提升的计算能力

虎鲸 《电脑爱好者》2017年第4期 2017-07-25 14:34专题 标签:电脑 CES

在本届CES上,个人电脑处理器市场两强——AMD和Intel又一次拿出了自己的最强处理器,其中AMD的新一代APU更是宣称达到了对手最高端处理器酷睿i7的水平,而且在展示自家的最新旗舰GPU时也使用了这款处理器,说明对其性能有相当的自信心。在个人电脑的另一个主要计算元件——GPU方面,AMD的最高端产品Vaga同样是展会上的亮点,但独显GPU市场的另一巨头NVIDIA却已经将重点转移到了其他方面,因此并没有特别值得关注的个人电脑新产品展示。

作为能够为个人电脑直接分代的产品,处理器和GPU当然也是最受用户关注的产品,那么我们就详细介绍一下它们吧。

● AMD RYZEN处理器

AMD在2016年底就公开展示了AMD RYZEN(代号Zen)的样品(图1),本次在CES上公布了RYZEN台式机处理器更多的技术和性能细节,并且展示了来自于5家主板厂商16张AM4主板、全球17家系统集成商基于AMD RYZEN处理器的PC产品,以及创新的第三方CPU散热器设计。AMD还表示,全球顶级PC OEM厂商也将拿出AMD RYZEN相关产品。比较遗憾的是,AMD RYZEN系列处理器仍有部分规格没有正式公布,而是留给了最终的正式发布时刻,估计它将在GDC( Game Developers Conference,游戏开发者大会)之前正式发布,并且在GDC期间正式发售。

01

有国外媒体已经拿到了AMD RYZEN的样品,并与AMD目前的主力产品以及英特尔高端产品进行了对比测试。这款样品应该是比较高端的型号,其频率在3。15GHz(正式版频率为3.4GHz以上),采用8核16线程,拥有二级和三级缓存总量达到20MB。在数学计算性能测试中,AMD RYZEN的成绩超过了酷睿i7-6770K,甚至超过了6核12线程的i7-6800K,仅次于拥有10个核心与20个线程的怪兽级产品酷睿i76900K。在游戏能力测试中,受到频率较低的影响,其成绩与酷睿i5-6600(3.5GHz)类似,明显低于酷睿i7-6800K(3.4GHz)和i7-6700K(4GHz)。与自家的高端处理器FX8370相比,AMD RYZEN样品的计算性能测试成绩提升达到60%,而游戏能力成绩则提升了30%以上。AMD提供的样品并没有锁频,据称它可在风冷模式下超频至5.0GHz,使其性能巨幅提升,而且AMD很可能在这款产品中终结处理器的锁频时代,即所有产品都可以超频,不再提供专门的不锁频型号。

AMD高级副总裁兼计算与图形事业部总经理Jim Anderson表示:“2017年将是AMD,IT技术合作伙伴和整个PC行业难忘的一年,我们非常高兴能在CES上开始新的纪元,携手OEM合作伙伴,向看好AMD RYZEN的各界人士展示各种高性能主板和PC设计方案。AMD和合作伙伴致力于通过支持AMD RYZEN处理器的主板,定制化PC和相关高性能散热器,为发烧友、游戏玩家和创作者提供新一代计算的创新和选择。”

RYZEN采用新的AM4插槽,AMD也为此推出了支持RYZEN的桌面芯片组X370、300、B350和A320等芯片组,其中X370芯片组用于满足用户对超高性能,未来科技以及超级输入输出连接的需求,支持超频和双显卡。X300芯片组则可以满足在紧凑尺寸内追寻高性能的用户,可满足Mini-ITX尺寸规范,适合构建小型PC。在CES上展示了华擎、华硕、映泰、技嘉和微星等厂商基于这些芯片组的主板(图3)。

03

RYZEN处理器及其主板采用双通道DDR4内存,支持NVMe和M.2 SATA存储设备,提供了第一代和第二代USB 3.1接口。AM4芯片组支持PCI-E 3.0标准,并且为USB、显卡、数据和其他输入/输出提供了专用PCI-E通道,提供强大的,可扩展和可靠的计算体验。

AMD和Cyberpower,Maingear和Origin等携手推出一系列基于高性能AMD RYZEN处理器的“梦幻电脑”。AMD和合作伙伴在CES上展示了大量配备AMD RYZEN处理器的PC,其中就包括了国内的宁美国度和攀升兄弟等厂商,这些PC中既有外观独特,带有定制化水冷系统的个性方案(图4),也有精致、实用的解决方案。

04

宁美国度定制化DIY主机的核心配置部分由高端AMD RYZEN处理器+AM4 X370主板+RX 480交火构成,即所谓的3A平台(图5)。它搭配DDR4 3000双通道内存以及M.2接口的高端NVMe规范固态硬盘,使其数据传输率可以满足极为严苛的使用需求,提供出色的性能。其散热和外形也体现出了宁美国度的设计功力,机箱侧板上大大的ZEN字样显示出这台主机的血统,造型传统而具有厚重的金属质感,机箱内的呼吸氛围灯也给AMD RYZEN处理器带来一丝神秘的气息。

05

攀升兄弟的AMD RYZEN处理器DIY主机搭配了AM4接口的M-ATX B350主板。其造型颇为别致,被设计成了充满科技张力的外星飞船UFO的样子(图6),个性十足。它采用专为超频而生的V-game定制化水冷散热器,可以全面释放AMD RYZEN处理器的潜能;16GB双通道高频DDR4内存以及256G M.2 SSD提供的高速体验则迎合了UFO穿越宇宙的概念。攀升兄弟AMD RYZEN主机同样也为玩家准备了LED氛围灯,迎合现在玩家追求跳脱飞扬的强烈个性。

06

也许是因为A7890K等产品配置的个性化散热器受到了广泛的欢迎,为了满足发烧友和PC制造商对于超静音或超频散热解决方案的不同需求,AMD正与15家顶级散热器制造商和供应商合作,为AM4处理器打造一系列CPU散热器。对于需求超静音风冷散热的用户,Noctua将提供NH-D15和瘦身版本NH-U12S,EKWB旗下定制化水冷解决方案也将支持AM4接口产品。

基于AMD RYZEN处理器的PC、AM4主板和兼容散热解决方案将于2017年第一季度上市。

● 英特尔第七代智能英特尔酷睿处理器

由于英特尔的更新一代制造工艺有些延误,造成了“工艺进步”-“架构优化”的产品推出节奏“Tick-Tock”在新年度未能实现,不过英特尔还是希望通过进一步优化的智能酷睿处理器,为用户带来更强的性能,也继续刺激个人电脑市场。第七代智能英特尔酷睿处理器家族也代表着英特尔更长远的愿景——创造融合现实、沉浸式游戏、始终连接,引领未来的全新PC体验。

虽然新一代智能酷睿处理器的超低功耗版产品已经在移动市场发售了很长时间,但对发烧友来说,只有顶级桌面版酷睿i7才是真正需要的处理器,也是真正反映新一代处理器最高性能的代表产品。在本次CES上,英特尔也终于满足了这些用户的愿望,提供了新一代智能酷睿处理器的最强桌面版产品——酷睿i7-7700K。

作为救场产品,英特尔酷睿i7-7700K处理器确实给人缺乏亮点的感觉(图7),在CES上,英特尔也公布了这款最新旗舰级处理器的一些特色,但其中大部分都在酷睿i7-6700K甚至更早的智能酷睿处理器上出现过了。酷睿i7-7700K采用睿频加速技术2.0版,当应用需要更高性能时,可将处理器频率从4.2GHz动态提高至最多4.5GHz,并且会按需进行动态频率调节以减少耗电。它支持超线程技术,每个处理器内核能同时实施两个任务,所以其4个核心可以同时实施最多8个独立任务(线程),能改善多任务处理应用能力。它内置英特尔智能高速缓存,8MB共享高速缓存可根据每个内核的需求高效地进行动态分配,从而加快数据访问速度,显著减少常用数据的延迟,并提高性能。

07

i7-7700K(右)与i7-6700K(左)对比,可以看到其频率略微提升至4.2GHz

酷睿i7-7700K的集成内存控制器支持双通道DDR4-2400内存和DDR3L-1600内存,每通道带2个DIMM,支持基于英特尔Extreme Memory Profile(XMP)规范的内存。它支持16个PCI-E 3.0总线通道,可配置为1x16、2x8或1x8和2x4等多种模式,能够以最高8GTs的速度访问外设和网络。

酷睿i7-7700K内置英特尔高清显卡630,支持Microsoft DirectX 12 和4K超高清分辨率显示屏,动态频率最高为1150MHz。与内置显卡相配合的英特尔快速视频同步技术具有强大的媒体处理功能,可极速转换视频文件以支持便携式媒体播放器或在线共享,支持HEVC 10 位(H.265)编码解码,可以流畅播放4K超高清的优质内容。

随着互联网视频流量的爆发式增长,视频格式正逐渐由1080p转换为4K,标志着4K时代的来临,另外据IDC的统计分析,超过80%的城镇消费者会拍摄高清视频,并使用笔记本播放高清视频,对内容存储、播放和编辑的需求日益旺盛。但视频文件体积大导致的占用资源和运行卡顿,成为制约向4K体验迁移的痛点。第七代智能英特尔酷睿处理器打造的媒体与图形平台,能够完美支持4K UHD HDR内容、高保真音频,并可实现更加快速的4K UHD编辑。其中支持产业标准的HEVC 10位编解码和Google VP9编解码,可进行实时的4K内容编辑以及360度视频创作。据称HEVC解码的速度最高达120Mbps,适用于4K分辨率下60MHz实时处理,尤为适用于播放优质内容。许多在线视频服务商,例如Netflix、SonyPictures ULTRA(来自Sony Pictures的4K超高清电影和电视节目的优质流媒体服务)、爱奇艺都计划于2017年为第七代智能英特尔酷睿处理器提供足够的4K高清内容。

这两年兴起的AR、VR和MR的热潮也是英特尔努力的方向。业内知道,VR的前景在于能颠覆人们的想像,但早期的VR设备因为屏幕反应有延迟,会让用户产生眩晕感。标准的PC游戏一般是30帧/秒,VR则要求每只眼至少达到90帧/秒,分辨率最低为2K,最佳为4K,这无疑对于PC提出了更高性能和体验的要求。而第七代智能英特尔酷睿处理器强大的性能,再加上英特尔高清显卡所增加的VP9和HEVC10位硬件加速全新媒体引擎,完全可以打造出栩栩如生的VR沉浸式视觉效果。

调查显示,88%的设计者在处理很大的设计文件时,会遇到卡顿或死机的情况,且对VR内容创建者来说,第七代智能英特尔酷睿处理器通过硬件加速能够实现更加高效的转码处理,转码1小时4K UHD视频仅需12分钟(5年前电脑需85分钟)。至于游戏,相较于5年前的旧电脑,在搭载第七代智能英特尔酷睿处理器的PC上游戏运行更加平稳,视觉效果更好。与同一代高清显卡相比,英特尔锐炬Plus显卡性能提升65%,同时可使用更高的1080p设置运行热门游戏。

酷睿i7-7700K可以兼容所有具备最新BIOS和驱动程序的英特尔200系列和英特尔100系列芯片组。借助英特尔Z270芯片组,它可对其未锁频内核倍频器、电源、基本时钟和内存系数进行灵活的超频,也可以对未锁倍频的显卡进行超频。

● AMD Vega GPU

由于NVIDIA消费级GPU没有什么重磅消息和展示,AMD的新一代旗舰级GPU——Vega(织女星)就成为了最吸引人的产品。我们前面已经提到,在CES上,AMD用Ryzen处理器搭配Vega显卡进行了演示,演示项目为《DOOM》游戏,采用4K分辨率和最高的Ultra画质。从目前公布的视频看,游戏帧速基本保持在70FPS以上,看起来略强于平均帧速68fps的GTX 1080。

与目前的AMD旗舰级GPU——Fiji架构类似,Vega也采用了HBM(High Bandwidth Memory,高内存带宽)显存(图8),但Fiji搭搭载的第一代HBM显存容量有限,即便是旗舰产品Radeon Fury X也只有4GB显存,在应对高分辨率高画质游戏时就有些捉襟见肘了。Vega GPU采用的第二代HBM显存容量可以提升至8GB甚至16GB,更适合高分辨率游戏,其带宽是也达到了第一代HBM的两倍,达到256GB/s甚至512GB/s。

08

Vega GPU几乎完全重新设计了显存控制器,其HBM2显存被称作HBC(High Bandwidth Cache,高带宽缓存),GPU内的显存控制器也就成了 HBCC(High Bandwidth Cache controller,高带宽高速缓存控制器),而不是显存控制器(图9)。因为Vega GPU的寻址能力高达512TB,允许在显卡PCB上放置SSD、网络存储等超大容量的外存储设备,而且这些存储部件是可以像显存一样直接存取的,HBM2可以作为GPU和外部存储单元的大容量高速缓存。AMD之前公布的RADEON PRO SSG其实就是基于Vega GPU的专业显卡,它集成了 1TB的NAND闪存,可以将海量数据全部存放到显卡上,不再受限于系统总线和外部存储的性能,可以更高速地执行一些原先效率较低的工作,例如AMD用Vega显卡进行的数据达数 TB的豪华卧室场景渲染。

09

目前的包括RADEON在内的大部分GPU还保留了固定功能单元实现的几何处理硬件,不过 AMD已经注意到了越来越多的开发人员使用计算着色器来进行几何处理,为此在Vega GPU的几何流水线上引入了Primitive Shader(图元着色器),它可以以极高的比率舍弃无效的图像元素,实现高效几何着色处理,未来这个新着色器很可能会彻底替换掉现有的固定几何处理功能单元。AMD还为Vega GPU引入了Intelligent Workgroup Dostributor(工作组分发器),可以支持更多的着色器引擎,实现更灵活的载荷分配。实现更高效的几何处理性能。据称目前Vega可在4个几何引擎下每个周期处理11个多边形,达到两倍于现有产品的几何处理能力。

对应GCN架构中的CU(Computing Unit,计算单元),AMD在Vega GPU上引入了NCU(下一代计算单元)微架构。NCU支持紧缩(packed)数学处理,每个NCU拥有64个ALU,在采用紧缩数学操作指令的时候,可以支持每个周期512个8位计算,或者256个16位计算,又或者是128个32位计算。Vega GPU具备更高的频率和更大的指令缓存,可确保指令流运行得更持续,提升单线程性能。

Vega GPU对像素着色处理流程进行了大幅度的改进,采用新一代像素引擎DSBR(draw-streaming binning rasterizer,渲染流分仓光栅器)。DSBR会按照AMD称之为高速缓存感知化的方式来调度,先在一个高速缓冲中对一个场景中给定的“对象包”进行尽可能多的处理,然后GPU才会清空掉这个高速缓存并拾取其余的数据。DSBR可以让GPU在复杂的重叠几何体里抓出哪些像素无需渲染,节省掉在最终场景中非可视的像素渲染处理,让GPU更高效地处理像素着色,尤其是具有高度复杂性(意味着大量无效渲染)深度缓存的像素。

为了让DSBR更有效地运作,Vega GPU的二级高速缓存进行了重大的改进——在以往的 AMD GPU 中,纹理和像素的内存存取是非一致性操作,如果是执行渲染至纹理操作的话,需要先写到内存后,再读到纹理缓存里,增加了大量数据搬动的次数,而且这样的非一致性增加了大量的同步处理和驱动层级的编程挑战。Vega GPU的后端单元可以直接访问片上的二级高速缓存,这样的变化可以让更多的数据访问动作在片上的二级高速缓存上直接实现,减少了清空缓存然后在需要的时候又从显存中读回的过程,同样有助于延后式渲染技术的性能提升。

据称DSBR只是Vega GPU的光栅化处理途径之一,它并非一直采用DSBR来处理所有的光栅操作,而是和其他方式以高速的动态方式基于状态变换的,例如有过于庞大的数据无法放进二级缓存时,DSBR的效率就不一定很高。

目前披露的Vega GPU规格并不多,我们只能估计它拥有至少4096个流处理器,频率达到1.5GHz左右,配置至少8GB显存。从目前这款产品的表现来看,Vega应该可以对NVIDIA目前的旗舰产品,甚至传说中的GeForce GTX 1080 Ti造成相当的威胁,不过Vega的大核心设计和HBM2显存的成本较高,在价格方面可能并不乐观。