AMD第三代锐龙 性能为王

《电脑爱好者》2019年第14期 2020-07-08 16:28专题 标签:AMD 第三代锐龙

在进入Zen架构时代后,AMDCPU又一次有了与英特尔争夺性能皇冠的实力,近几年也屡次夺得了最强消费级CPU的桂冠,虽然英特尔也屡次迅速反应,重返性能宝座,但比Zen老得多的酷睿架构却逐渐露出了疲态。而这一次的新架构锐龙更加难以应对,甚至已经展现出了长期霸占王座的能力。

在第二代锐龙推出时,很多人就在质疑为何不采用改进更大的Zen 2架构,而是渐改架构Zen+。而在第三代锐龙现身后,这一问题终于有了答案,很明显Zen 2在设计时就已经考虑到结合更先进的7nm制程,不仅提升核心效率,而且还结合新一代Infinity Fabric互联总线技术,实现了更灵活的模块化配置。

针对核心效率,Zen 2架构的主要改进包括分支预测改进、整数吞吐提升、浮点模块翻番、内存延迟降低、三级缓存容量翻番、频率大幅提高等,将代表核心效率的IPC(每时钟周期指令数)再次提升了15%,单线程性能提升了多达21%。在消费级市场中,核心效率的提升主要表现在游戏能力方面,同样是8核心16线程,锐龙7 3800X相比于锐龙7 2700X,在主流游戏大作的帧速中可以提升少则10%,多则34%以上。而在之前的Zen、Zen+核心效率已经接近英特尔酷睿的情况下,这一次的效率提升实际上也让锐龙的单核性能达到了与酷睿并驾齐驱的水平,在已经公布的很多测试中,第三代锐龙从单核到多核,也都确实表现出了与对手同等甚至更高的能力。

不过作为通用性极高的计算单元,它是否能在很多针对英特尔优化的软件中有更好的表现,或者获得厂商的承认,同样进行足够的优化,我们尚未可知。而在这方面,近期的一个例子就是最新版的Windows 10终于修正了一个针对锐龙CPU的Bug,使得锐龙CPU的效率、功耗等都有了明显提升。虽然这一示例对用户来说是积极的,但在初代锐龙已经上市两年多之后才修正了这样的Bug,也说明AMD的厂商优化之路仍然很长。

除了核心效率的提升之外,Zen 2的多芯片设计也更加灵活。毋庸讳言的是,7nm制程在目前仍然是比较困难的,而且对很多芯片来说并无必要的技术,所以第三代锐龙采用了I/O部分与CPU分开的设计(图2),在I/O部分中仍然使用12nm制造工艺,也就是所谓的hiplet多芯片设计,或者说是俗称的“胶水”芯片。不过这一设计还是相当实用的,除了降低核心规模,提升良品率外,还可以更加灵活地组合CPU模块,构成更多核心,甚至升级为超多核心的霄龙(EPYC)CPU。

hdz-ptdxp-02

为了保证这样的多芯片设计不会影响整体性能,AMD还使用了第二代Infinity Fabric总线,提升模块之间的通信带宽、降低响应延迟。它提升了带宽,采用总线频率、内存频率分离式设计,单位功耗降低了27%,可支持PCIe 4.0标准,特别是为消费级CPU应用进行了优化(图3)。

hdz-ptdxp-03

第二代Infinity Fabric总线架构

第三代锐龙的基础模块仍然是含有4个物理核心的CCX(CPU Complex),两个CCX组成一个CCD(CPU Complex Die)独立芯片。其中每个核心的三级缓存增加至4MB,比第二代锐龙翻番,一级缓存也进行了调整以提高效率。不过在大幅度增加缓存的情况下,得益于新架构和新工艺,三代锐龙的每个CCX模块面积却从二代锐龙的60平方毫米缩小为31.3平方毫米,有利于在同样封装下集成更多核心(图4)。

hdz-ptdxp-04

单独的I/O Die集成了输入输出控制中心、一体化内存控制器。每个CCD有各自的Infinity Fabric PHY物理层,可直连I/O Die芯片内的数据总线(Data Fabric)。不过各个CCD芯片之间没有直接通道,通信必须经过I/O Die,这样可以保证不同核心、缓存之间的延迟是一致的,让多线程性能提升几乎达到了完全的线性。

Zen架构的内存延迟是比较明显的,也一直是为人诟病且影响性能提升的问题,在第三代锐龙中,内存延迟大幅降低,加上支持更高的DDR4内存频率、翻倍的三级缓存、更准确的分支预测能力,使其性能有了明显提升。

此外第三代锐龙在计算单元的设置、微指令、操作方式等方面也进行了改进,并且支持单操作AVX-256、更快的虚拟化安全、硬件增强安全防御等等,CPU模块设计和操作方式的上进行了全面强化和革新。最后,Zen 2作为新的架构,在设计中就已经考虑到从硬件层面避免Meltdown、Spectre等CPU架构漏洞,所以基于这一架构的第三代锐龙也就成了一款相对安全且无需任何底层系统补丁,不会因此造成性能损失的CPU。

在市场方面,第三代锐龙的出现在高低两方面对市场的推动最为明显。低端方面将主流平台的起始标准拉到了6核心12线程,这已经超过了数年前的高端CPU,让所谓的入门机型应用能力大幅提升。而在高端CPU中,它提供的12核心24线程配置则达到了之前专业级CPU的水平,在消费级电脑中运行专业软件会成为很平常的事。

当然,这样的设计会进一步推动对手的CPU不断增加核心/线程,同时消费级应用软件的多线程利用率也必须提升,才能适应CPU的发展趋势。

表1