温故而知新 回顾AMD历代APU家族

《电脑爱好者》2017第23期 2018-05-14 11:19专题 标签:AMD APU

和英特尔相比,AMD在笔记本领域始终没能占到主导地位,在绝大多数普通用户心里的存在感很低。那么,难道是AMD不重视移动处理器的发展吗?答案自然是否定的,AMD从始至终都没有放弃在移动站场的努力。

从群龙乱舞到APU一统江湖

在很多年以前,PC领域(台式机+笔记本)还是奔腾一统江湖,而Mobile Pentium则是英特尔专门针对笔记本定制的移动芯片。面对越来越红火的笔记本市场,AMD自然也不能闲着,于是就以“龙”之名,和英特尔展开了军备竞赛。

以速龙之名反击

在AMD历史上,首个能与Pentium抗衡的处理器来自Athlon(速龙)家族,而Athlon XP-M和Athlon 64-M则是该家族的低功耗移动版(图1),用来和Mobile Pentium抢生意。

01

为了规范笔记本市场,英特尔抢先提出了迅驰平台概念,强调CPU、芯片组和无线网卡都是笔记本不可分割的组成部分,并取得了极大的成功。一时间,“这款笔记本迅驰了吗”成为用户最常用的疑问句。

多条飞龙出击

迅驰平台发布之后,AMD发现自己一夜之间就被市场边缘化了。为了抢回客户,AMD也在笔记本领域提出了“平台”的概念(比如Kite、Puma、Tigris、Danube、Yukon等),只是没有学习英特尔迅驰强行捆绑Intel自家的芯片组和无线网卡,而是允许OEM厂商搭配第三方芯片组和无线网卡,较高的自由度受到了业内的广泛好评。

同时,AMD凭借Turion(炫龙),一举将笔记本处理器领进了64位时代(图2),随后还先后推出了移动版的闪龙(Sempron,定位低端,对手为赛扬M)和羿龙(Phenom,定位高端,对手为酷睿),至此多条以飞龙命名的处理器,就组成了AMD移动家族的豪华产品线。

02

迈入融聚时代

AMD在很早以前就发现了一个问题,CPU性能固然重要,但在以游戏为代表的多媒体体验上,更强的GPU才是王道。考虑到英特尔有自家的集成显卡技术,虽然(在当时)性能极为孱弱,但也能满足办公和基础娱乐的需求。于是,AMD计划来次“弯道超车”,以GPU作为突破口,从而在笔记本领域取代英特尔成为市场的主流。

为了实现这个目的,AMD在2006年7月24日花费54亿美元的巨资收购了拥有21年历史的全球领先图形IC厂商ATI(图3),随后提出了著名的AMD+ATI芯片组+ATI显卡的“3A”平台概念,一时间名声大噪(图4)。

03

04

而APU是“Accelerated Processing Units”的简称,中文名字叫加速处理器,是AMD基于Fusion融聚理念且已酝酿3年之久的战略级产品(图5)。APU最大的特色就是将AMD的CPU、DX11级别的GPU和北桥芯片整合在一个单元中,首次将AMD引以为豪的3A平台“融聚”到了一颗APU身上。

05

至此,AMD终结了混乱的羿龙、炫龙、速龙和闪龙乱舞的格局,精简的产品线和规范的型号命名,也便于消费者快速锁定符合需求的产品。

从1到7 重新认识一下APU成员

AMD自从2011年推出第一代APU以来,迄今APU也已经历了七次升级,恰好与英特尔酷睿平台的更替节奏相似。在解析第八代APU平台之前,我们还是先来回顾一下前七代APU的历程吧。

第一代APU:Llano(2011年)

AMD第一代APU平台的架构代号为“Bobcat”(图6),基于40nm工艺打造,并被细分成了“Llano”、“Zacate”和“Ontario”的三个子系列,字母代号为A(包括A4、A6/A8,TDP为35W或45W,定位普通笔记本)、E(如APU E-350,18W TDP,定位轻薄本)、C(如APU C-50,9W TDP,定位上网本)。其中,定位最高的Llano APU系列才被公认为第一代APU(图7)。

06

07

第一代APU主要包括四种特性:超低功耗、全面支持DX11、提升高清硬解性能之后的UVD 3.0技术、以及对应如Office、IE9等软件的加速计算功能。以定位偏高的A8-3500M为例,它属于四核异构计算处理器,在其内部已经实现了异构计算体系,主频为1.5GHz~2.5GHz,集成Radeon HD6620G显卡(400个流处理器),TDP为35W。

而这一时期APU笔记本主打的卖点,就是允许Radeon HD 6000M系列独立显卡可通过PCI-E X16通道和处理器相连,与APU内置的图形核心组成双显切换、混合交火,虽然效果达不到1+1≧2,但综合表现还是>1的。

第二代APU:Trinity(2012年)

AMD第二代APU平台的架构代号为“Trinity”,采用32nm工艺设计,在性能、功耗和功能方面都有较大的提升(图8),比如内置新一代高清媒体加速器、集成Radeon HD7000系列显卡,支持第三代AMD智能超频技术等等。而Trinity APU最大的变化,在于支持Turbo CORE 3.0动态超频技术,将具备双UTDP的Barts架构引入到了APU当中,同时进一步加深了GPU与CPU部分的联系,从而实现了显示输出与通用计算性能的同步提升。

08

考虑到这一时期上网本已经退出历史舞台,超极本概念喧嚣尘上,所以AMD放弃了一代APU的C系列,E系列改为入门级,而A系列的变化则最大:新增定位更高的A10-4600M,最高主频可达3.2GHz,集成Radeon HD7660G显卡,而TDP被控制到了35W。同时还新增A10-4655M和A6-4455M这种25W和17W TDP的产品线,专为和超极本相似的轻薄产品定制。

第三代APU:Richland/Kabini(2013年)

AMD第三代APU平台的架构代号为“Richland”(图9),为了迎合营销需要,此次AMD引入了更酷的中文命名,比如低电压版至尊高性能APU、经典主流APU和至尊移动APU等系列,分别针对游戏、高清娱乐、触控笔记本、平板电脑等不同用户需求(图10)。

09

10

Richland APU继续使用32nm工艺设计,采用了AMD PileDriver核心架构与Radeon HD8000系列显卡,支持AMD手势控制、脸部登录、屏幕镜像技术、DirectX 11.1、Radeon双显卡交火和AMD快启等最新技术。以面向高端的A10-5750M为例,它的最高主频可达3.5GHz,集成了Radeon HD8650G显卡,和独显组成交叉火力后可以实现更强大的3D性能。

“Kabini”是三代APU的低功耗版,也就是针对类似超极本形态产品定制的产物。它基于28nm工艺设计,属于SoC芯片,内部整合了Jaguar美洲虎架构CPU核心、GCN架构GPU核心、内存控制器、PCI-E、I/O、视频输出、USB3.0主控等等,有利于帮助设备进一步与瘦身,代表产品有A6-5200和E2-3000等。

第四代APU:Kaveri(2014年)

AMD第四代APU平台的架构代号为“Kaveri”,它最大的进化就是首次实现了HSA架构特性(图11)。而HSA架构的特色就是GPU与CPU不再是分开工作,该架构可以让GPU与CPU能同时成为一件任务的处理媒介,从而使Kaveri APU处理任务的效率得到大幅提升,达到1+1>2的效果。

11

具体来说,Kaveri APU基于28nm工艺设计,由多达12个计算核心构成,包括4颗“压路机”X86核心和8颗GCN GPU核心,支持DX 11.2、UVD 4.2/VCE 2.0编解码功能。此外,Kaveri APU还支持Mantle技术以及AMD TrueAudio技术。前者相对于DirectX可以为用户提供性能更强、功能更加全面的图形技术支持,同时还能提升手势控制体验。而AMD TrueAudio技术则可以让笔记本电脑的音质输出更加卓越,代表产品包括AMD FX-7500、A10-7300和A8-7100等,融合的GPU型号分别为Radeon R7、Radeon R6和Radeon R5。

第五代APU:Beema(2014年)

Beema APU属于低功耗移动平台,我们能将其视为三代Kabini APU的升级版,依旧是28nm工艺设计,但它却将CPU部分换成了Puma+美洲狮,GPU架构也升级到GCN 1.1,支持系统级别电源管理,号称可在几乎一半的TDP下带来50%的频率提升。同时,Beema还整合了ARM硬件加密安全模块(图12),融入了Cortex-A5架构的TrustZone技术,AMD称之为“平台安全处理器”,代表产品包含A6-6210和E2-6110等。

12

第六代APU:Carrizo(2015年)

第六代APU有着非常重要的意义,因为按照AMD APU四步走的战略,经过Llano CPU/GPU物理整合、Trinity/Richland的CPU/GPU互联增强、Kaveri的CPU/GPU统一寻址,直到Carrizo才最终在架构、操作系统、加速计算等各个方面做到CPU/GPU的真正融合与异构计算(图13)。

13

具体来说,Carrizo APU依旧是28nm工艺设计,它基于AMD挖掘机核心和第三代GCN图形核心架构设计,提供12个计算核心(4个CPU + 8个GPU),通过异构系统架构实现创新计算体验,并且支持DirectX 12和HEVC硬件解码技术。Carrizo APU代表型号有A8-8600P、A10-8700P和FX-8800P,分别集成Radeon R6和Radeon R7显卡(图14)。

14

第七代APU:Bristol Ridge/Stoney Ridge(2016年)

第七代APU较上代产品主要在游戏性能、视频渲染以及文件压缩性能上有所改进。这一代的APU被划分为四核的Bristol Ridge和双核的Stoney Ridge两个分支家族,其中Bristol Ridge APU定位高端,包括35W和15W两种版本以及AMD FX(如FX-9800P)、A12(如A12-9700P)和 A10(如A10-9600P)三种规格。而Stoney Ridge APU则主打低功耗,包括15W的A9-9410、A6-9210和E2-9010,它们之间的差别主要由15W/35W热设计功耗以及R5/R7 “融合单显”两方面差异化组合产生(图15)。

15

高开低走 APU逐渐沦落边缘

在2017年以前,虽然AMD APU和英特尔酷睿都经历了七次更新迭代,但能被消费者口熟能详的却大都为酷睿家族,作为首创Fusion融聚理念的APU却逐渐被边缘化,这又是为什么呢?

英特尔也玩融合

在很早以前,笔记本领域CPU和GPU都是分家的。请注意,这里的GPU指的不是独立显卡,而是集成显卡。在AMD计划推出第一代APU之前,集成显卡都是寄生在北桥芯片内,需要占用笔记本主板上额外的一部分空间。AMD收购ATI最大的野望,就是终有一天能将CPU和GPU封装进同一颗芯片内(图16)。

16

就在AMD紧锣密鼓准备第一代Llano APU之际,英特尔却抢先一步推出了第一代酷睿处理器(Westmere架构),将CPU和GPU打包封装。虽然此时酷睿处理器内的CPU和GPU核心内部还是独立存在的,但毕竟GPU已经不再受北桥芯片制约,至少在物理结构上实现了“二合一”(图17)。2011年,英特尔第二代酷睿处理器(Sandy Bridge)进一步实现了CPU和GPU的融合。虽然AMD的融合理念提出的最早,但在落实方面却还是落在了英特尔后面。

17

随后,英特尔历代酷睿家族不断强化集成显卡(又称核芯显卡)性能,EU单元逐渐从6个、12个增加到24个,甚至还推出过拥有72个EU单元的GT4e。虽然早期同档次的酷睿处理器就3D性能的确略逊于APU,但衡量处理器实力的关键还是CPU运算性能和功耗,想弥补图形性能只需添加一颗额外的独立显卡芯片即可,最终导致AMD APU在GPU性能上的优势逐渐被稀释,不再是决定胜败的核心卖点。

被落后工艺拖累

生产工艺是制约处理器性能发挥的最核心指标,哪怕在工艺技术上冠绝群雄的英特尔都有吃瘪的时候(14nm从五代酷睿一直沿用到八代酷睿,被很多DIY玩家戏称“挤牙膏”),AMD在这方面自然就吃到了更多的苦头(图18)。作为AMD御用的晶圆公司厂,Globalfounderies(以下简称GF)总是不太靠谱,AMD第一代Llano APU就因GF 32nm量产遇阻而从2010年延期到了2011年,从而给力英特尔抢先一步融合CPU和GPU的机会。

18

2014年,英特尔五代酷睿(Broadwell)已经开始尝鲜14nm工艺,而AMD四代Kaveri APU却刚刚试水28nm,并一直沿用到七代APU。在落后工艺的拖累下,AMD就必须在CPU/GPU的核心数量和频率上进行取舍,很难找到一个最佳的平衡点。

打铁还需自身硬

AMD APU从诞生之初,核心架构依次经历了K10→Bulldozer(推土机)→Piledriver(打桩机)→Steamroller(压路机)→Excavator(挖掘机),就AMD自身来看的确是越来越先进,但与同期的英特尔酷睿家族相比,AMD的核心架构却早已落伍。在很多笔记本玩家眼中,“i3秒(AMD)全家”不再是笑话,以七代APU高端的FX-9800P为例,它的性能只与六代酷睿i3-6100U持平(图19),这就很尴尬了。

19

同时,受制于工艺和TDP的限制,APU已经很久没有升级GPU的流处理器单元数量了,从Kaveri APU就是512个,到了七代APU还是512个,在3D性能上几乎没什么提升。此外,为了实现APU和AMD独显组成交火,搭载APU的笔记本大都会选择和AMD自家的独显搭配,而近些年AMD移动显卡和NVIDIA同期产品相比性能也是明显落后的,这就导致AMD笔记本在高端游戏市场的集体失声。

来自Zen的野望

在台式机领域,AMD数年来也一直被英特尔压着打,直到2017年初全新Zen架构处理器(中文名为锐龙Ryzen)的上市才一改AMD往日的颓废,为沉寂已久的DIY领域注入了一针强心剂(图20)。锐龙Ryzen的强势,甚至逼得英特尔大幅降低高端产品的售价,并加速了八代酷睿处理器的变革。好消息是,锐龙Ryzen不再是台式机的专利,它即将为笔记本贡献自己的力量。

20