CPU+GPU二合一 回顾英特尔核显时代

《电脑爱好者》2017年第24期 2018-05-28 10:53专题 标签:英特尔 核显

[an error occurred while processing the directive]

收购ATI之后,AMD最早提出来融聚理念:将CPU和GPU打包成为一颗芯片。然而,英特尔却凭借32nm制程工艺的领先优势,抢先在第一代酷睿Westmere(桌面/笔记本代号分别为Clarkdale/Arrandale)尝鲜CPU和GPU的融合,从此掀开了核显时代的序幕。

一代酷睿:掀开核显序幕

虽然第一代酷睿赶上了CPU融合GPU的头班车,但不得不说英特尔此次有些匆忙了,因为此时CPU和GPU还都是独立存在的,只是被封装在同一块PCB上而已,它们之间使用QPI总线相连,被玩家形象地称为英特尔用“胶水”将CPU和GPU粘在了一起(图1)。

01

不过,至少在形态和空间占用上,这一代的酷睿处理器已经达成了目的,英特尔也做出了集成显卡→核芯显卡的更名。

需要注意的是,这代处理器的CPU部分采用了32nm工艺,GPU部分还停留在45nm工艺层面(图2)。其中,GPU部分里包含了PCI-E控制器和内存控制器,其本质就是一颗北桥芯片。和上代GMA4500集成显卡相比,第一代核芯显卡将EU单元从10个提升到了12个,核心频率提升到了最高900MHz,性能提升还是颇为显著的。为了延长笔记本的续航时间,移动版处理器的GPU还可以通过Turbo Boost动态调整频率。

02

二代酷睿:实现真正的融合

有了Westmere的经验积累,英特尔2011年发布的第二代酷睿处理器(Sandy Bridge)终于实现了CPU和GPU“真融合”的目标:CPU和GPU全部为32nm工艺打造,并和内存控制器、PCI-E控制器全部整合到一个核心之中(图3)。

03

为了满足不同客户的需求,英特尔将第二代核芯显卡细分为了HD2000和HD3000,其中HD2000内置6个EU单元,为不支持超频的桌面处理器所用;HD3000拥有12个EU单元,专为移动酷睿(笔记本专用)和桌面K系列可超频的处理器猎装。

需要注意的是,由于二代酷睿处理器的三级缓存改用了环形总线设计,而GPU可共享三级缓存,所以哪怕是6个EU单元的HD2000,其性能也会明显超过第一代核芯显卡。

三代酷睿:性能功能大跃进

2012年上市的第三代酷睿处理器(Ivy Bridge)凭借首发22nm工艺,对GPU部分进行了大幅度的优化更新。首先,英特尔将和核芯显卡细分为HD2500和HD4000(图4),前者EU单元为6个(桌面处理器),而后者EU单元则提升到了16个(移动酷睿和K系列桌面处理器),同时加入了对DirectX11、OpenGL3.2的支持,增强了并行运算能力,Quick Sync 2.0编码加速技术还能加速视频编辑进度,视频输出能力也从原来的双屏上升到三屏输出。

04

从HD4000开始,笔记本电脑终于可以凭借唯一的核芯显卡应对主流3D游戏的挑战了,比如在低画质下流畅运行《英雄联盟》不再是奢望。要知道,当年《英雄联盟》可是堪称集显杀手的存在哦。

四代酷睿:规范命名 锐炬诞生

2013年,第四代酷睿处理器(Haswell)对核芯显卡进行了“大手术”,引入了模块化设计、可扩展的设计,从而走上了暴力堆砌核显规格的道路,并规范了以“GT+数字”的核芯命名方式。

此次英特尔将核显细分为了GT1(具体型号为HD Graphics,内置10个EU单元,用于赛扬等低端处理器)、GT2(HD4200/HD4400/HD4600,内置20个EU单元,主要为移动酷睿和桌面处理器所用)。

GT3内置40个EU单元,并被进一步细分为15W GT3、28W GT3和GT3e。其中,15W GT3具体型号为HD5000,为i5-4260U等移动酷睿所用;28W GT3名为Iris(锐炬)5100,专为i5-4258U等移动酷睿所用;而GT3e被命名为Iris Pro 5200,集成额外的128MB eDRAM(可作为L4缓存(图5),性能堪比当时的GeForce GT650M独显,被i7-4980HQ移动酷睿和i7-4770R等桌面酷睿所用。

05

可惜,锐炬核显只为小众的高端和顶级处理器所用,而搭配它们的产品却大都还配备了额外的高性能独显,核显的重要性被大幅淡化。最需要更强核显加持的中低端处理器则只能使用GT1和GT2,这是时至今日英特尔也没能改进的无奈特色。

五代酷睿:蓄势待发中

第五代酷睿处理器(Broadwell)诞生于2014年,其核显在API方面有了大幅提升,支持DirectX11.2、OpenGL4.2和OpenCL2.0,甚至已经领先于NVIDIA当时主打的麦克斯韦架构。

这一代核显GT1、GT2、GT3内置的EU单元分别提升到了12个、24个和48个,分别对应HD Graphics、HD5300/HD5500和HD6000/Iris 6100/Iris Pro 6200。这一年,英特尔还推出了TDP仅有4.5W的酷睿M(集成HD5300,针对新兴的二合一设备),同时桌面(如i7-5775c)也开始集成Iris Pro 6200。

还是上面的问题,买i7-5775c的用户怎能不配独立显卡,再强的核显又有什么意义?此外,这一代酷睿主要是为英特尔试水14nm工艺,尝试“真正”的SoC(System on a Chip)设计(图6),为第六代酷睿的推出奠定基础。

06

六代酷睿:核显最终定型

第六代酷睿处理器(Skylake)在2015年发布,这一代的核显有着较大的革新,支持最新的DirectX12、OpenCL 2.x、OpenGL 5.x、Vulkan等图形规范,还支持HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速。同时,英特尔还对核显进行了更名,后缀型号由四位数缩减为三位数(如HD515、HD520、HD530),并推出了集成72个EU单元的GT4(Iris Pro 580)(图7)。

07

可以说,正是从Skylake开始英特尔核显才最终定型,第七代和第八代酷睿处理器的核显都是在其基础上进行的修修补补。

七代酷睿:提供硬件级解码能力

2016年上市的第七代酷睿(Kaby Lake)集成的核显取名为HD615、HD620、HD630和Iris Plus,它们和上代核显在规格上并无不同,只是取消了GT4,全系列加入了HEVC Main/Main10、VP9 8-bit/10-bit的硬解码能力,在应对4K级别视频的播放变得无比轻松和省电。

八代酷睿:马甲改名再战一年

今年9月面世的第八代酷睿处理器(Kaby Lake-Refresh和Coffee Lake)集成的核显与上代依旧没有太大变化,只是名字从HD620等改为了UHD620,性能上的提升几乎都源于更高频率带来的增益效果。这一代的核显最大特色是支持HDMI 2.0/HDCP 2.2标准,以及硬件编解码10bit 4K HEVC,可流式处理4K UHD视频(图8)。

08

核显性能遭遇瓶颈

纵观英特尔近些年的核显战略,移动酷睿的整体规格都要优于桌面处理器,目的就是帮助没有空间安置独立显卡的轻薄本提升图形性能。然而,从Skylake开始,最近三代核显在性能上处于原地踏步的节奏,虽然多媒体特性有所增强,但还不足以驾驭最新3D游戏的挑战。哪怕英特尔旗下还有锐炬核显,但其性能也只是勉强比肩NVIDIA GeForce 930MX的水准,随着以MX150为代表的新一代主流独显的出现,英特尔高端核显优势不再。

问题来了,更轻更薄更强是未来PC的发展趋势(图9),特别是对超薄本和PC平板二合一类型的设备而言,英特尔酷睿处理器的CPU运算性能没的说,如何才能弥补核显性能层面的瓶颈?为了满足未来市场的发展需要,英特尔做出了一个破天荒的决定——携手AMD一起打造处理器!

09