麒麟990的最大遗憾!ARM Cortex-A77架构到底好在哪?

CFan 电脑爱好者 2019-09-19 10:17产品 标签:麒麟 华为 ARM 处理器 手机

华为最新发布的麒麟990系列无疑是2019年度最热的旗舰级SoC,台积电7nm+EUV工艺、原生集成5G基带、双大核NPU+单微核NPU(麒麟990 5G版)、ISP5.0等全新特性,让这颗芯片的综合实力超过了高通最强的骁龙855 Plus,只有明年上市的骁龙865才能一战。

01

然而,麒麟990系列最大的遗憾就是沿用了麒麟980的Cortex-A76和Mali-G76架构的CPU和GPU,而以三星Exynos 980、骁龙865、联发科5G SoC为代表的新品都将采用ARM最新推出的Cortex-A77和Mali-G77架构。

05

那么,作为ARM在2019年5月才刚刚发布的全新CPU/GPU架构,Cortex-A77和Mali-G77到底有了哪些改变?

ARM的年度迭代策略

ARM每年都会发布新一代的IP(内核授权)。

比如2016年发布的Cortex-A73(麒麟970、Helio X30和骁龙835)、2017年发布的Cortex-A75/A55(骁龙845)、2018年带来的Cortex-A76(麒麟980、骁龙855)。

ARM-Cortex-A77-CPU-Mali-G77-GPU

2019年,ARM再次祭出了全新的Cortex-A77 CPU架构,结合同步升级的Mali-G77 GPU,它们可以为智能手机带来哪些变化?

解读Cortex-A77 CPU

在解读Cortex-A77之前,我们需要先来回顾一下它的两个前辈,如此才能更好地了解这个全新的CPU架构。

站在巨人的肩膀上

在ARM近些年的CPU架构更新中,Cortex-A75和Cortex-A76都是极具历史地位的。

14wj jsdt arm 05

其中,Cortex-A75在big.LITTLE的基础上引入了DynamIQ技术,最大限度提升了架构的灵活性与扩展性,让2(大核,即A75)+6(小核)、3+5、1+7这种更高效大小核的组合变成了可能。

同时,同步升级到Cortex-A55架构的“小核”也不再是性能孱弱的代名词,当不同数量的小核和大核搭配后,可以达到一个相对完美的(性)能(功)耗平衡。

作为Cortex-A73和A75的接班人,Cortex-A76采用从零开始、全新打造的CPU微架构(基于ARMv8.2 指令集设计),并与台积电7nm制程工艺强强携手,带来了ARM史上最大的性能和效率的飞跃——骁龙855较之骁龙845、麒麟980较之麒麟970都有着超过40%的CPU性能提升,同时电池寿命也有所延长。

用ARM的话来说,Cortex-A76是一款“笔记本电脑”级别的高性能处理器架构,同时还具有高效能,高通“骁龙牌笔记本”主打的“Always Connected PCs”概念就是这一优势的表现所在。

14wj jsdt arm 06

ARM最新发布的Cortex-A77,其代号为“Deimos(戴莫斯,畏惧之神),采用了和A76一脉相传的CPU微架构,并在其基础上进行了一定的优化,并最终获得了更高的IPC性能提升。可以说,A77架构是站在“巨人肩膀”上的迭代之作,其性能自然值得期待。

再度提升的性能

由于Cortex-A77继承了源自A76的微架构,所以两代核心在设计上存在很多共性。用ARM的话来说,就是芯片供应商(如高通、联发科等)在构建核心时可以非常容易地升级SoC的IP设计,不会花费太多经历和成本,从而缩短了开发周期。

和Cortex-A76相比,A77核心的前端拥有更高的读取带宽,分支预测器的目标缓冲容量提升了33%,从而降低了分支的误判,提高了预测精度。

同时,A77还带来了全新的Macro-Op缓存结构,添加了额外的整数ALU,新增了一个名为“系统感知预取”的功能,可避免不必要地冲击共享缓存,从而提高整体系统性能。

根据ARM公布的数据来看,在同样使用7nm制程工艺、同样运行在3GHz频率下时(仅限于理论,实际量产的旗舰SoC主频多在2.6GHz~2.8GHz之间),新的Cortex-A77比起前代的Cortex-A76,内存带宽提升了20%、在SPEC int2006和Geekbench 4有着20%的性能提升,浮点定性能则有30-35%的提升。

14wj jsdt arm 07

在智能手机领域,网页浏览是恰巧是考验浮点运算的杀手级应用,所以A77浮点性能的大幅提升应该可以进一步提升实际体验。参考当前骁龙855和麒麟980的表现,Cortex-A77的CPU性能应该足以超过苹果A12,并有望和苹果还未发布的A13以及三星的下一代自研猫鼬M5核心竞争。

了解Mali-G77 GPU

你被ARM Cortex-A77较前辈A76有着20%~25%的IPC性能提升且能耗保持不变惊到了?实际上,ARM最新的Mali-G77 GPU较前辈提升的幅度更大。

全新架构的诱惑

与高通和苹果SoC集成的GPU相比(如Adreno GPU),ARM自家的Mali系列GPU一直处于不温不火的状态,如果不是ARM的“亲儿子”,其影响力可能还不如PowerVR系列GPU。

为了弥补自家GPU在图形领域的遗憾,ARM Mali-G77放弃了从Mali-G71到G76始终在“Bifrost”架构上缝缝补补的策略,而是改用了名为“Valhall”的新一代架构,其支持全新的ISA总线和计算核心设计,针对AI运算设计了独立的单元,着重增强了抗锯齿、高分辨率以及AI辅助计算方面的性能,可以更好地适配未来4K分辨率的屏幕以及支持HDR游戏的顶级设备和标准。

14wj jsdt arm 08

根据ARM的官方数据显示,Mali-G77较之Mali-G76可以提升30%的性能和能效,AI性能更是提升了60%,每平方毫米的性能是G76的1.4倍。

14wj jsdt arm 09

和更早期的Mali-G72相比,Mali-G77的功耗还下降了50%。当然,这个功耗部分大家不必太过在意,毕竟与Mali-G72搭配的还是10nm工艺,而Mali-G77即将用上最新的第二代7nm EUV工艺,功耗下降是必然的。

换句话说,Mali-G77终于有了和高通855集成的Adreno 640 GPU抗衡的底蕴。但是,ARM Mali系列GPU性能到底可以发挥几何,最终还得看芯片供应商为其配备多少计算核心,比如麒麟980、三星Exynos 9820和麒麟990都集成了Mali-G76,但麒麟980只为其准备了10个计算核心,也就是Mali-G76MP10,Exynos 9820用上了12个计算核心,即Mali-G76MP12,而麒麟990则配备了16个计算核心的Mali-G76MP16,所以就3D性能而言还是后者更占优势。

此外,Mali-G77即将面对的竞争对手,也将升级到骁龙865和苹果A13,这些对手的GPU只会更强,届时它们和Mali-G77相比孰优孰劣?还得等时间来验证。