ARMv9来了!ARM最新Cortex-X2和Mali GPU有多强?

CFan 电脑爱好者 2021-05-27 08:28产品 标签:ARM 手机 处理器

ARM在2011年发布的ARMv8-A指令集见证了智能手机的崛起,至今已经衍生出了ARMv8-A、ARMv8.1-A、ARMv8.2-A~ARMv8.6-A共七个版本。

01

其中,从Cortex-A75~Cortex-A78/X1,均是基于ARMv8.2-A打造,而苹果Apple A12/A13和A14则分别基于ARMv8.3-A和ARMv8.4-A指令集架构设计,苹果自研的A系列芯片始终强于同期的原生Cortex-A架构,更先进的指令集也在背后出力不少。

02

然而,历经10年的开发,ARMv8-A指令集的潜力以及挖掘殆尽。为了未来10年计算设备的发展考虑,ARM在前不久发布了全新的ARMv9指令集(详见《ARMv9影响下一个十年!一文了解ARM指令集发展史》)。

如今,ARM再度祭出了首批基于ARMv9-A指令集打造的IP核心,它们便是超级核心Cortex-X2、大核心Cortex-A710和小核心Cortex-A510,分别取代现有的Cortex-X1、Cortex-A78和Cortex-A55。

03

同时,ARM还带来了与这些IP搭配的Mali GPU,而且还是Mali-G710、Mali-G610、Mali-G510、Mali-G310一大家子。

04

那么,上述这些CPU和GPU核心到底有多强,是否值得我们期待?

超级核心Cortex-X2

和基于ARMv8-A指令集打造的Cortex-X1相比,Cortex-X2除了指令集升级到ARMv9-A,还对分支预测与预取单元、流水线长度、乱序执行窗口、FP/ASIMD流水线、载入存储窗口和结构等方面进行了优化。此外,Cortex-X2仅支持AArch64 64位指令而不再兼容32位应用。

作为普通消费者,咱们没必要探求底层的细节,只需要知道Cortex-X2相比于X1的整数性能提升16%,AI机器学习性能(ML)则可以翻一番即可。

05

需要注意的是,ARM公布的对比数据存在水分,Cortex-X2的三级缓存为8MB,但与其对比的Cortex-X1三级缓存却只有4MB,要知道满血的Cortex-X1也是支持8MB缓存的。

但即便如此,超过10%的IPC性能提升也是可以接受的,只是希望Cortex-X2能在功耗和发热方面有所优化,在搭配现有的5nm工艺时不要因过热降频而拉胯。

大核心Cortex-A710

原本我们以为ARM今年的大核心IP会叫Cortex-A79,没想到一下子进入了3位数的后缀时代。全新的Cortex-A710只这代IP中唯一继续支持OL0 AArch32的核心。这意味着,当你打开某个32位的老旧APP时,无论它处于前台还是后台挂起状态都会触发Cortex-A710大核以高功耗运行。因此,如果你希望手机可以更省电,未来手机里就不要安装老应用了。

06

根据ARM的数据显示,在同制程工艺和频率的情况下,Cortex-A710相比Cortex-A78的IPC性能提升10%,或者可以将功耗降低30%,AI机器学习性能也可以翻倍,提升幅度相对Cortex-X2和X1要小一些。

小核心Cortex-A510

作为小核心的Cortex-A510与Cortex-X2一样均只支持AArch64 64位指令,无法运行32位程序。作为已经发布4年的Cortex-A55的接班人,ARM对Cortex-A510进行了特别关照,它不仅借鉴了Cortex-X系列在分支预测、数据预取方面的一些技术,还引入了“合并核心”(merged-core)的新设计,可以将2个核心组合在一起,每个核心都有自己完整的前端、核心、整数后端、一级缓存,只是共享了最大512KB的二级缓存和FP/NEON/SVE流水线。

07

根据ARM的资料显示,Cortex-A510在搭配32KB一级缓存、256KB二级缓存、8MB三级缓存的情况下,相比内置32KB一级缓存、128KB二级缓存和4MB三级缓存的Cortex-A55可提升35%~62%的性能,AI机器学习性能更是提升了3倍。

08

可以说,Cortex-A510才是ARM此次发布核心IP中最抢眼的,它能显著提升SoC的性能下限,在相对低功耗下释放更强的性能,带来肉眼可见的体验提升。

新一代Mali GPU

ARM此次一口气发布了Mali-G710、Mali-G610、Mali-G510、Mali-G310四款GPU,其中G710/G610、G510、G310分别定位旗舰、主流和入门级市场,它们均采用第三代Valhall GPU架构,通过CoreLink CI-700一致性互连技术和CoreLink NI-700芯片网络,能与Cortex-X2/A710/A510 CPU组合成一整套完整、强大的SoC解决方案。

09

同样,咱们不必理会新一代Mali GPU在底层技术细节的改进,只要知道它们的核心搭配和大概的性能预期即可。

作为旗舰的Mali-G710可以搭配7~16个计算核心,即Mali-G710 MC7~Mali-G710 MC16,如果OEM客户有需要,ARM还可以提供6个(或更少)核心的Mali-G710,只是这个版本将该名为Mali-G610 MC6。没错,Mali-G610其实就是Mali-G710的核心缩水版(小于7)。

10

虽然上一代Mali-G78最多可以搭配24个计算核心(Mali-G78 MC24),但得益于新架构和底层技术的优化,Mali-G710可以提升20%的性能、20%的能效以及35%的AI机器学习性能。

定位中端的Mali-G510可以搭配2~6个计算核心,相比上代Mail-G57实现了100%的性能提升,22%的能效提升,以及100%的AI机器学习性能提升。

11

定位低端的Mali-G310只能搭配1个计算核心,但相比上代Mali-G31的纹理性能翻了6倍,Vulkan性能提升了4.5倍, Android UI内容提升2倍,改进巨大。不过,未来哪怕是千元价位的手机,也会选择Mali-G510起步的GPU,Mali-G310的主战场应该是嵌入式或是老年机市场。

12

需要注意的是,ARM这一代GPU的每个核心每执行单元的配置都可以自定义,比如Mali-G710就可以选512KB~2MB的二级缓存,ARM官方还列举了Mali-G510的10种可能的不同规格配置,这意味着两款都是内置Mali-G710 MCx或Mali-G510 MCx的手机芯片,它们依旧可能存在较大的性能差异,Mali-G710 MC8反杀Mali-G710 MC10也并非不可能。

13

总的来说,ARM此次发布的CPU和GPU核心IP还是值得期待的,作为ARMv9指令集的首秀,超过10%的IPC性能提升已经说得过去了,特别是Cortex-A510的巨幅提升,可以让新款手机在相对低功耗下就能带来媲美老款手机在中高功耗下的体验。

gsmarena_002

接下来的悬念,就是谁能成为首发Cortex-X2+Cortex-A710+Cortex-A510+Mali-G710 GPU的芯片了,会是联发科天玑2000吗?

QQ图片20210420165237