(原标题:苹果芯片,一路狂飙)
公众号记得加星标??,第一时间看推送不会错过。
来源:内容编译自pcwatch。
很难说手机何时首次拥有除通话以外的功能,但就游戏而言,最早出现手机游戏的可能是1998年的诺基亚6110(照片1),当时附带了贪吃蛇游戏(照片2)。
它搭载的是TI MAD2芯片组“5L43H04”,该芯片组搭载了运行频率为13MHz的“ARM7TDMI”内核。据称,ARM7TDMI的性能为0.7 DMIPS/MHz,因此在13MHz下运行时,其性能约为9.1 DMIPS。顺便提一下,Arduino Uno R3的性能据称为9.85 DMIPS,因此,如果您认为它们的性能相似,就很容易理解了。
不过当时还没有应用处理器的概念,5L43H04的主要处理是通信控制,Snake只是附加功能,所以实际上当时比较处理器性能并没有多大意义。
此后,搭载应用处理器的功能手机开始出现。然而,这一代手机的处理器各不相同(松下使用了基于Uniphier的自有处理器),因此很难找到公平的比较方法。此外,由于本次讨论的主题是“iPhone之后的智能手机处理器”,我不会讨论iPhone之前的机型。
此外,由于 Android 制造商众多,列出清单非常困难,所以这次我仅列出了 Google 提供的产品。此外,由于是智能手机,我排除了平板电脑(iPad 和 Nexus 平板电脑)和媒体播放器(iPod Touch)。
顺便说一句,我们之所以排除平板电脑,是因为平板电脑的可用功率是智能手机的两倍多(散热能力也是两倍多),因此很难将它们进行比较。这次,我们只比较每核功耗低于 1 到 2W 的智能手机。
2007-2010年:智能手机市场的崛起(表1)
第一代iPhone于2007年6月发布,随后,兼容3G手机网络的iPhone 3G于2008年7月发布。
iPhone 搭载的是三星制造的基于 ARM11 的 SoC,其额定频率为 620MHz,但实际运行频率仅为 412MHz。相比之下,初代 Raspberry Pi 使用的 Broadcom BCM2835 拥有同样的 ARM11 内核,但运行频率仅为 700MHz 左右,这意味着初代 iPhone 和 iPhone 3G 的性能仅为初代 Raspberry Pi 的 60% 以下。
不过,2009年苹果发布的iPhone 3GS,搭载的是三星的APL0298C05,内置了Cortex-A8;2010年的iPhone 4,搭载的苹果A4,同样内置了Cortex-A8(不过运行频率略高)。
Android阵营稍晚一些,于2010年1月率先发布了“Nexus One”,并于同年11月发布了“Nexus S”。Nexus One搭载的是单核Cortex-A5处理器的“Snapdragon S1”,性能略逊一筹,而Nexus S则搭载的是Cortex-A8处理器的“Samsung Exynos 3”,性能几乎与iPhone相当。
2013-2016 年:过渡到 64 位
2011年3月,ARM发布了64位指令集ARM v8-A 。苹果是首批支持该指令集的公司之一,并凭借Apple A7实现了64位支持。
谷歌虽然赶上了搭载骁龙 805 的 Nexus 6,但不可否认的是,他们的反应略显迟缓。顺便提一句,iOS 和 Android 都很快将操作系统本身兼容 64 位,但应用程序的 64 位兼容却需要一些时间。
顺便说一句,在 x86 架构下,32 位和 64 位的指令相同,因此处理性能基本没有差异。当然,升级到 64 位也有好处,例如主内存超过 4GB,但就对性能的直接影响而言,通用寄存器的数量增加了(因此无需浪费堆栈),这使得速度略有提升(事实上,最初有很多编译器即使在 64 位下也忠实地输出了堆栈代码)。
然而,就 Arm 而言,32 位 (AArch32) 和 64 位 (AArch64) 的指令集本身有所不同,从而可以实现更快的运行速度。话虽如此,性能变化虽然没有那么显著,但也确实实现了一定的加速。然而,要享受这些优势,不仅操作系统,应用程序也需要兼容 64 位,而这种转变似乎进展缓慢。
2015-2024:big.LITTLE/DynamiQ 实现
在 Arm,在单个处理器中同时实现高性能和低功耗核心的“big.LITTLE”于 2011 年发布,但直到 2015 年之后才在产品中实际实现。
谷歌率先在 Nexus 6P 的骁龙 810 处理器上实现了 big.LITTLE 架构。次年,也就是 2016 年,苹果也在 A10 Fusion 处理器上实现了 big.LITTLE 架构。
我觉得有意思的是,当时骁龙的竞争对手,以及当时并未列入该表格的三星Exynos和联发科Helio/Dimensity系列,都推出了8核产品阵容,这是big.LITTLE支持的最高配置。有些产品,比如联发科的Helio X20至X30,甚至推出了独特扩展的10核配置(2个超高性能核心+4个高性能核心+4个低功耗核心)的产品阵容,而苹果则保持了2 big + 4 LITTLE的6核配置。
现实中,考虑到功耗限制,总会存在即使拥有很多大核心,也无法长时间运行的问题,而从结果来看,不能否认苹果的实现可能取得了更高的有效性能。
2023年起:实施Armv9-A
最新的架构变化是支持Armv9-A。原本Arm指令集,尤其是Arm v8-A,有很多子版本。
v8.0-A:基本 64 位指令
v8.1-A:添加了原子指令/VHE(虚拟化主机扩展)
v8.2-A:增加了 FP16 支持、统计分析、RAS(可靠性、可用性、可维护性)功能和 SVE
v8.3-A: 嵌套虚拟化、RCpc(Release Consistent 处理器一致)、指针认证を追加
v8.4-A:增强加密指令,增加SHA512/SHA3兼容指令,增加安全EL2和MPAM(内存分区和监控)
v8.5-A:添加了随机数生成指令、分支目标标识符和内存标记。
v8.6-A:MatMul 指令、BF6 支持、虚拟化增强、指针验证增强(增强型 PAC2/FPAC 实现)、高精度计时器
v8.7-A:支持 PCIe 热插拔、原子 64 字节加载/存储、WFI(等待指令)/WFE(等待事件)
然而,有没有一款处理器能够支持这一切呢?就连Arm也没有这样的处理器。
或许他们认为这是一个问题,因为2021 年发布的Armv9-A,或者更确切地说是 Armv9.0-A,是由 Arm v8.5-A + CCS(机密计算架构)+ SVE2 组成的,而 v9.1-A/v9.2-A 是融合了 v8.6-A/v8.7-A 功能的 v9.0-A。
Arm 内核方面,2021 年及之后发布的“Cortex-X2”、“Cortex-A710”、“Cortex-A510”均兼容 Arm v9-A,而苹果 2024 年发布的“A18 Bionic”也终于兼容 Arm v9-A。
不过,就苹果而言,A10 兼容 Arm v8.1-A,A11 兼容 Arm v8.2-A,A12 兼容 Arm v8.3-A,A14 兼容 Arm v8.4-A,A15 兼容 Arm v8.5-A,A16/A17 兼容 Arm v8.6-A。而 Arm 的 Cortex-X1 则基本兼容 Arm v8.1-A,只添加了 Arm v8.2-A 中的 RAS 和加密指令、v8.3-A 中的 LDAPR 指令以及 v8.4-A 中的点积指令,因此是一个不完整的实现。
Arm v9-A 的优势除了支持 SVE2 之外,还在于它解决了 v8.5-A 中的分支目标标识符和内存标记等漏洞,但由于 Apple 实际上首先实现了这一点,因此这实际上并不是什么大缺点。
智能手机 CPU 的速度变得有多快?
那么,我们已经简要介绍了苹果和谷歌五个时代的智能手机以及它们所实现的核心功能,最后让我们总结一下它们的性能。
我做了一些研究,但 Geekbench 是唯一一个涵盖所有内容的测试平台,它包含了 v3、v4、v5 和 v6 的分数。表 1 至表 5 展示了 Geekbench 的结果,这些结果代表了多核分数的代表性值。
另外,表1中各代产品均没有Geekbench跑分,没办法,只能通过核心的DMIPS值(ARM11:1.25 DMIPS/MHz,Cortex-A5:1.57 DMIPS/MHz,Cortex-A8:2.0 DMIPS/MHz,Cortex-A9:2.5 DMIPS/MHz)乘以核心数和工作频率来计算这一代产品的性能比。
此外,基准测试之间的性能比较也以基准测试结果的几何平均值来计算,就像前面的计算一样。
结果如图1所示,对于苹果来说,2007年6月的第一代iPhone到2024年9月的iPhone 16 Pro之间的性能比计算为384.9倍,17年零3个月就是384.9倍,所以年增长率大概是40.5%。
另一方面,对于谷歌而言,2010 年 1 月的 Nexus One 与 2025 年 3 月的 Google Pixel 9a 之间的比率约为 76 倍。年增长率约为 32.2%,略显缓慢。原因之一是,谷歌的 Tensor G4 搭载了 Cortex-X4 核心,但其最高主频仅为 3.1GHz,增长幅度不大,而主要原因被认为是使用了三星的 4LPP。考虑到竞争对手苹果 A18 Bionic 的 Everest Core 最高主频为 4GHz,这被认为是一定程度上抑制性能增长的一个因素。
6月19日,韩国媒体The Bell报道称,谷歌已将 Tensor G5的制造外包给台积电(韩语链接),但这似乎是不可避免的。如果我们假设Tensor G4运行在4GHz,并且Geekbench跑分也随着运行频率的提高而增加,那么性能增长率将达到每年34.7%。虽然不如苹果,但仍然是一个合理的性能增长。
在之前的文章中,我们展示了 49 年内 6769 万次的性能提升,即每年 44.5% 的增长率,但苹果的 40.5% 与这个数字相当接近。然而,如果查看图表,就会发现即使是苹果,其增长速度自 2019 年以来也逐渐放缓。2019 年 9 月的 A13 仿生芯片与 2024 年 9 月的 A18 仿生芯片之间的性能比大约是 2.2 倍。按年率计算,这仅相当于 15.1% 左右的增长。这可能是因为严格的功耗和实现面积限制,导致无法随意增加核心数量或提高工作频率。
另一方面,他们仅通过改进架构就能将性能每年提高 15%,这也许令人惊叹。
https://pc.watch.impress.co.jp/docs/topic/feature/2033020.html
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4103期内容,欢迎关注。
加星标??第一时间看推送,小号防走丢
求推荐