(原标题:AMD的GPU,野心暴露)
公众号记得加星标,第一时间看推送不会错过。
来源 :内容编译自tomshardware。
AMD 基于 RDNA 4 架构的当前Radeon RX 9000 系列产品线并未试图在高端桌面 GPU 市场挑战英伟达。其顶级Radeon RX 9070 XT 的竞争对手是英伟达的中端显卡 GeForce RTX 5070 Ti,后者是目前最好的显卡之一。但根据AMD 一位高级研究员的领英个人资料,该公司的图形部门似乎在下一代产品上拥有一两张王牌。
AMD 高级研究员兼首席片上系统 (SoC) 架构师 Laks Pappu 的领英个人资料显示,他似乎负责 AMD 数据中心 GPU 的开发,以及面向云游戏、Navi4x 和 Navi5x 代 Radeon 产品架构。他将自己的工作描述为“基于各种封装技术,构建下一代具有竞争力的 2.5D/3.5D 芯片组和单片图形 SoC”,这几乎暗示 AMD 的下一代图形处理器将采用单片和多芯片组布局。
Laks Pappu 于 2022 年 8 月加入 AMD,此前他在英特尔工作了超过 25 年,负责代号为 DG1、Alchemist 和 Battlemage 的英特尔独立显卡处理器。他还探索了用于高端显卡的“多图块 GPU”,不过目前双 GPU Battlemage 产品的目标客户是 AI 工作负载,而非图形处理。
用于游戏和数据中心的高端 GPU 通常遵循 2.5 到 3.5 年的开发周期,从架构构思到最终产品(架构定义和块级规划:大约需要一年时间,然后物理实现需要另外 1 到 1.5 年,具体取决于设计复杂性和晶体管数量,然后磁带和硅的产生需要另一年的时间。当 Pappu 于 2022 年 8 月加入 AMD 时,RDNA 4 和 CDNA 4 架构已经定义完成,但他本可以对物理实现(在平衡方面)、块配置、功率/性能权衡和最终的硅片调整产生重大影响。为此,虽然他不负责 RDNA 4 和 CDNA 4 架构的定义或开发,但他对 Radeon RX 9000 系列和 Instinct MI350 系列产品的影响很大。
同时,由于他参与了 Navi 5x 的开发,以及可能参与 Instinct MI500 系列的开发,这将是他首次从零开始主导架构,因此他对整个周期都有影响力。如果 Pappu 在 LinkedIn 上的职位描述准确的话,Navi 5x 显然可以采用 2.5D 或 3.5D 封装。
虽然 AMD 的 Instinct MI300 系列和 Nvidia 的 Blackwell 系列用于 AI 和 HPC 的数据中心 GPU 采用了分解设计,但现有的客户端 GPU 都不依赖于多图块架构(Navi 31 除外,但它以不同的方式分解设计)。
由于图形处理工作负载紧密耦合的特性,以及处理单元之间需要超高速、低延迟通信,构建多块消费级 GPU 极具挑战性。CPU 可以容忍跨核心或芯片集的延迟,而 GPU 则依赖于数千个并行线程,这些线程必须精确快速地协调,尤其是在线程束 (warp) 或线程组 (thread group) 内。将着色器核心分散到多个芯片上会带来同步开销、延迟损失以及复杂的一致性要求,这可能会显著降低性能或增加功耗。此外,在块之间保持高带宽需要先进的封装技术和互连技术(例如 Infinity Fabric 或 CoWoS),这会增加成本和功耗。
再者,软件和驱动程序还必须将多块 GPU 作为单一、统一的设备呈现给操作系统和游戏引擎,这又增加了一层复杂性。这些架构、制造和软件方面的障碍,使得多块设计主要局限于数据中心和高性能计算 (HPC) GPU,因为在这些领域,经济性和工作负载更能体现权衡的合理性。
然而,随着构建大型游戏GPU(例如Nvidia的GB102)变得越来越困难和昂贵,在某种程度上,构建面向消费者的图形处理器可能最终是有意义的。分解式多块设计有助于提高硅片层面的良率(尽管先进封装也会消耗一些良率),但由于封装复杂性和中介层/桥接芯片,成本会增加。因此,如果AMD能够解决计算分解问题,它很可能会为客户端应用构建一款多块GPU。
AMD 是首家在数据中心和消费级 CPU 中采用多芯片设计 (chiplet) 的公司,因此如果该公司未来拆分图形处理单元 (GPU) 也不足为奇。事实上,AMD 的 Radeon RX 7900 系列 Navi 31 处理器已经采用了分解式设计,由一个主图形核心 (GCD) 和六个缓存/内存控制器/PHY 芯片组成,因此它很可能被视为多图块 GPU 的一次实验。此外,Navi 31 GCD 的平面图表明其设计非常对称,这意味着如果需要,芯片可以“减半”,前提是 AMD 能够找到在逻辑层面分解设计的方法,并让软件认为它正在处理单片 GPU。对于 Navi 31,这样的设计使 AMD 能够从单一设计(Radeon RX 7900 XTX、RX 7900 XT、RX 7900 GRE、RX 7900M)创建多个产品层,但理论上,如果它正确地完成计算分解,它就可以很好地构建多图块 GPU。
然而,从 Pappu 的 LinkedIn 个人资料来看,他在英特尔工作期间确实设想过多图块“光环” GPU,目前正在开发可能基于 RDNA 5 架构的“下一代竞争性 2.5D/3.5D 基于芯片和单片图形 SoC”。
不过,RDNA 5 何时发布是一个有趣的问题。AMD 通常的 GPU 发布周期是两年。该公司可能会在 2024 年底推出基于 RDNA 4 的 Radeon RX 9070 系列产品,但将其推迟到 2025 年 3 月。因此,预计 RDNA 5 将于 2026 年底或 2027 年初发布是完全合理的。
截至 2025 年 8 月,RDNA 5(Navi 5x)很可能处于流片阶段或流片后早期阶段,这意味着架构和 RTL 设计阶段已经完成,物理设计和验证即将收尾,AMD 正在最终确定或刚刚将 GPU 的 GDSII 文件交付给台积电进行初始硅片制造。这与 2026 年末至 2027 年初的发布窗口相吻合,这意味着 RDNA 5 的实际硬件仍需数月时间才能问世,但性能预测、固件开发和初始驱动程序工作在内部正在顺利进行。也就是说,AMD 将在未来几个月内通过对实际硬件的测试,来了解多区块设计是否适用于消费级 GPU。因此,我们很可能会在接下来几个月看到一些非常有趣的泄露消息。敬请期待。
https://www.tomshardware.com/tech-industry/according-to-a-linkedin-profile-amd-is-working-on-another-chiplet-based-gpu-udna-could-herald-the-return-of-2-5d-3-5d-chiplet-based-configuration
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4143期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐