首页 - 财经 - 产业观察 - 正文

英特尔将为中国推出特供版Gaudi3 AI芯片

关注证券之星官方微博:

(原标题:英特尔将为中国推出特供版Gaudi3 AI芯片)

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容由半导体行业观察(ID:icbank)编译自theregister,谢谢。

英特尔将推出两款中国独家型号的 Gaudi 3 AI 加速器,但为了适应美国的制裁,它们将受到严重削弱。

英特尔的 Gaudi 3 白皮书详细介绍了两种获准在中国销售的型号。这两款专为中国制造的处理器分别为 HL-328 和 HL-388,分别采用 OAM 和 PCIe 外形规格,前者于 6 月推出,后者于 9 月推出,与其他 PCIe 外形规格的 Gaudi 3 一起推出。

总体而言,HL-328 和 HL-388 看起来或多或少与其他产品相同,具有相同的 128GB HBM2e VRAM,带宽为 3.7TB/s、96MB 缓存、PCIe 5.0 x16 接口和解码标准。

唯一的区别在于热设计功耗,OAM 和 PCIe 卡型号均为 450 瓦。这与其他型号相比大幅减少。非中国 PCIe HL-338 的 TDP 为 600 瓦,OAM 外形规格 HL-325L 和 HL-335 的 TDP 为 900 瓦。China Gaudi 3 型号的 TDP 相对较低,这可能是没有液冷版本的原因。

尽管白皮书中没有明确说明,但几乎可以肯定的是,为了遵守美国政府对处理器的出口管制,做出这些改变是必要的,该管制禁止美国公司根据性能向中国出口芯片。

我们无法真正知道英特尔对 Gaudi 3 做了什么来使其兼容,以及这些批准用于中国的芯片在这些变化中的执行速度有多快,但有一些线索。与其他 Gaudi 3 变体一样,HL-328 和 HL-388 仍然使用两个芯片,因为内存和缓存配置未更改。使用两个芯片而不是一个芯片有助于降低性能密度,从而使芯片能够达到 4,800 总处理能力 (TPP) 的更高出口限制。

4,800 TPP 限制意味着没有芯片可以拥有 150 TFLOPS 或更多的 16 位性能,并且由于 Gaudi 3 在 BF16 下可以达到 1,835 TFLOPS,因此英特尔需要大幅降低性能。这必须通过真正大规模削减核心数量和时钟速度或其他一些性能限制方法来实现。

我们已要求英特尔对中国独家的 Gaudi 3 型号进行澄清,但尚未收到回复。如果英特尔披露任何信息,我们将进行更新。

我们可以预期 HL-328 和 HL-388 的性能与Nvidia 的 H20类似,H20 是硅巨头最快的 GPU,已获准在中国销售。它具有 148 TFLOPS 的 FB16 和 FP16 性能,略低于 150 TFLOPS 限制。

由于H20和Gaudi 3的中国型号之间的原始核心性能或多或少相同,因此主要区别将归结为内存(英特尔的容量更大但带宽略少)和软件(这一直是一个卖点)适用于 Nvidia 芯片。

https://www.theregister.com/2024/04/12/intel_paudi_3_china/

点这里加关注,锁定更多原创内容

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3734期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦


微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-