(原标题:英伟达GB200进度和需求超预期:令人惊叹的产业链协作)
1、CoWoS的需求超预期
大摩最新的报告里提到,NVIDIA Blackwell 芯片正在进入量产阶段,到 2025 年应该会需要更多的CoWoS产能。
台积电2025年底的CoWoS产能上调至80-90kwpm(之前为 68kwpm)。产能分配里,Nvidia一家占到了将近70%,第二大客户是博通,大概占到了13%左右。这里有一个关注点,AMD也占了9%,差不多是英伟达的13%。
2、Blackwell需求强劲,超出预期
Oracle最近宣布将建一个13w卡的NVL72超级集群,大概能提供2.4 ZettaFLOPS的AI算力。甲骨文要求增加 GPU 供应说实话是超预期的,这意味着Nvidia的成长潜力还远未挖掘完成。
这里非常核心的一个关键点是:10w卡集群将成为明年最令人兴奋的事儿。微软、Meta、Tesla、AWS包括Google都已经或者即将建造自己的10w卡AI集群。现在甲骨文也加入这个队伍,相当超出预期。Oracle目前4500亿美金的市值,投10w卡集群至少需要50亿美金的投入,这对于2024年只有100亿美金净利润的甲骨文来说还是很夸张的投资。
但这说明一个问题:对于美国科技巨头,AI资源获取的紧迫性和重要性并没有缓解,投入大量的计算资源并不会因为所谓“算力后移到推理”而有丝毫的变化。关于国内A股投资的问题,文末统一说。
3、B系列产能需求超预期,将促使台积电在2025年扩大CoWoS产能
大摩预计2025年台积电将会将CoWoS产能提高到80k-90kwpm(之前为 68k),因此台积电2025年的资本支出将会达到380亿美元。
月初我们在星球里提到台积电通过替换材料的方式,解决了CoWoS-L产能良率比较差的问题,从替换材料前的85%左右提高到了月初的90%(较S低8-9%)左右。台积电的目标是在量产前将良率提升至95%以上,之后逐步接近CoWoS-S 98-99%的良率。
这里关于CoWoS产能的问题,8月份的预期是明年70k,2026年90-100k。我们的看法是,2025年上调了产能预期,而2026年依然也会上调产能预期,我们的预期是110-120k。具体逻辑和专业话题感兴趣的朋友欢迎加入星球聊和下载完整报告。
4、Hopper的需求健康,Blackwell接近量产
对于H200可能出现的库存风险,大摩分析师Daniel Yen的看法是“Hopper GPU 需求的增长来自较小的CSP(云服务供应商)客户,而终端市场可能是主权AI。关于Sovereign AI,我们在私域也有谈过。这个事情是非常超预期的事情,新加坡、中东都在大幅、激进推进主权AI的建设。
主要的CSP可能仍会等待GB200机柜。关于Blackwell的生产,目前的产能规划是每月250k Blackwell芯片,其中60%将在24Q4完成。
换算一下,这部分Blackwell芯片在24Q4对应NVIDIA将获得超过100 亿美元的收入。这个相比之前大家担心的30-50亿美金,甚至跳票推迟,也是大幅超预期。这意味着B的量产工作进行的非常顺利。
5、Switch tray的PCB重新设计工作基本已经完成
GB200 服务器机架组装工作仍处于de-bugging调试阶段。发热/泄漏问题已得到解决,Switch的PCB重新设计工作基本完成(printed circuit board redesign work for switch trays appears to be completed.)。最新的问题是在互连方面,供应链正在努力解决这个问题。
关于de-bugging,这个事情我的看法是出现问题非常正常,因为NVL72的工程难度确实太大了,整个供应链都在摸着石头过河。未来再出现其他什么问题,例如飞线(overpass)换成PCB等等都很正常,都不是什么大问题。我对于英伟达的看法是:
老黄不会拘泥于什么技术,英伟达在完成整体设计,迭代哲学就是高性能、低功耗、成本可控。什么技术可以解决问题,就用什么。铜缆好用就用铜缆,光模块好用就用光模块,未来CPO能量产了成本可控就用CPO,CPO遇到问题再拐回光模块。
关于Switch tray以及各种tray,放一张图。
6、AI芯片供应链是世界上最有效率的供应链,没有之一
在 ASML->台积电->Nvidia,一条毫无弹性的供应链 的文章里,我们看到了一条在各个环节都垄断的供应链。而让人惊叹的地方在于:
他们的垄断全是靠在科技竞争中依赖强大的组织能力和技术创新得来的。尤其是台积电,将晶圆代工做到了极致,依赖的就是能聚能散的强大组织体系。
在之前的文章里提到过,在经历的B系列延迟的考验之后,英伟达的竞争力将会再次被加强,垄断地位继续提升。基于此,在之后的推理卡竞赛里,英伟达的竞争力以及获得的市场份额,可能会超出预期。
这次B系列从设计到台积电CoWoS-L良率出问题,再到服务器de-bugging遇到重重问题,也就是从7月份开始。但是不可思议的是2个月后的现在,绝大多数问题都解决了。
这个供应链里从事的都是纯0-1的科技创新了,虽然不能说多么大级别的0-1,但是在2个月内能够解决设计、材料、组装等等问题,没有哪个环节掉链子,属实令人惊叹。
而国内在这件事情的协作就差强人意,马马虎虎。华为910C遇到了一些问题基本上公开的秘密,具体遇到什么问题我们也不可知,但是拖的时间可能有些久了。这说明目前整个链条上我们各个环节的能力还比较弱,想构建英伟达产业链目前基本不太现实,只能依赖华为。
相对落后这是客观现实,台积电、ASML都不是一般角色,不是我们国内目前能够相比的。这里想要说的是,我们清楚国内其实在2021年之后,出现了不少AI芯片领域的人才,包括宝岛的产业人士,但是产业间的协作确实不成体系。我们知道的AI训练卡,美国只有英伟达和AMD,我们国内光独角兽都得有10家...
这件事情背后反映的问题有点严重,但是这里还是不说了...文章容易没。
这件事情的高度,如果只依赖华为,终究是比较吃力的。什么时候我们国内能够出现顶级科技公司在顶尖领域密切协作,那时候我们真的就不会被卡脖子了。
而国内的投资逻辑,从去年到今年,其实AI硬科技链条的主要投资机会就是集中在光模块和PCB领域。光模块更加的受益,因此相比PCB要启动的早,涨幅大;PCB是今年因为估值低、增速快等等因素新挖掘的投资领域,确实受益,但只是其中一部分受益。
铜缆一类,这个市场规模确实太小,几十亿人民币的规模,未来的增速前面提到了,什么技术好用就用什么,并没有确定的趋势,所以对于铜缆,在经历过overpass换PCB的风波之后,保持谨慎吧。
未来的大机会,还是集中在光模块和PCB,PCB有个HDI的量价双增逻辑,光模块就是1.6T和CPO的预期了。会慢一点,但是产业趋势是确定的,在合适的估值做投资,还是很不错的。
#中际旭创# #新易盛# #CPO#