(原标题:AIDC互联进阶:铜缆→光模块→CPO→OIO,兼论渗透率)
作为雪球平台上持续聚焦 AIDC 全光网络领域的创作者,过去一年间,我始终致力于系统分享相关知识。但观察下来,仍有不少朋友对这一领域的理解不够透彻,存在认知模糊的情况。今天我特别梳理了一个极简版本的图示,力求直观清晰地呈现核心逻辑。
1、DCI (DC Interconnection)
AI集群之间的长距离互联(10%),2km-50km,采用相干光模块,功耗大、体积大、数量少,未来没必要也无法演进到CPO形态。目前相干光模块都是基于硅光体系,光模块内部采用CPO技术降成本提高性能,也是普遍做法。
2、DCN(DC Network)
DC内部交换机之间的互联(60%),互联距离100m-2km,这个场景将来都会被CPO替代;
AI服务器到交换机之间的互联(30%),互联距离2m-50m,大部分采用ACC、AEC铜缆连接(1~5米),也有部分采用多模光模块(SR),未来很大概率会演进到LPO。Leaf交换机侧的占比15%,用CPO来提高组网能力。
所以,Scale-out网络里面,CPO的渗透率上限在75% (60%+15%),剩下15%属于LPO的空间,10%属于相干光模块的空间。
到目前为止,英伟达等大部分都采用电互连(PCB、铜缆),即将向全光互联切换,需要分两步走:
1、铜缆/PCB → CPO 。
2、CPO → OIO。
CPO是单车道的光速公路(一条光纤只有一路光通信),OIO是8~32车道的光速公路(一条光纤里面同时跑8-32路波长不同的光通信)。
CPO和OIO技术体系下, GPU服务器和交换机必须同时配对使用,所以渗透率100%。
CPO≠光模块;CPO=2.5D/3D先进半导体封装; OIO=3D先进封装。
OIO = CPO + DWDM(密集波分复用) 。
CPO在产业界和学术界已经形成广泛共识。成本降低30%,系统能效水平提升3.5倍,可靠性提升10倍,部署速度提升1.3倍(英伟达官网口径)。真正能解决人工智能集群在功耗、散热、带宽和部署效率挑战(博通官宣材料)。CPO是AI集群互联唯一的发展方向(国内通信泰斗韦乐平)。
一、Scale-out,CPO渗透率不可能超过75%,LPO占比15%,相干光模块10%。
二、Scale-up,先CPO再OIO,渗透率100%(要不用铜缆/PCB,要不用CPO/OIO)。
CPO技术龙头 = 英伟达+博通。
OIO技术龙头 = Ayar Labs + 英伟达。
CPO先进封装龙头 = 罗博特科。
OIO先进封装龙头= 罗博特科。
CPO/OIO代工龙头 = 台积电 + 日月光。
光模块龙头=中际旭创+新易盛。
LPO龙头 = 新易盛 + 中际旭创。
AIDC集群通信迈向全光网络,是必然趋势。
全光网络迈向CPO,然后OIO,刻不容缓。
全光网络,大有可为。
$罗博特科(SZ300757)$ $中际旭创(SZ300308)$ $半导体ETF(SH512480)$
//利益关联说明:罗博特科是我AI算力持仓组合的一部分,本文中所提及的其它代码,发稿前均不持有。
//特别提醒:本文仅为个人学习总结,对未来的趋势预测仅凭个人经验,大家理性辩证参阅,自我投资决策。欢迎任何人前来讨论,但情绪贴先删后黑。