(原标题:摩尔线程发布“花港”架构,力推国产万卡智算生态)
21世纪经济报道记者/彭新
在登陆科创板近半月之际,12月20日,摩尔线程(688795.SH)于北京举办首届MUSA开发者大会。
会上,摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果,并发布下一代全功能GPU架构“花港”。
基于该架构,摩尔线程推出面向AI训推一体的“华山”芯片及高性能图形渲染的“庐山”芯片,并展示了“夸娥”万卡智算集群技术成果与搭载“长江”SoC芯片的端侧AI产品。
MUSA(Meta-computing Unified System Architecture)为摩尔线程自主研发的“元计算”统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。其中,新一代GPU架构“花港”最受关注。
“大家知道,目前的芯片代工工艺发展确实面临一些客观的、缓慢的挑战。但我们要不要停下来等?不能。‘花港’的意义在于,我们通过全新的指令集设计和异步编程模型,实现了‘工艺不够,架构来补’。”摩尔线程创始人兼CEO张建中称。
“花港”架构设计中采用了新的指令集,据张建中介绍,在相同的工艺条件下,新架构的算力密度提升了50%,效能提升了10倍。该架构支持从FP4到FP64的全精度计算,并集成了新一代异步编程模型,通过自研的MTLink高速互联技术,可支持十万卡以上规模的智算集群扩展,单个节点支持1024卡。
(图片来源:摩尔线程)
基于“花港”架构,摩尔线程推出多款芯片。
“华山”芯片主要面向AI训推一体与超大规模智能计算,可为智算集群提供算力支撑,张建中称该芯片的浮点算力、访存带宽、高速互联带宽三个指标的能力介于英伟达量产的Blackwell架构和上一代Hopper架构之间,而在访存容量指标上优于上述两个架构。
同步发布的“庐山”芯片则侧重于高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并增强了纹理填充和显存容量。
基础设施层面,摩尔线程发布了夸娥万卡智算集群,该集群浮点运算能力达到10 Exa-Flops。在工程化能力上,该集群在万卡规模下对Dense大模型的训练算力利用率(MFU)为60%,对MoE大模型的算力利用率为40%,有效训练时间占比超过90%,训练线性扩展效率为95%。
在推理性能实测中,摩尔线程与硅基流动合作,在DeepSeek R1 671B全量模型上进行优化,MTT S5000单卡的Prefill吞吐超过4000 tokens/s,Decode吞吐超过1000 tokens/s。
(图片来源:摩尔线程)
在大模型对算力稳定性要求提升的背景下,国产GPU能否在实际的大规模商业化场景中实现对国际主流产品有效替代,需观察后续芯片量产进度与集群效能表现。
过去四年,摩尔线程保持了每年迭代一个芯片架构的节奏,张建中回顾总结称,2022年推出的“苏堤”架构S10,解决了信创市场PC GPU国产化问题。2023年的“春晓”架构带来了量产游戏显卡S80和云端渲染芯片S3000。此后在2024年,“曲院”架构的S4000开启了AI训推一体时代,实现了千卡集群的组建。今年基于“平湖”架构的S5000已成功建成万卡智算集群。
在软件与生态建设方面,摩尔线程升级了其MUSA统一计算架构至5.0版本。该版本在核心计算库muDNN上实现了GEMM和FlashAttention效率超过98%,通信效率达到97%,编译器性能提升3倍。公司计划逐步开源计算加速库、通信库及系统管理框架等核心组件。此外,大会还披露了兼容跨代GPU指令架构的中间语言MTX、量子计算融合框架MUSA-Q以及计算光刻库muLitho等前瞻技术。
针对个人市场,摩尔线程发布了MTT AIBOOK笔记本电脑,该产品搭载自研“长江”SoC(系统级)芯片,端侧AI算力为50 TOPS。同时,公司预告了基于同一SoC芯片的迷你型计算设备MTT AICube。
在图形技术领域,摩尔线程目前支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并已与国产CPU及操作系统完成适配。公司宣布即将实现对DirectX 12 Ultimate的完整支持,并推出了AI生成式渲染技术MTAGR 1.0,尝试将渲染范式从计算转向生成。在具身智能领域,摩尔线程发布了MT Lambda仿真训练平台,并计划在2026年第一季度开源关键仿真加速组件 Mujoco-warp-MUSA。
摩尔线程在大会上还提及了科学智能(AI4S)、量子科技、AI for 6G等前沿交叉领域的布局,并宣布建设MUSA生态中心,启动开发者计划,为科研与创新提供算力支持。
当前,国产AI芯片行业受到资本市场大力追捧,受限于国际环境对高端芯片的进口限制,国产芯片的市场空间有所增长。摩尔线程成立于2020年10月,核心团队成员包括原英伟达中国区总经理张建中及CTO张钰勃,技术路线选择对标英伟达的通用GPU路径。12月5日,摩尔线程以114.28元/股的价格登陆科创板,截至12月19日收盘,其股价至今涨幅累计达到481%,股价为664.10元/每股,公司市值约为3121.46亿元。
