首页 - 财经 - 滚动新闻 - 正文

市场接纳“杰文斯悖论”! DeepSeek掀起“效率革命”,AI芯片需求仍是星辰大海

来源:智通财经 2025-02-19 14:40:08
关注证券之星官方微博:

(原标题:市场接纳“杰文斯悖论”! DeepSeek掀起“效率革命”,AI芯片需求仍是星辰大海)

来自中国的AI初创公司DeepSeek在周二最新公布的原生稀疏注意力(Native Sparse Attention, 简称NSA)机制,不仅将大语言模型处理64k长文本的速度最高提升11.6倍,更在通用基准测试中实现性能反超传统全方位注意力机制模型,意味着AI大模型不久后有望在愈发精简架构的基础上性能也能实现大幅增长,AI训练与推理成本则有望在DeepSeek R1基础上继续呈现大幅下降态势。

继开发出兼具“低成本”与“高性能”属性的DeepSeek R1开源大模型震撼硅谷与华尔街之后,这家非常低调的中国AI初创公司继续展示出基于革新“软件工程技术”破局美国AI算力芯片封锁的全新“极低成本AI大模型算力范式”。

值得投资者们注意的是,关于NSA机制的这份DeepSeek最新研究报告出炉后,英伟达、Marvell、台积电、世芯以及港股市场的中芯国际与华虹半导体等AI芯片产业链热门股的股价并没有因“AI训练与推理成本大幅下行+计算效率激增”而出现类似1月27日的芯片股全线暴跌,反而其中一部分出现强势上涨,尤其是港股芯片标的

与AI密切相关的芯片股集体股价坚挺背后的核心逻辑,无疑在于市场并未像1月27日那样定价AI训练与推理效率飙升带来的短中期AI芯片需求下滑预期,而是已经充分接纳微软CEO纳德拉此前提到的“杰文斯悖论”——当技术革新大幅提高效率,资源消耗不仅没有减少,反而激增,移植到人工智能算力领域则是AI大模型应用规模激增趋势将带来的史无前例AI推理算力需求。

这也是为何华尔街金融巨头摩根士丹利在最新研报中,重申对于AI芯片两大核心技术路线——AI GPU与AI ASIC核心股票标的的强烈看涨预期,并且强调亚马逊、谷歌与微软等大型科技公司坚持AI资本支出大幅扩张也是基于未来应用端AI算力需求激增,尤其是云端AI推理算力需求激增。

也就是说,DeepSeek虽然彻底掀起AI训练与推理层面的“效率革命”,推动未来AI大模型开发向“低成本”与“高性能”两大核心聚焦,而不是疯狂烧钱用“大力出奇迹”方式训练人工智能大模型。但是,AI应用渗透至全球各行各业的天量级AI推理算力需求意味着,AI芯片需求的未来仍将是星辰大海。

据了解,DeepSeek团队提出的原生稀疏注意力机制(NSA)通过动态分层的稀疏策略,将传统全密集Attention(O(n2)复杂度)的计算负担大幅降低。NSA采用了三个并行分支(压缩注意力、选择注意力、滑动窗口注意力),并通过门控融合各分支输出,实现了训推一体化的高效计算。这一创新设计不仅使长文本处理任务中推理速度最高可提升11.6倍,还显著降低了训练时对愈发庞大AI GPU算力基础设施的依赖程度,从根本上改善了AI算力资源的利用率。

相比之下,Facebook的Llama、OpenAI的o3mini和谷歌Gemini则各自采用了不同的近似计算策略或硬件调优策略,这些差异值决定了在长序列处理、算力基础设施的能耗优化和AI部署灵活性方面,DeepSeek NSA机制具有强大得多的竞争优势。

随着DeepSeek重磅推出的DeepSeek R1继续风靡全球,以及DeepSeek公司的最新研究显示的NSA机制在Transformer底层实现AI大模型革命性训练与推理效率提升,引发全球AI大模型开发者追随这种“极低成本AI大模型算力范式”,进而全面驱动AI应用软件(尤其是生成式AI软件与AI代理)向全球各行各业加速渗透,彻底革新各业务场景的效率并大幅提高销售额,AI芯片需求在未来可能呈现指数级增长而不是此前市场所预期的“DeepSeek冲击波”引发AI芯片需求断崖式下滑。

AI芯片两大路线——AI GPU与AI ASIC,大摩都相当看好

摩根士丹利在研报中指出,在特朗普政府支持下所开启的星际之门项目(即Stargate项目),以及DeepSeek R1大模型横空出世之后中国各行各业积极接入与部署DeepSeek大模型所带来的庞大AI推理算力需求推动之下,AI GPU与AI ASIC需求前景展望可谓极度乐观。

大摩在这份研报中重申对于AI GPU绝对领军者英伟达(NVDA.US)的“增持”评级,以及对于中国台湾的封测巨头京元电子(KYEC)、AI ASIC领军者世芯电子(Alchip)与创意电子(GUC),全球芯片代工之王台积电(TSMC)的“增持”评级。

关于AI GPU,大摩表示,DeepSeek推动中国大型科技企业的AI资本支出激增。大摩团队从台湾半导体供应链获悉,2025年第一季度大约75万颗Hopper架构英伟达AI芯片——集中于专为中国市场推出的H20,将由京元电子(KYEC)完成测试。

大摩表示,受NVL72组装瓶颈影响,英伟达的客户们正积极转向采用B200 AI芯片的HGX服务器(8-GPU架构)。例如,Coreweave与xAI等CSP客户要求ODM厂商在单机架内部署8台HGX服务器(即总计64颗B200 AI GPU)。大摩预计B200芯片库存可被消化,无需下调台积电CoWoS产能预测,并且预计2025年下半年,采用新型连接器设计的GB300 Cordelia模块将显著改善系统良率。

大摩的半导体供应链调查还显示,鉴于Blackwell与Hopper需求强劲,英伟达今年上半年有望实现与市场乐观预期相符的业绩。大摩表示,鉴于英伟达AI GPU仍然需求无比强劲,维持该机构对于CoWoS需求46.5万单元的乐观预期,但假设更多CoWoS产能将来自台积电CoWoS-L先进封装。

关于ASIC,大摩表示,北美金融市场的ASIC投资热度边际过热,相比之下亚洲地区的ASIC厂商们在定制化芯片领域具备估值优势,且与亚马逊AWS等大厂关联的ASIC项目有望带来强劲业绩。大摩表示,从供应链观察到亚马逊AWS正将其对于台积电的CoWoS产能预订从Trainium2(由Marvell代工)逐步转向Trainium3(由世芯进行代工)。

在1月下旬,OpenAl、软银联合甲骨文宣布了一项名为“星际之门”(Stargate)的超大规模AI基础设施建设计划,初期投资额为1000亿美元,4年之内最高可扩大至5000亿美元,集中于新建设以及扩建AI数据中心。“星际之门”的5000亿美元投资计划远超市场预期,甚至被一些媒体誉为“新时代的曼哈顿计划”。重返白宫的美国总统特朗普表示,美国政府将通过紧急声明为“星际之门”计划提供所有便利,尤其是满足必要的全部电力/能源需求,甚至迫切需要的土地/建筑许可。

随着DeepSeek引领的“低成本算力新范式”席卷全球,AI训练与应用推理端AI成本愈发下行,同时全面驱动AI应用软件(尤其是生成式AI软件与AI代理)向中国各行各业加速渗透,有望彻底革新各业务场景的效率并大幅提高SaaS软件以及云计算销售额,而这无疑将带来无比庞大的云端AI推理算力需求。DeepSeek接入微信之后经常见到DeepSeek深度思考无法响应客户需求,验证了当前中国市场的AI算力基础设施远远无法满足AI算力需求。

AI芯片需求的核心支柱——美国科技巨头们巨额支出+星际之门

大摩在研报中指出,美国科技巨头们在2025年的巨额资本支出预期,以及“星际之门”项目计划未来四年投资5000亿美元,其中1000亿美元将于当前部署,使得英伟达AI GPU,以及ASIC厂商们所推出的AI ASIC需求仍然非常强劲,加之DeepSeek大模型加速渗透至中国各行各业所带来天量AI推理需求,将点燃AI芯片产业链的新一轮需求狂潮。

大摩上调2025年北美云计算大厂们整体支出预期,增速从此前的同比29%预期上调至32%,也就是说2025年北美前十大云服务巨头资本支出预计将达3500亿美元,主要基于云端AI推理算力需求大幅扩张趋势。大摩通过半导体供应链观察到,“星际之门”项目的部分GB200 NVL72订单通过戴尔承接,潜在订单可能通过甲骨文及其亚洲ODM/OEM伙伴,比如FII来执行。

微软、亚马逊、谷歌以及Meta,乃至生成式AI领军者OpenAI,从这些巨头近期财报或者行业动态看出,无一例外都在联手博通或者Marvell自研AI ASIC芯片,用于海量推理端AI算力部署。因此AI ASIC未来市场份额扩张之势有望大幅强于AI GPU,进而趋于份额对等,而不是当前AI GPU一家独大局面——占据AI芯片领域高达90%份额。

但是,这种转变不是一蹴而就,在当前AGI仍处于研发进程,AI GPU的灵活性与通用性仍然是AI训练最倚重的专属能力。超大规模的AI模型,比如GPT家族与LIama开源家族,在“研究探索”或“快速迭代”阶段对算子灵活性、网络结构可变性的需求依旧很高——这是通用 GPU 仍占据优势的主要原因。

在谷歌与Meta业绩电话会议上,皮查伊以及扎克伯格均表示将加大力度携手芯片厂商博通推出自研AI ASIC,这两大巨头的AI ASIC技术合作伙伴都是定制化芯片领域领军者博通,比如谷歌联手博通打造的TPU(Tensor Processing Unit)就是一种最典型的AI ASIC。Meta此前与博通共同设计了Meta的第一代和第二代AI训练/推理加速处理器,预计Meta与博通将在2025年加快研发Meta下一代AI芯片 MTIA 3。获得微软巨额投资以及达成深度合作的OpenAI去年10月表示,将携手博通开发OpenAI首款AI ASIC芯片。

随着大模型架构逐渐向几种成熟范式收敛(例如标准化的 Transformer 解码器、Diffusion 模型流水线),ASIC可以更容易地吃下主流推理端算力负载。并且某些云服务商或行业巨头会深度耦合软件栈,让 ASIC兼容常见的网络算子,并提供优秀的开发者工具,这将加速 ASIC 推理在常态化/海量化场景中的普及。

展望未来算力前景,英伟达AI GPU可能更多专注在超大规模前沿探索性的训练、变化极快的多模态或新结构快速试验,以及 HPC、图形渲染、可视分析等通用算力。AI ASIC则聚焦于深度学习特定算子/数据流做极致优化,也就是擅长稳定结构推理、批量高通量、高能效比。比如,如果一家云平台的AI工作负载中大量使用针对 CNN/Transformer 中常见算子(比如矩阵乘法、卷积、LayerNorm、Attention等),大多AI ASIC会针对这些算子做深度定制;图像识别(ResNet系列、ViT)、基于Transformer的自动语音识别(Transformer ASR)、Transformer Decoder-only、部分多模态流水线固定化后,都可以基于ASIC进行极致优化。

就像大摩在此前的一份研究中预测的那样,长远来看,两者将和谐共存,中期左右AI ASIC市场份额有望大幅扩张。英伟达通用GPU将聚焦于复杂多变场景与前沿研究,ASIC 聚焦高频稳定、大规模的AI推理负载以及一部分成熟稳定的固化训练流程。

fund

微信
扫描二维码
关注
证券之星微信
APP下载
好投资评级:
好价格评级:
证券之星估值分析提示中芯国际盈利能力良好,未来营收成长性一般。综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-