(原标题:DeepSeek持续开源推动产业变革)
近日,DeepSeek在知乎上发表《DeepSeek-V3/R1推理系统概览》文章,表明其理论上一天的成本利润率可达545%。
业内人士表示,DeepSeek将新技术完全开源,源代码在GitHub上公开,任何开发者都可自由使用和改进,打破了前沿技术被大型科技公司垄断的局面,为整个行业注入新活力,也为行业建立了更健康的技术共享机制,促进知识自由流动和技术迭代,因此产业变革有望加速,代码公布助力应用端加速落地。
事件驱动 DeepSeek公布模型推理成本利润细节
DeepSeek于2025年3月1日通过知乎平台首次披露其模型推理服务的成本结构,引发行业震动。根据公开数据,在采用H800GPU集群、动态资源调度(白天全节点推理、夜间释放节点用于训练)的机制下,其日均算力成本为87072美元。若按R1模型的定价标准计算,理论日收入可达562027美元,对应545%的成本利润率,相当于每日净赚约346万元人民币。这一数据刷新了行业对AI服务盈利能力的认知,MenloVentures投资人Deedy推算其理论年收入可达2亿美元,估值应超百亿美元。
在知乎的官方文章中,DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。由于DeepSeek-V3/R1的专家数量众多,并且每层256个专家中仅激活其中8个。模型的高度稀疏性决定了我们必须采用很大的overalbatchsize,才能给每个专家提供足够的expertbatchsize,从而实现更大的吞吐、更低的延时。为了实现这两个目标,DeepSeek通过使用大规模跨节点专家并行,即Prefil:路由专家EP32、MLA和共享专家DP32,一个部署单元是4节点,32个冗余路由专家,每张卡9个路由专家和1个共享专家。
作为对比,Nvdia官方有两个可以参考的数据。1月30日,在官方blog中透露,在H200节点上可以实现3872t/s的峰值输出吞吐;2月25日在x上公布FP4精度优化性能,H200节点峰值输出吞吐优化到5899t/s,B200节点峰值输出吞吐则高达21088t/s。DeepSeek用阉割版的H800实现了14.8kt/s的输出吞吐(相较H200大约下降20%—25%的性能),是NvdiaH200FP8性能的整整3.8倍。
行业现状 人工智能产业变革有望加速
DeepSeek在2月24日至28日进行了为期5天的开源周“技术轰炸”,开源了5大代码库,覆盖训练、推理、通信、负载均衡以及数据加速的全链路,惊喜连连。
开源周第一天发布FlashMLA,一款专为Hopper架构打造的高效MLA解码器,可高效处理变长序列,优化内存管理,榨取GPU极致性能。开源周第二天发布DeepEP,聚焦通信资源利用,提升数据高效传输,是首个为MoE量身定制的灵活GPU资源控制通信库。开源周的第三天,DeepSeek推出了支持稠密和MoE模型的FP8计算库——DeepGEMM,核心逻辑仅约300行代码直面AI计算中最频繁的矩阵乘法,可为V3/R1的训练和推理提供强大支持。开源周第四天,DeepSeek推出了一系列优化并行策略,包括DualPipe——一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法;以及E-PLB——一个针对V3/R1模型的专家并行负载均衡工具,并深入分析了V3/R1模型中的计算与通信重叠机制。开源周的最后一天,DeepSeek发布了3FS并行文件系统,旨在应对人工智能训练和推理工作负载带来的挑战。该系统利用现代固态硬盘(SSDs)和RDMA网络,提供一个共享存储层,从而简化分布式应用程序的开发,并加速DeepSeek平台上所有数据访问操作。
DeepSeek开源周上接连不断的技术发布,彰显了团队的极客精神和开源理念。将新技术完全开源,源代码在GitHub上公开,任何开发者都可自由使用和改进,打破了前沿技术被大型科技公司垄断的局面,为整个行业注入新活力,也为行业建立了更健康的技术共享机制,促进知识自由流动和技术迭代,因此产业变革有望加速。
投资机会 DeepSeek代码公布助力应用端落地
今年以来,自从包括豆包、DeepSeek在内的国产大模型突破以来,全球AI产业的共振正在加速,产业趋势不断发酵。
中泰证券认为,DeepSeek的惊艳收益有望促进应用爆发,建议关注金山办公、同花顺、合合信息、萤石网络等;应用爆发带来的庞大推理需求,以及未来图像+声音+视频的全面智能体会支撑起更多业务场景,大型云厂具备规模、infra优势,能够以更低的成本支持高并发的业务需求。海外高性能芯片供应受限,国产算力结合算法架构创新有望弯道超车。建议关注海光信息、中科曙光、神州数码等;通过将结构化和非结构化数据集成在高性能、分布式的命名空间,实现实时分析能力,传统数据库有望升级为新型数据基础设施,建议关注达梦数据、星环科技、海量数据等。
华创证券表示,DeepSeek代码公布助力应用端加速落地,建议关注以下标的:办公关注金山办公、合合信息、福昕软件;金融关注京北方、宇信科技、天阳科技、神州信息、同花顺、恒生电子、新致软件;大模型关注科大讯飞、三六零;工业关注中控技术、索辰科技、鼎捷数智;端侧、穿戴、玩具关注萤石网络、云天励飞、中科创达、汉王科技;医疗关注润达医疗、卫宁健康;法律关注金桥信息、华宇软件、通达海;邮箱关注彩讯股份;教育关注佳发教育、鸥玛软件、新开普;电商关注焦点科技;安全关注深信服、永信至诚;部署关注卓易信息、优刻得、星环科技、网宿科技、汉得信息;算力关注海光信息、寒武纪、景嘉微等。 宗禾