首页 - 财经 - 国内经济 - 正文

DeepSeek激活AI产业链 大批公司春节加班适配

来源:经济观察报 2025-02-07 12:05:00
关注证券之星官方微博:

(原标题:DeepSeek激活AI产业链 大批公司春节加班适配)

截至2025年2月6日,DeepSeek(深度求索)的用户量突破2200万。凭借颠覆性和高性价比,DeepSeek成为继ChatGPT之后的又一个现象级AI产品,并引发AI产业链的追逐。

春节期间,云服务厂商、GPU厂商和智算中心的建设方纷纷部署DeepSeek并商讨相关方案。

2月5日以来,国内主要云厂商联通云、京东云、阿里云、腾讯云、百度智能云和移动云等纷纷上线DeepSeek大模型,并将其纳入各自的模型商店。国际云厂商微软云和亚马逊云科技早在春节前就上线了DeepSeek。

春节前,移动云团队发现,客户对DeepSeek最新版本R1和V3的反应非常强烈,便迅速展开研究与适配工作,对DeepSeek的满血版、蒸馏版、量化版等多个版本进行适配。移动云在全国拥有13个智算中心,将DeepSeek部署到每一处智算中心并不是个小工程。

云厂商上线DeepSeek的目的是更好地消耗并兜售自己的算力。DeepSeek的庞大用户基础,有望为他们带来业务增量。此外,DeepSeek是开源模型,云厂商之间不存在利益冲突。

移动云从2024年初起就关注到DeepSeek,并从V1版本开始上架这款模型。然而,从技术角度看,DeepSeek V1的多模态能力有限,无法很好地处理图像、音频等非文本信息,且在深度推理场景中也未显现出强大功能,因此当时用户的反应并不强烈。

直到DeepSeek团队在2024年12月26日发布了V3版本,仅使用2048块英伟达H800 GPU,训练成本低至558万美元。DeepSeek团队在2025年1月20日发布了R1版本,同样采用了极低成本,实现了与OpenAI o1系列相当的推理能力。

云厂商的上游GPU公司也行动起来。GPU是大模型算力的核心器件,目前国内多家GPU公司正在或已完成对DeepSeek的适配。

国产GPU公司摩尔线程的工程师在春节期间加班加点,于2月4日完成了DeepSeek蒸馏模型的部署。在该公司看来,这种蒸馏模型就是将大规模模型的能力迁移至更小、更高效的版本,它借鉴了教育领域中的“知识传递”概念,将一个大型且复杂的模型(教师模型)的知识“传授”给一个小型且简单的模型(学生模型)。这种方法不仅减少了模型的计算和存储需求,而且使模型更加易于部署。

摩尔线程提供包含GPU和集群在内的完整算力基础设施,适配DeepSeek能帮助其客户在资源受限的情况下部署大模型。

快思慢想研究院院长田丰认为,DeepSeek的出现降低了市场对英伟达芯片的需求预期。过去需要大量英伟达芯片才能实现的模型性能,现在可以通过国产GPU和DeepSeek以更低的成本实现。

1月27日以来,英伟达股价遭遇最大跌幅17%,市值蒸发约5400亿美元。

不过,各厂商对DeepSeek的适配尚未得到DeepSeek官方的确认。适配的好坏差异较大,这意味着GPU厂商需要在适配方面下功夫,以提升自身产品的性能和竞争力。

DeepSeek对产业链的激活还可能影响国内的智算中心。一位算力中心运营方人士对经济观察网记者称,许多智算中心都在研判DeepSeek,还可能会因此改变建设方案,增加国产设备的采购比例。

据中国信息通信研究院数据,截至2024年7月底,国内纳入监测的智算中心(含已建和在建)达87个。

前述算力中心运营方人士称,DeepSeek提供的高性价比模型有助于国产GPU与国产云服务相结合,形成一整套纯国产方案。过去,尽管各地政府鼓励智算中心增加国产设备的采购,但由于国产GPU产能和性能不足,未能很好地满足本土市场需求,导致许多算力中心的采购仍以英伟达品牌为主。

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-