(原标题:DeepSeek“开源周”今日收官,都发布了什么?)
2月28日,国内AI明星企业深度求索(DeepSeek)为期五天的“开源周”活动正式收官。
“开源周”都发布了什么?
自2月24日启动以来,DeepSeek“开源周”发布的五个项目涵盖了从计算、通信到存储的各个方面。
2月24日:首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。2月28日:在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器。
中信证券研报指出,DeepSeek“开源周”有望进一步催化AI+主题。DeepSeek陆续开源5个代码库,以完全透明的方式与全球开发者社区分享他们在探索通用人工智能(AGI)领域的进展。DeepSeek的低成本、高性能特性带动AI渗透率全社会加速,随着开源代码的逐步发布,有望进一步带动各个行业应用的加速发展,以及算力端需求的增长。
Deepseek API重新开放充值,并下调价格
在经历长达19天的暂停充值后,DeepSeek于2月25日正式恢复API开放平台的充值功能。此次重启伴随着价格体系的结构性调整:
deepseek-chat基于的V3模型调用价格为每百万输入tokens 2元,每百万输出tokens 8元;deepseek-reasoner基于的R1模型调用价格为每百万输入tokens 4元,每百万输出tokens 16元。
2月26日,DeepSeek进一步推出错峰优惠定价策略。DeepSeek宣布,每日优惠时段为北京时间00:30-08:30,其余时间按照标准价格计费。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。