王炸！DeepSeek发布收官_财经频道

（原标题：王炸！DeepSeek发布收官）

【导读】DeepSeek“开源周”今日正式收官中国基金报记者忆山 2月28日，在“开源周”第五天，DeepSeek宣布开源Fire-Flyer文件系统（3FS），以及基于3FS的数据处理框架Smallpond。 Fire-Flyer文件系统（3FS）是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统，是所有DeepSeek数据访问的助推器。其特点有：180节点集群中的聚合读取量为6.6TiB/s；25节点集群中GraySort基准测试的量达3.66TiB/min；每个客户端节点的KVCache查找峰值量超过40GiB/s；具有强一致性语义的分解架构；在V3/R1中进行训练数据预处理、数据集加载、检查点保存/重新加载、嵌入向量搜索和KVCache查询推理。 Smallpond是轻量级的数据处理框架，其特点是基于DuckDB的高性能数据处理可扩展性，能够处理PB级别数据集无需持续运行的服务，以及操作简便。

至此，DeepSeek为期五天的“开源周”活动正式收官。 2月21日，DeepSeek宣布，从2月24日起将开源5个代码库，以完全透明的方式与全球开发者社区分享他们的研究进展。 2月24日，DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核，并针对可变长度序列进行了优化，现已投入生产。 2月25日，DeepSeek宣布开源DeepEP，即首个用于MoE模型训练和推理的开源EP通信库。 2月26日，DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局，完全即时编译，可为V3/R1模型的训练和推理提供强大支持等。 2月27日，DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。开年以来，DeepSeek持续火热。QuestMobile数据显示，自上线以来至2月9日，DeepSeek App的累计下载量已超1.1亿次，周活跃用户规模最高近9700万个。日前，有消息称，原计划今年5月发布的DeepSeek-R2模型正在加速开发，或将提前发布。新模型有望能生成更好的代码，并使用英语之外的语言进行推理。对此，DeepSeek母公司幻方量化回应称，以官方消息为准。印度科技服务商Zensar的首席运营官认为，DeepSeek-R2模型的发布或将成为AI行业的关键时刻。DeepSeek成功打造了具有高性价比的AI模型，将促使全球公司加速研发进程，打破目前少数企业垄断的格局。目前，OpenAI、谷歌、xAI、Anthropic、阿里等已相继上新深度推理/深度思考模型。字节跳动旗下AI助手豆包也被传正在小范围测试深度思考模型的不同实验版本，且接入的不是DeepSeek模型。编辑：晨曦校对：纪元

制作：小茉

审核：许闻

《中国基金报》对本平台所刊载的原创内容享有著作权，未经授权禁止转载，否则将追究法律责任。

授权转载合作联系人：于先生（电话：0755-82468670）

突然出手！抄底来了