首页 - 财经 - 滚动新闻 - 正文

364元就能开发DeepSeek模型?假的!

来源:21世纪经济报道 媒体 2025-02-07 21:44:17
关注证券之星官方微博:

(原标题:364元就能开发DeepSeek模型?假的!)

近日,一则“炸裂”的AI新闻引发全球关注。

斯坦福大学和华盛顿大学的研究人员发表的一篇研究论文显示,他们以不到50美元(约364元)的云计算费用,训练出一款名为S1的推理模型。该模型在数学和编码能力测试中,与OpenAI的o1和DeepSeek的R1表现不相上下。

这是AI领域的又一次重大突破吗?事实并非如此。

根据研究论文,S1模型并不是从零开始训练,而是以阿里通义千问Qwen2.5-32B开源模型为底座,然后在16块H100 GPU上进行了26分钟的监督微调,最终训练出新模型S1-32B。

在推理能力方面,研究人员则通过蒸馏技术,从谷歌的AI推理模型Gemini 2.0中提取了推理能力。

某大模型厂商的研发人员告诉21世纪经济报道记者,S1模型本质上是在前人研究的基础上复制了推理能力,而非真正创新。

但S1模型的出现,也为头部大模型厂商敲响警钟。如果头部大模型厂商投入巨大资源训练出来的模型,其他人用极少的资源就能复制并实现相似的能力,那头部厂商的“护城河”究竟是什么?

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-