首页 - 财经 - 媒体广场 - 雪球 - 正文

对deepseek的看法,以及对英伟达的影响

来源:雪球 作者:shallowwangwang 2025-02-01 01:04:50
关注证券之星官方微博:

(原标题:对deepseek的看法,以及对英伟达的影响)

$英伟达(NVDA)$ 讲一下我对最近大火的deepseek的看法,以及对英伟达的影响。deepseek搞出了很多花里胡哨的东西,结合起来就是我苦练内功,算法创新含量爆表,甚至还能绕开cuda写汇编,所以我的训练特别特别便宜,只有你的3%,所以你们堆那么多高端gpu,完全是懒惰不思进取,以后就不要买gpu了,全都学我,挖掘现有gpu的潜力,争取大家全都一年不买一块gpu,饿死英伟达。
当然,实际上deepseek的训练有没有那么牛逼,还是有争议的,但是现在推理的测评结果出来了,看起来没那么牛逼。它的r1大模型670b参数,每次推理都只激活37b个参数。而llama3 70b参数,每次推理基本上就是这个70b参数。所以理论上r1应该是llama3 70b模型的推理速度的2倍,这样运算效率就能打平。但今早看到英伟达的nim服务器集成了DS-r1,h200上速度是最多3820token/秒,而之前集成过llama3 70b大魔王,速度是3000token/秒。所以速度并没有达到2倍,所以推理效率还不如llama3 70b,而llama3 70b是去年四月份的东西了,比现在早了接近一年。当然,你可以说DS-r1是深度推理,有思维链cot的,和llama3不一样,但是起码他的推理速度确实也没有表现出宣称的吊打一切的样子,一般般吧。
所以,回到开头的问题,有了deepseek在算法上的宝贵探索,是不是又一次证明了那些探索很多只是噱头,只是一种心理战,而堆算力终究还是王道,以及买英伟达的gpu,更是王道中的王道呢?
微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-