对deepseek的看法，以及对英伟达的影响_财经频道

（原标题：对deepseek的看法，以及对英伟达的影响）

$英伟达(NVDA)$ 讲一下我对最近大火的deepseek的看法，以及对英伟达的影响。deepseek搞出了很多花里胡哨的东西，结合起来就是我苦练内功，算法创新含量爆表，甚至还能绕开cuda写汇编，所以我的训练特别特别便宜，只有你的3%，所以你们堆那么多高端gpu，完全是懒惰不思进取，以后就不要买gpu了，全都学我，挖掘现有gpu的潜力，争取大家全都一年不买一块gpu，饿死英伟达。

当然，实际上deepseek的训练有没有那么牛逼，还是有争议的，但是现在推理的测评结果出来了，看起来没那么牛逼。它的r1大模型670b参数，每次推理都只激活37b个参数。而llama3 70b参数，每次推理基本上就是这个70b参数。所以理论上r1应该是llama3 70b模型的推理速度的2倍，这样运算效率就能打平。但今早看到英伟达的nim服务器集成了DS-r1，h200上速度是最多3820token/秒，而之前集成过llama3 70b大魔王，速度是3000token/秒。所以速度并没有达到2倍，所以推理效率还不如llama3 70b，而llama3 70b是去年四月份的东西了，比现在早了接近一年。当然，你可以说DS-r1是深度推理，有思维链cot的，和llama3不一样，但是起码他的推理速度确实也没有表现出宣称的吊打一切的样子，一般般吧。
所以，回到开头的问题，有了deepseek在算法上的宝贵探索，是不是又一次证明了那些探索很多只是噱头，只是一种心理战，而堆算力终究还是王道，以及买英伟达的gpu，更是王道中的王道呢？

证券之星微信

扫描二维码

关注

证券之星微信

精彩推荐

内容精选