(原标题:热度飙升!DeepSeek登顶苹果应用商店第一,超越 ChatGPT)
DeepSeek周末刷屏,热度突然飙升!
1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
图片来源:苹果应用商店截图
昨日还有网友表示,DeepSeek崩了,提示服务器繁忙。随后,DeepSeek回应媒体称,1月26日下午DeepSeek确实出现了局部服务波动,但问题在数分钟内得到解决。此次事件可能与新模型发布后的访问量激增有关,而官方状态页未将其标记为事故。
怎么回事?一夜之间,DeepSeek就火了?
天眼查显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”),该公司成立于2023年7月份,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋共同持股。
据了解,深度求索背后的操盘手梁文锋是金融圈成名已久的高手。他创立的幻方量化,为国内量化私募巨头之一。
DeepSeek微信公众号信息显示,1月20日,深度求索正式发布DeepSeek-R1大模型,并同步开源模型权重。“DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。”深度求索在发布信息中表示。
图片来源:DeepSeek官微
《黑神话:悟空》的主创冯骥也高度评价和推荐DeepSeek,他指出存在六大优点:
1、强大。比肩o1的推理能力,暂时没有之一;
2、便宜。参数少,训练开销与使用费用小了一个数量级;
3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;
4、免费。官方目前提供的服务完全免费,任何人随时随地可用;
5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持);
6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。
此外,在美国硅谷,多位人工智能行业意见领袖对DeepSeek-R1表达由衷赞美。据证券日报报道,微软CEO萨蒂亚?纳德拉公开表示:“他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”曾投资过OpenAI的投资人马克·安德里森在社交平台表示,DeepSeek-R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
值得注意的是,据湛江发布消息,性能比肩GPT-4o的DeepSeek-V3,投入研发费用为558万美元,训练成本不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。
市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型。
对此,市场也是高度关注,已有多家券商发布相关研报。财通证券指出,DeepSeek-R1高性价比API定价,极具商业化落地潜力:DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,远低于可比大模型API服务。DeepSeek-R1的高性价比API定价有助于开发者在使用后加速模型的功能迭代,从而解决目前模型存在的不足。
开源证券认为,DeepSeek-R1基于强化学习再次让“低成本+高性能”大模型成为可能,并有望引领模型往开源方向发展,强大的推理能力或助力其在教育、办公、科研领域应用加快落地。
图片来源:同花顺iFind
南财快讯记者注意到,A股已有多家上市公司披露与DeepSeek的合作情况。如昆仑万维披露,公司携手新加坡南洋理工大学成功开发Q*算法,显著提升现有大模型推理能力。在MATH数据集上,Q*帮助DeepSeek-Math-7b提升至55.4%的准确率,超越了Gemini Ultra。
每日互动也表示,随着行业进入大模型时代,公司也在第一时间接入ChatGPT、文心一言、ChatGLM、通义千问、DeepSeek等国内外通用大模型,结合自身的数据积累和挖掘能力以及对特定行业深刻洞察,开发出垂直场景类大模型应用在商业营销和公共服务领域。
不过也有公司表示未与DeepSeek合作。卓创资讯就称,公司尚未与DeepSeek深度求索建立业务合作关系。
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)