(原标题:为什么说DeepSeek将加速人形机器人产业大爆发)
转发自:@先知减一 老师。先知老师是国内头部人形机器人的投资人,目前在国内清华系的一家产业基金,也是科技领域的投资人,早年他还在中科大的时候就很熟的朋友了,欢迎大家关注
一、基础知识——人形机器人和具身智能是一回事吗?之前市场在预期什么?
1. 人形机器人和具身智能的关系:
顾名思义,具身智能 (Embodied Artificial Intelligence),就是给具身(多指人形机器人)赋予智能。
具身智能大模型是人形机器人实现商业价值的必备器官(大脑)。
人形机器人的控制涉及四个环节,分别是感知、决策、规划、执行。
以让机器人做火锅为例:
感知:识别环境信息,确认锅、底料、水、电磁炉的位置和形状,确认当前环境已通电。
决策:认为当前环境满足做火锅的条件,决定做火锅。分析出做火锅需要三步:架锅插电、倒水放底料、烧水。
规划:把步骤划的更细,比如倒水动作是把机械臂往前伸1米,以45度角向下转动手臂。
执行:执行规划环节输出的代码。
前三个环节未来都要通过具身智能大模型来完成。显然,人类对具身智能大模型的能力要求,比我们常见的大语言模型要高很多。
2. 具身智能的定义:
本质上,具身智能大模型 = 强推理模型(决策规划) + 多模态大模型(感知和处理) + 世界模型(提供数据和知识)。
(1)强推理模型:推理能力强,做好决策规划。减少模型幻觉的出现概率,话可以乱说,机械臂不能乱甩。
(2)多模态大模型:大语言模型的升级版,不仅有文字信息的处理能力,还能处理图片、视频、触觉信号等“多个模态”的信息。
(3)世界模型:人形机器人需要了解和储备真实世界的物理规律(重力、摩擦力等)和物体的物理信息(形状大小、表面材质等)。
小球实验:R1快把牛顿的棺材板掀开了
网页链接
3. 市场在预期什么?为什么人形机器人这么火?
之前市场在预期ChatGPT展现的涌现现象(对应Scaling Law) ,也能在具身智能大模型出现。具身智能迎来自己的GPT时刻。
——将现有数据集规模增加2-3个数量级,错误率可降到1%。
但不同于大语言模型的涌现,具身智能研发的两大难题是:
(1)数据不够:物理数据比互联网数据难获得。
所以智元等公司在建大规模的数据采集工厂,但相比大语言模型所使用的互联网数据,还是杯水车薪。
(2)推理能力不足:物理世界更复杂。
整个机器人行业刚开始学习运用最基础的触觉信息。
二、人形机器人的GPT时刻?——DeepSeek对具身智能的影响预期
1. DeepSeek重大里程碑
24-11-20:发布R1-Lite-Preview,关注度很小,学术界都还没关注。
24-12-26:发布V3,开始在学术界引起关注。也是后来R1的基座模型。
25-01-15:发布App,并且有深度思考功能。
25-01-20:发布R1,公布论文、开源模型权重。
2. DeepSeek的强推理能力,展现了具身智能实现的“曙光”
对应上文提到的:具身智能大模型 = 强推理模型 + 世界模型 + 多模态大模型。逐个分析:
(1)推理能力极强:适合决策规划环节。
DeepSeek-R1是思维链(CoT)推理模型的代表作(其他还有OpenAI-o1/o3、Kimi 1.5等)。这类模型的特点是:在回答前推理思考,先生成一条可长达万字的思维链,逐步分解复杂问题,通过多步骤逻辑推理解决问题,因此在复杂任务中展现出极高效率。非常适合具身智能的决策规划环节。
以之前讲做火锅需要的三步为例:架锅插电、倒水放底料、烧水。
DeepSeek思考的逻辑性非常强、细节很多(还要讲究油温,比普通人思考的多)。
(2)世界模型能力走强中:
思维链推理模型极大提升了对物理世界的理解能力。OpenAI-o1作为OpenAI的初代推理模型,在数学、代码领域均比4o提升5-6倍,在科学问题领域(生物、物理、化学)甚至已超越人类专家。
R1与o1全面对标
3. DeepSeek超轻量级推理模型,为具身智能端侧爆发点燃引线
(1)Scaling Law在被超预期突破:
以DeepSeek-R1(671B)、OpenAI-o1(300B)为代表的思维链推理模型,将大模型从参数内卷中拯救出来(相比GPT-4有18000 B参数,是R1的27倍),开辟了大模型研发新思路,通过思维链方式大幅提升了模型能力。
且DeepSeek-R1采用创新的混合专家架构,每次推理仅激活37B参数,就达到了比肩OpenAI-o1的效果(GPT-4的1/486)。
模型对参数要求在大幅缩减,涌现现象出现的概率大幅变高,超越了学术界和产业界对此的预期。
(2)世界模型提前到来:
过往需要收集互联网数据量级的物理世界数据量,才能实现机器人对物理世界的理解。
这个看似不可能完成的任务,随着推理模型能力的成倍增加(见上图表),现在正以成倍的速度被解决。
通过 模型本身的进化 + 大规模收集数据,双管齐下,解决世界模型的研发难题。
有理由相信,未来随着新的模型结构出现,世界模型还会进一步加速到来。
(3)百花齐放的时代到来,端侧模型能力大幅提升:
DeepSeek团队用R1产生的高质量数据,去SFT(监督微调)和蒸馏其他家模型(阿里Qwen、META Llama),均以30-50%的幅度全面提升了这些模型的能力。
这证明了DeepSeek数据集能显著提升其他模型的能力,已开始有大量端侧模型运用其数据集和思路大幅加强自身能力,人形机器人的端侧模型不再是故事,开始变得可用。
(蒸馏版千问32B基本已在及格线上,且强于OpenAI-o1-mini)
(4)使用&训练成本低 ? 需求&供给同步拉升:
DeepSeek-R1的API价格为:0.07美元(缓存命中)& 0.28美元(缓存未命中)/百万输入tokens,1.10美元/百万输出tokens。
对比OpenAI-o1:15美元/百万输入tokens,60美元/百万输出tokens。
DeepSeek-R1的输入和输出价格分别是OpenAI-o1的 0.5-2% 和 1.8% 。
在DeepSeek-V3和R1压力下,2025年2月6日OpenAI发布的o3-mini模型价格较前代降低63%(仍显著高于DeepSeek-R1)。
DeepSeek 的训练成本也较低,其基座模型DeepSeek-V3在预训练阶段只花费557.6万美元。成本只有同类模型的5-10%(Meta Llama 3.1和GPT-4都是6000万美金左右)。
三、投资观点:重点关注有更高壁垒和价值的“智能”部分,而非传统制造业的“具身”
经历过去半年的热炒,大量本该是低市盈率的制造业公司被炒上岸(轴承、外壳等公司)。随着DeepSeek带来具身智能的突破,2025年人形机器人投资开始分化,我们需要以终局思维审视产业价值分配——真正决定机器人商业化落地的核心要素,不是机械结构的精密度,也不是执行器件的响应效率,而是“感知、决策、规划、执行”这一闭环的完成度。
1. 感知、数据采集:
(1)感知是人形机器人与环境交互的基础前提。
(2)要达到具身智能还需要收集大量数据,一线城市在陆续大规模兴建数据采集工厂。
(3)可关注雷赛智能(灵巧手及“小脑”运动控制)、鸣志电器(灵巧手空心杯电机)等公司。
2. 决策规划:
(1)具身智能大模型用于决策规划需用到大量算力。
(2)随着端侧级模型开始可用,端侧算力芯片模组大有用武之地。
(3)港股公司地平线针对机器人应用场景成立子公司地瓜机器人,已在多个场景大规模出货。
(4)A股可关注一博科技(PCB设计制造)、美格智能(模组,已落地人形机器人)等公司。
ü 重点关注$一博科技(SZ301366)$ :端侧算力领域的平台级产品,已与宇树达成合作
一博的主要产品为PCB,即电路板,是所有端侧算力芯片的根本载体,就像是芯片的胎盘,具有平台级产品的潜力。一个好的PCB承载平台,能最大程度地提升芯片的集成度、保障散热能力和信号完整性,是人形机器人不可或缺的核心零部件。(具体案例:一博科技通过PCB设计,使人形机器人传感器响应速度提高30%)
针对PCB高端产品的需求度,咨询头部具身智能公司灵巧手负责人得知:合适的PCB板一价难求,目前只能专门花大价钱定制。
一般来说,人形机器人产品上需要搭载30-50块高端PCB板,单板1000-1500元,即5万元左右的价值量,占价值量的15%左右,毛利率约为40%。
另一家头部具身智能公司专家评价PCB的价值量
但一块好用且轻量的PCB板,是芯片的胎盘,在空间有限的人形机器人体内,PCB的定制集成价值极高。PCB上可搭载各类芯片、控制器、传感器、通信模块等,因此应按照PCB整体模组、而不是PCB单板计算价值量!
根据该专家以自己公司的人形机器人为例,PCB模组占总BOM价值量的24.7%,在不同模块毛利率高达50-70%。
一博本周在投资者平台实锤已与宇树科技达成合作,已在给人形机器人端侧算力芯片定向研发专业PCB模组,进展走在行业最前列。【附注:我从产业渠道了解到,宇树24年采购金额第一的企业应该是一博科技,大概率也是完整的以模组形式去交付的产品,如果长盛轴承值300亿。那么一博应该值多少?】
公司的董事长汤昌茂出身于HW工程师,联合七位HW前同事共同创立一博科技,公司具备深厚的技术底蕴。其为人形机器人行业专属开发的高端PCB产品,有望成为所有人形端侧算力的标准承载平台,有平台级产品的潜力【公司本身也在做自己的量产产能】。
推荐重点关注
3. 控制执行:
(1)具身智能大模型进行决策规划后,需通过控制器、驱动器、编码器等驱动系统零部件,控制人形机器人运动。
(2)控制的延迟度、精准度、可靠性等因素,决定了人形机器人的运动水平。
(3)可关注雷赛智能(控制)、固高科技(控制)等公司。
ü 重点关注雷赛智能:兼具运动控制能力(小脑)和灵巧手产品能力
雷赛智能是国内极少数同时卡位“灵巧手感知”与“运动控制执行”两大高壁垒环节的龙头。公司在工控领域的积累(如PC-based控制卡、伺服系统)延伸至灵巧手的多关节协同控制,形成从单关节模组到整手系统的全链条技术覆盖,是具备“小脑”能力的灵巧手研发公司。
两大能力积累:
a. 运动控制能力(小脑):工控领域的身后积累+深度学习加持
采用生成对抗网络(GAN)优化决策算法,提升灵巧手在复杂操作中的动作精度和自适应能力。
伺服系统支持峰值扭矩密度优化,支持128轴同步控制,适配人形机器人多轴联动需求。
第三代算法将响应速度提升至0.8ms(行业平均1.5ms),显著提升运动控制精度,确保机器人快速响应环境变化。
b. 硬件产品能力:人形机器人硬件全栈自研及量产能力
具备 控制器+驱动器+电机 的全栈解决方案。
供人形关节的FM1/FM2系列无框力矩电机(达35Nm/kg的高扭矩密度,超越安川,微米级定位精度)已成功量产,年产能30万台,已累计供货超万台。
供灵巧手的空心杯电机已成功量产,年产能12万台。