(原标题:具身智能产业能否复制DeepSeek的成功)
今年1月,DeepSeek凭借能媲美openAI推理模型的R1成功出圈后,近日,又携“一大桶”重磅技术“炸弹”,再一次引爆了全球人工智能技术圈。
2月24日至28日,DeepSeek推出名为“开源周”的技术开放活动,放出覆盖训练、推理、通信、负载均衡以及数据加速5大技术成果的代码库,让人目不暇接。
硅基流动创始人、CEO袁进辉第一时间现身评论区点评道:“DeepSeek官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”
目前,国内几乎所有人工智能企业不是接入了DeepSeek生态,就是在接入DeepSeek的路上。而随着人工智能的捷报连连,具身智能作为与其最为息息相关的产业之一也开始进入公众视野。
具身智能(EAI),是由被称为“AI之父”英国计算机科学家图灵在1950年首次提出的概念。从功能定义上来说,具身智能通过感知周遭环境,结合任务进行自主决策,从而在真实的物理世界中实现交互的集成系统。
其中,机器人便是具身智能一个非常重要的载体。其可以替代人类完成重复性、烦琐,甚至于复杂危险的任务,拥有广阔的应用前景。市场普遍认为,未来每个家庭甚至每个人平均拥有一台机器人,因此市场空间将超过智能手机、汽车,至少达到万亿级别。
根据东吴证券的测算:假设制造业机器人渗透率达到16%,服务业机器人渗透率达到10%,全球人形机器人每年新增市场空间将达到10万亿元。其中,中国市场空间约为2.3万亿元。
而在DeepSeek大放异彩之际,人们不禁开始期盼,中国的具身智能行业是否也能诞生出这样一家企业?
针对于人们对具身智能行业关注和讨论。今年2月,在上海召开的2025全球开发者先锋大会(GDC)上,具身智能领域内的多位专家聚集一堂,发表了各自的观点和看法。
开源能否解决问题
DeepSeek的成功,被誉为是“开源的胜利”。但业内对技术应该走开源还是闭源模式的争议一直未有定论。目前,美国以openAI为代表的多家技术巨头均选择了闭源的商业模式,而国内以DeepSeek为首的人工智能企业则纷纷宣布了开源。
有观点认为,从行业角度来看,DeepSeek之所以选择开源,是基于多方面的战略考量。首先,开源是后来者居上的最佳路径。通过开源,DeepSeek能够迅速吸引全球开发者和研究者的关注,最终围绕自己的优势技术形成一个产业生态。
而这样的发展路径,在具身智能领域内是否也同样适用?
松应科技创始人聂凯旋发表观点认为:开源对行业的促进作用,会比很多商业公司单向推动行业成熟高出一个数量级。
“将各种技术生成统一的标准化路径,有利于上游供应链在这个标准化的基础上,逐渐去推动快速进步和成本的大幅下降。” 聂凯旋说:“对于在相关的零部件例如传感器等生态上的企业,开源在很大程度上是可以帮助企业向这个领域去投入更多的资源。”
因此,对于企业而言,开源有利于吸引开发者或产业链上的合作伙伴共建生态,从而建立起基于自身硬件或技术的护城河。
但反对观点认为,如果企业自身实力不过关,开源后的技术并不会产生吸引力,不仅难以建立行业生态,甚至会将自己的核心技术也拱手让人。
乐聚(苏州)机器人总 经 理王 松指出, “硬件开源并不是一个最终的解决办法。”
北京灵初智能科技CEO王启斌认为,整个工业界现在需要的是有一到两家可以真正引领行业的企业。“必须先是一家独大,才有百花齐放。”
同时,王启斌认为:“DeepSeek今天能引爆这个市场,是因为大语言模型的技术路线是收敛的。”
与人工智能行业不同,当前具身智能行业仍处于前期探索阶段,尚未形成统一的技术路线。
大摩在不久前发布的一份关于具身智能行业的研究报告指出:目前该行业仍处于早期发展阶段,且存在多种可能的技术选择,竞争格局将继续演变。宇树科技CEO王兴兴也指出,目前人形机器人的技术路线还没有完全统一,光硬件就有好几个技术路线。
在行业发展初期,技术路线的选择非常重要。一旦押错路线,不仅过往的努力付之东流,甚至还会让竞争对手赶超。例如波士顿动力于2024年放弃了Atlas系列机器人,市场认为其中一个重要原因,便是波士顿动力对于液压驱动的研究失败所致。
因此,在技术路线尚未成型的情况下,盲目开源不仅起不到预期的作用,甚至还会产生反效果。
不过,大家也普遍认为,开源和闭源之间并不矛盾。
聂凯旋表示:“模型可以开源,数据可以不开源。”
王启斌也指出,硬件的开源不是不是“yes or no”的问题,而是“timing”的问题。
商汤大装置产品高级总监卢国强也认为:“整个产业的起步阶段,可能不是靠开源去推进的。但是当这个产业在大规模拓展落地阶段,有可能要靠开源去推进。”
事实上,随着具身智能行业的加速发展,已经有数家企业在开源的道路上踏出了第一步。
例如上海智元机器人于今日推出了全球首款全栈开源机器人灵犀X1的整装组件。智元将灵犀X1定义为全栈开源机器人,使得任何人可以自由地修改、定制和优化灵犀X1的硬件和软件,具身智能可进入“人人造”的时代。
而在此之前,国地中心开源全国推出了首个全尺寸人形机器人公版机“青龙”。
聂凯旋称:“当前还不存在非常显著的商业化竞争。更多的是让社会、市场和消费者有信心地认为,机器人是一个可以发展起来的一个大的产业。不然没有大量的关注度、资金和需求被释放出来,这个行业不太会成为一个大的产业。”
具身智能头上的“乌云”
近年来,人形机器人的“进化”速度宛如风驰电掣一般。但根据各家公司公布的demo演示,当前机器人无论是速度还是灵巧度仍相当笨拙,而对于已经进入实际应用的案例中,机器人的效率也显著慢于当前人类的效率。例如优必选科技推出的Walker S1和瓦力机器人已经在多家工厂进行实地测试。但其工作效率仅达到人类工人的20%。
宇树CEO王兴兴在2024年的中关村仿生机器人大会上称,目前行业最大的“乌云”是AI架构缺乏自己的理解和学习能力。
目前,全球范围内的相关企业均在探索具身智能的AI模型架构。其中,主流方案为被称为“大脑”加“小脑”的VLM方案。即通过一个千亿级别参数的大模型作为感知和规划决策,成为机器人的大脑;再通过另一个千万参数级别的模型作为小脑,负责机器人的运动控制。
目前,VLM模型在智驾界已取得了一定的成果。不过,有业内人士认为,双模型策略非终点。未来,两个模型可能会融合为一个更高效、更强大的模型。
2023年7月,谷歌DeepMind发布了全球首个控制机器人的视觉-语言-动作(VLA)模型RT-2。其特点是省去了两个模型之间的沟通过程,被认为是VLM模型的进化版本。
今年2月,AI机器人初创公司Figure AI发布了端到端人形机器人VLA通用大模型Helix。被认为是端到端(E2E)模型在人形机器人应用中的成功范例。
不过,无论是VLM还是VLA,仍面临来自包括硬件算力,以及通过大量数据进行泛化训练等多项挑战。
正如成功的大语言模型需要海量文本数据来训练一样,具身智能行业也需要大量优质的训练数据。然而,具身数据无法从互联网海量内容中直接获取,而需通过真实的机器人操作来采集或高级仿真平台生成,因此具身数据的采集需要较高的时间和成本,很难达到较大的规模。
目前,主流的方式是“遥操作”,通过人穿上传感设备去收集相应的动作信息和交互数据。但其效率仍是瓶颈。因此,能在虚拟空间进行数据收集的仿真平台成为行业期待的解决方案。
聂凯旋也认为,仿真平台未来可能成为一个非常核心、关键的技术。
据了解,仿真平台通过数字化建模和仿真模拟,实现对真实世界的复刻,从而模拟各种智能体在其中的行为模式和复杂应用场景。
不过,仿真平台亦存在技术瓶颈,首当其冲的便是准确度的问题。
乐聚(苏州)机器人总经理王松称:“在仿真当中去模拟现实环境和机器人的状态,其实是一个非常困难的一个事情。因为算力不够,所以说模拟到现实(Sim2Real)存在很大的鸿沟。”
目前,具身行业的主流仿真平台包括Isaac Sim、AirSim、Unity等。但仿真出来的数据与真实世界数据还是有相当大的差距。
香港中文大学(深圳)终身教授、跨维智能创始人贾奎,通过从学术界到产业界的长期践行,给出答案认为,在消除合成数据与真实数据之间的差距方面,Sim2Real AI一直被视为实现空间与具身智能的重要技术路径。
相较而言,Sim2Real AI 通过物理仿真和合成数据,可以更高效地覆盖上述真实世界中的变化。这种方法允许在虚拟环境中模拟各种操作对象、环境变化、机器人构型和传感器变化,并能针对不同商业场景共享底层的物理仿真和数据生成能力。包括刚体、铰链、软体、流体等在内的任何操作对象,都可以通过精准的物理仿真支持数据生成。
但仿真平台的建设是一项长期工程,需要不断的投入和优化,并会产生大量的试错成本。例如英伟达的Isaac Sim,其商业模式便是与其GPU硬件生态绑定。
截至目前,国内对于仿真平台的建设亦步亦趋。今年2月,北京市科学技术委员会、中关村科技园区管理委员会等部门印发《北京具身智能科技创新与产业培育行动计划(2025-2027年)》。其中提出,构建具身智能世界模型仿真平台。
同月,上海人工智能实验室在昨日举行的 2025 全球开发者先锋大会(GDC)“浦江 AI 生态论坛”上发布了通用具身智能仿真平台桃源 2.0。
商汤大装置产品高级总监卢国强认为:“仿真平台的确是行业的一个核心,并且这方面也没有捷径。但是反过来看,希望并不渺茫。咱们国家从工业仿真,芯片设计,赶上来的速度较快,也做了一些成果出来。”
技术不会因为危险而停止发展
市场认为,未来人形机器人将大量进入工厂、社区、家庭甚至军队里,表现出无穷的潜力。但同时,人们也不禁会产生疑惑,这么厉害的人形机器人未来是否会抢夺普通人的工作岗位?
最后,行业专家们就具身智能的安全和伦理问题进行了讨论。
北京灵初智能科技CEO王启斌称,“从历史的维度上来看,每一次技术的演进,可能会推倒一部分人,但总体而言是对人类有很大的促进作用。然而这次是硅基生命,我不确定用传统的思维来看待是否依然适用。”
此前,麦肯锡研究所给出了一组数据:随着科技的进步,在2030年保守估计全球4亿人的工作会因为人工智能发生变动,激进估计则会影响到全球8亿人口。
聂凯旋也认为,很多可替代性比较强的工作,确实存在这样的风险。但聂凯旋同时指出,更多岗位会被创造出来。“就像当时汽车也替代了很多的人力拉车,但是又创造了新的岗位去生产汽车,以及4S店。” 聂凯旋说。
王松指出,即使人形机器人的智能性、投入性有所提升,也不能把人完全给替代。王松称:“因为其背后会衍伸出一个有一个新的产业链,包括我们现阶段的训练场、数据采集师、机器人运维、操作部署、以及远程的维护,诞生出新的一个产业链。”
国地中心首席科学家江磊博士称:“我是觉得首先还是要乐观,技术一直在进步,不会因为它危险而停止发展。”