(原标题:最火“风口”的畅想:具身智能真的要来了吗?)
(本文系紫金财经原创稿件,转载请注明来源)
波德莱尔曾说:“没有想象力,一切官能无论多么健康敏锐,都等于乌有。”正因为有了想象力,未来的边界才能无限拓展。
AI一直是人类对于未来的最大想象之一。经过2024年一整年的厚积薄发,这一想象似乎越来越趋近于实现。
近日,具身智能明星企业智元机器人宣布开启通用机器人商用量产。这意味着具身智能的技术迭代和产品研发有了实质性进展,具身智能产业的发展或将进入实际应用的新阶段。
2024年,具身智能无疑是最火热的风口之一。红杉中国、IDG资本、经纬创投等明星资本纷纷押注;华为、比亚迪、宁德时代等大厂亲自下场加码;北京深圳等一线城市也真金白银入局支持具身智能产业的发展。
在投融资数据趋冷的大背景下,具身智能却走出了逆势格局。据不完全统计,具身智能以一己之力,一年之内至少拿下了60起融资,融资总额超过50亿元,成为国内最吸金的赛道之一。
为什么具身智能今年火了,具身智能商用量产真的来了吗,具身智能的潜力有多大?
钱和人才,都来了
今年年初,优秀的具身智能团队,成为投资机构们疯狂争抢的标的。
这次宣布开启通用机器人商用量产的智元机器人,从今年3月开始就相继至少完成了三轮融资,华为天才少年稚晖君的创立背景,让这家具身智能创业公司从诞生起就备受关注,两年不到融资八轮,估值已超过70亿元。
另一家具身智能创业公司银河通用也踩上了融资的风火轮。今年年中,银河通用就完成了两次融资,拿到了美团、商汤投资的超7亿元人民币的天使轮融资,被称为“年度最大天使轮”,仅仅一个月后,又获得港投公司的天使+轮投资。
和智元机器人一样,银河通用成立时间不过两年,但背后已经站着一列豪华投资机构。既有经纬创投、源码资本、蓝驰创投等知名风险投资基金和北汽、上汽、美团等战略及产业投资方,也有高校科研机构和国资背景基金押注,例如北大燕缘基金、清华 SeeFund 基金和中国互联网投资基金、北京人工智能产业基金等。
智元机器人和银河通用只是这波融资热潮的冰山一角,据不完全统计,2024年具身智能赛道至少发生了60起融资,融资总额超过50亿元,成为今年国内最吸金的赛道之一。
不仅创业公司和机构资本蜂拥而至,大厂和大厂前高管们也躬身入局。前不久,华为正式宣布开始运营具身智能中心,并和业内16家企业签署合作备忘录,计划为生态伙伴提供一站式具身智能服务产品交易采购和技术服务。
这与华为入局新能源汽车领域的形式一脉相承,通过“卖技术”,赋能合作伙伴,实现生态占位。
而比亚迪和宁德时代则直接杀入自研。根据公开消息,宁德时代21C创新实验室已经成立了20人左右规模的团队自研机械臂,比亚迪的具身智能研究团队也在持续扩招。据悉,该团队自2022年成立起已经开发完成工艺机器人、智能协作机器人、智能移动机器人、类人形机器人等多个具身智能产品。
大厂前高管们也瞄准了这个赛道纷纷下场创业。单单是小米系今年就涌现出两家明星公司,小米集团核心创始成员创办的小雨智造,以及今年9月,前小米汽车自动驾驶技术负责人刘方离职后,成立北京阿米奥机器人科技有限公司。此外,曾任华为车BU首席科学家的陈亦伦,也在今年年中选择投身具身智能方向。
北京、深圳、重庆等高线城市,也在真金白银投入,支持具身智能产业的发展,不论是组建具身智能投资基金还是打造具身智能全产业链条,这些城市都在发挥自身优势,使出浑身解数竞逐具身智能高地。
为什么具身智能火了?
一时间,热钱如潮、人才汇聚、政府支持纷至沓来,共同涌向具身智能赛道,可谓是天时地利人和,为什么具身智能在时下的节点如此炙手可热?
最核心的原因还是大模型技术的发展给具身智能带来了质变。
实际上,具身智能这个概念早在1950年就曾被提出,但一直囿于技术原因,进展缓慢。直到近几年大模型的快速发展,给具身智能的蝶变带来巨大机会。
业内有个说法,认为大模型是AI领域皇冠上的明珠,而机器人也是公认的制造业皇冠上的明珠。今年,这两颗皇冠上的明珠碰撞出了有趣的化学反应。
过去,传统的具身智能系统,缺乏自主学习能力和泛化能力,在面对复杂多变的环境时往往力不从心,只能在固定的环境中运作,并且常常需要人工干预辅助。
而大模型的出现,补齐了机器学习能力和泛化能力的短板,让机器人的理解能力和推理决策能力都有了大幅提升。
这相当于给机器人装上一个更类似于人的大脑,可以快速适应环境,并且不断自我学习和进化。这就为具身智能的应用落地,扫清了重要技术障碍。打一个不尽恰当的比方:这相当于功能机变成了智能手机。
最直观的一点是,有了通用大模型后,人类与机器人的交互方式,可以用自然语言进行,这大大降低了机器人的使用门槛,为落地应用打通了重要的一环。
融合大模型的大脑和机器人的形体,具身智能正一步步从想象变成现实。
尤其今年,具身智能被视为未来重要形态之一,而新能源车的竞争日益激烈,不少造车新势力愿意投入具身智能,加快研发投入。比如在11月,小鹏汽车就对外宣布其自主研发的小鹏Iron机器人已经进入小鹏汽车工厂工作;广汽集团也正式对外亮相了其自主研发的第二代具身智能机器人,第三代也已经在紧锣密鼓的研发中。
长期布局人形机器人赛道的特斯拉也在不久前,通过视频展示了其人形机器人Optimus的空手接网球能力,在反应速度和手部灵活度方面都有了大幅提升。
具身智能真的来了吗?
随着智元机器人宣布开启通用机器人的商用量产计划,我们不禁要问,这项新兴的技术真的要来了吗?
我们不妨直接给出答案:可能还需要很长一段时间。
实际上,不同于大模型本身,其训练可以通过互联网数据实现,具身智能与现实世界的交互更加复杂,这意味着它需要更多现实世界的真实数据。
机器可以模拟现实世界的物体形态和环境的三维空间结构,但是和现实世界的接触本身,具有很多突发、不可预测的因素。比如环境中不可控的噪声等细节,这些细节看似细枝末节,但每丢失一次这样的细节,都有可能导致训练无法达到效果。
这就产生了另外一个问题:如果完全依赖真实世界去做训练,又会导致成本剧增。这就需要具身智能公司,找到一个平衡的中间态。
除此之外,对于具身智能最终的形态,究竟是轮式还是双足,目前行业里还没有完全达成共识。
诚然,轮式机器人在行走能力上弱于双足机器人,但胜在成本低。有具身智能厂商认为轮式机器人足以应对平坦、较开阔的空间场景,有一定的发展空间,但也有具身智能厂商是坚定的站“双足派”,认为只有类人的形态才真正具备通用性。
目前行业里也不乏中间派,认为轮式是一个过渡阶段,可先行量产赋能特定的实际应用,亦或认为轮式与双足机器人两者互补,可以共存。这就像新能源汽车兴起时,纯电、混动两派也曾经历过混沌局面,难言对错,而最终的结果要看市场的需求和认可。
除了具身智能的形态之争,在技术路线方面,究竟选择分层/分功能模块还是选择端到端,目前也没有一个明确的答案。分层/分功能模块,是将机器人的操作能力分为“高层次的认知”与“低层次的功能执行”,像银河通用、智元机器人都选择了这一技术路径。
而端到端则是追求从输入信息、决策到输出执行的一体化无缝衔接,更符合真实的现实情况,可以覆盖所有任务,但训练所需要的数据成本也是非常巨大的。
众所周知,大模型是一个烧钱的行业,而具身智能还要结合机器人制造,工程上有一定的实现难度。尤其是灵巧手的供应链体系尚不成熟,研发、制造的成本都不低,这也是具身智能创业型公司不断融钱加大研发的现实需求。
结语
花旗集团的分析团队近日指出,预计到2050年,全球人形机器人的市场规模将达7万亿美元,全球人形机器人数量将达到6.48亿台,这相当于当前全球汽车保有量的一半。
不可否认,这是一个巨大的市场,前景广阔,机会很大,尽管有企业不断释放商用量产的信息,但目前的商用量产只能是在半封闭或者半开放的场景里应用,整个产业尚处于萌芽期,距离真正的大规模商用量产还需要更多的投入与耐心。