(原标题:“一段式端到端”将爆发?华为、Momenta、博世等均已布局)
自今年3月份特斯拉推出采用“端到端”自动驾驶解决方案的V12版本FSD(全称Full-Self Driving,完全自动驾驶)以来,国内车企也开始上马“端到端”智驾技术。但关于自动驾驶技术“端到端“到底应该是一段式的还是两段式的,业内争论不息。
12月12日,在汽车评价研究院主办的“地平线杯”第六届世界十佳智能汽车评价结果发布暨世界智能汽车品牌论坛上,北汽新能源商创中心解决方案业务总监梁耕龙表示:“行业内大家都在争议‘端到端’到底该是两段还是一段,我觉得不存在两段好还是一段好的问题,但终极的目标一定是一段。”
北京理工大学汽车研究所所长、教授龚建伟表示:“从长远来说,将输入控制到输出控制集合的一段式端到端,可能是终极目标。从人的预期来说,以更多数据让智驾更类人是一个更好的方案,其更丰富、更稳定,也是我们的终极目标。”
“端到端”的一段式和两段式之争
自动驾驶“端到端”是指把准则模型拿掉,车辆将传感器采集到的信息直接发送到一个统一的深度学习神经网络,神经网络经过处理之后,输出自动驾驶汽车的驾驶命令,即算法直接将系统的输入端连接到输出端。
因为各个AI模块之间用transformer(深度学习神经网络模型)链接起来,信息通过隐性传递,可以减少传输过程中的损耗,实现整个网络优化。基于AI神经网络,智驾系统在海量数据的训练下,会自主学习、模仿人类的驾驶经验。
因此,“两段式端到端”方案的信息经过感知模型过滤后,再到规控模型,有两个信息处理环节。而“一段式端到端”将智驾的感知、预测决策、规划多个模块合为一体,直接从传感器输入外部环境信息,并输出车辆的行驶轨迹,只有一个信息处理环节。
业内普遍认为,“两段式端到端”经过两个决策过程,信息损失较多,同时还会面临无法全面理解复杂场景、泛化能力和解决corner case(极端情况)的能力较弱等问题。“一段式端到端“则依托庞大数据和算法,使得“端到端“模型像人类大脑一样,具备更高的理解力和进化能力,能够掌握新的工具并应对未曾见过的场景。
站在车企的角度,梁耕龙表示:“干产品人的都知道,控制器的原理就是,如果一个控制器能做好,发展趋势肯定是能少一个是一个,两段控制中间的传输,不管是毫秒级还是更低的响应速度,总归会有响应时间。”
梁耕龙举例说,人的大脑响应速度和眼睛的响应速度是毫秒级,人的执行速度是20毫秒,人对于车辆的动态感觉是200毫秒,这中间都会有停顿。因此,“端到端”两个端之间的响应速度格外重要。
不过,“一段式端到端”虽然信息无损程度更低,但其“黑盒”属性(模型的决策过程不公开或者难以理解)更明显,存在更大的安全挑战。
百度智能驾驶首席研发架构师、百度智能驾驶事业群组技术委员会主席王亮表示,“一段式端到端”模型的黑盒系统很难控制系统输出的内容,且缺乏透明度,工程师很难在Debug(排错)系统决策逻辑。
“一段式端到端”必须解决数以百万计的长尾问题。王亮说,One Model(一段式)的端到端系统,比分层的端到端更难收集长尾数据,这也会影响模型迭代。一段式方案隐藏了一个很大的问题,即一部分Corner case是因为感知结果错误,才导致了错误的规划,从而引发系统出现高风险问题。“完全式端到端的背后,还存在很大的不确定性,或许还需要很长的时间周期,才能真的产生价值。”王亮表示。
“一段式端到端”玩家增多
关于“端到端”到底是一段式还是两段式,行业中已经分为两个流派。华为、百度Apollo、大疆旗下卓驭科技、小鹏汽车、极氪汽车等都是两段式玩家,商汤科技、Momenta等则是“一段式端到端”的坚定支持者。
虽然“一段式端到端“还存在需要海量数据的难题,但随着高等级自动驾驶车辆的渗透率越来越高,该难题或将得到进一步优化,“一段式端到端”也正加速到来。
“我估计NOA在2025年会迅速爆发,它的渗透率甚至会超过新能源,高等级智能驾驶渗透率2025年可能就会有30%甚至50%,因为它的成本没有我们想象的那么高。”同济大学汽车学院教授、汽车安全技术研究所所长西产表示。
“一段式端到端”也成为众多自动驾驶公司和车企的布局重点。在今年4月的北京车展上,商汤绝影发布了其下一代自动驾驶技术DriveAGI,该技术是基于多模态大模型,对端到端智驾方案进行改进和升级的“One Model 端到端”(一段式端到端)。9月底,Momenta发布了首个量产智驾大模型,将感知与规划整合进一个大模型中,也是“一段式端到端”。
辰韬资本联合多家单位在8月发布的2024年度《端到端自动驾驶行业研究报告》认为,One Model端到端系统中性预期落地时间会晚于模块化端到端1~2年时间,从2026年至2027年开始上车量产。
但车企的动作更快。昊铂于9月24日发布了一段式“端到端”架构的NDA3.0智驾系统,并在9月30日正式上线。10月28日,在智己品牌智能驾驶技术日上,智己汽车发布了其与Momenta联手打造的“一段式端到端直觉式智驾大模型”,使智己汽车成为业内首个同时拥有L2、L3、L4级智能驾驶量产能力的品牌。
更多车企也开始转向“一段式端到端“。9月,小米汽车将原来“感知”和“规控”两个二级部门合并为“端到端算法与功能部”。业内有分析认为,组织架构的变化,或暗示小米汽车至少将“一段式端到端”作为目标。
近日有消息称,华为车 BU 智能驾驶产品线成立了约50人规模的技术开发部,与感知、规划控制等技术部门平行,该部门负责包括端到端与大模型的结合,“一段式端到端”方案预计将是华为2025年推出的智能驾驶系统ADS 4.0版本的重要能力。
此外,包括理想汽车、广汽埃安、元戎启行、黑芝麻智能等在内的公司,均已布局“一段式端到端”。全球供应商巨头博世表示,两三年之内,两段式“端到端”方案是短期内较为理性的量产主流方案。博世计划在2025年中量产“一段式端到端”无图智驾方案。
朱西产表示:“今年国内应该还不具备做‘一段式端到端’的数据能力和训练平台的算力,我觉得今年上市所有车应该还是两段式的,准则模型应该还没有拿掉。”
龚建伟则认为,“一段式大模型”成本非常高,需要大算力投入,相较而言,分段式大模型成本较低。他建议企业着重考虑成本因素,且从稳定性来看,现阶段分段式大模型或许更适合。