刚刚写了一篇长文,给大家总结一下,方便大家快速了解:郎博认为,在自动驾驶乃至更广义的具身智能领域,模型架构并非决定性因素,关键在于模型必须与完整的具身智能系统深度适配,而在此基础之上,数据才是最终起决定作用的力量。以理想汽车的VLA(视觉语言动作)模型实践为例论证:第一,VLA作为生成式模型,已通过真实数据验证其有效性,能在某些场景下产生对物理世界的“认知涌现”,输出更拟人的驾驶行为;第二,脱离海量真实数据空谈模型架构(如世界模型)是空中楼阁,理想凭借数百万车辆构建的数据闭环,才能将驾驶水平逼近人类。进而,将自动驾驶视为一个完整的具身智能系统,强调其成功依赖于感知、模型、操作系统、芯片、本体(如底盘)等全栈能力的协同自研与优化。只有“大脑”(模型)与“身体”(硬件执行机构)紧密配合,才能发挥整体价值。最后,在自动驾驶领域,建立数据闭环的车企拥有无可比拟的数据优势——不仅能挖掘存量数据,更能通过大规模用户车队持续获取真实、自然的驾驶数据(包括人类的不完美驾驶习惯),从而驱动系统持续进化。这一系统化能力与数据优势,正是理想将其VLA视为未来汽车类具身机器人核心技术的底气所在。
