小鹏发布第二代VLA,可以从视觉直接到动作,不用中间的语言转译,其本质其实也是世界模型。 为了训练第二代VLA,小鹏用了1亿视频训练数据,相当于一个人开车65000年遇到的场景总和。 有点夸张【来自懂车帝车友圈】
沛柔聊汽车啊
感谢大家的关注
作者最新文章
热门分类
汽车TOP
汽车最新文章