万益资讯网

最近圈内吵得最凶的一个问题:机器人到底该用什么模型?Jim Fan在AI Asc

最近圈内吵得最凶的一个问题:机器人到底该用什么模型?

Jim Fan在AI Ascent上说「VLA已死,WAM当立」。VLA是视觉-语言-动作模型,过去三年机器人圈的主流路线——知道什么是「杯子」,但不理解「倒水」这个动作的物理过程。说白了,知道名词不懂动词。

他搞的DreamZero让AI先「梦见」未来几秒再行动,零样本泛化,没见过的新任务也能做。

另一边LeCun更狠。直接说「没有一家公司知道怎么让机器人变聪明」,管这叫机器人行业「最大的秘密」。他说现在的人形机器人跳舞打拳全是预编程——换个环境就废。

笑死,LeCun跟Musk还在网上互怼。Musk说你做不到不代表别人做不到,LeCun回:「我知道怎么做,只是不是你们现在赌的那条路。」

两条路线:Jim Fan用更多算力让AI梦见物理世界;LeCun要重新发明架构,不走LLM老路。

说实话我偏Jim Fan这边——先跑起来再说。但LeCun戳的那个问题是真的:世界模型没搞定,机器人永远是瞎子。

你们站哪边?

AI 机器人 具身智能 VLA WAM 世界模型 人形机器人