万益资讯网

开悟世界模型拿下四大榜单第一,行业还在用老办法改模型,它却从底层重写了规则。 最

开悟世界模型拿下四大榜单第一,行业还在用老办法改模型,它却从底层重写了规则。
最近大晓机器人发布的开悟世界模型在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot和DreamGen这四个权威测试里全拿了第一。不是靠堆参数,也不是靠换个训练数据,而是直接把模型结构整个换掉了。
以前很多团队是拿现成的视频生成模型,再加点“理解外挂”凑合用。结果一到真实场景就卡壳,比如双臂协作拿东西,动作不协调;光照一变,任务直接失败。开悟不这么干,它从一开始就把“看、想、做”三件事合在一个模型里跑。

它用的混合线性注意力算子,能让视觉、动作、物理状态这些信息在内部直接流转,不用来回转换。比如看到水杯倾斜,模型自己就能算出水流角度和重心变化,而不是靠事后补判断。
数据也实打实。十几万小时真实家庭和工厂拍的视频,不是AI合成的。老人扶墙、工人搬货、超市理货这些动作都录下来训练,不是靠想象编出来的。

最实在的是,Kairos-4B真能装进机器人本体里跑。Jetson Thor T5000上实测,做早餐全流程响应不到120毫秒,比传统方案快六七倍。输出的就是控制信号,不是文字指令,省掉中间翻译环节。
在RoboTwin 2.0里,它完成50项双臂任务的平均成功率是96.1%,比第二名高整整0.1个百分点。别小看这零点一,说明它在复杂动作衔接上没掉链子。

LIBERO-Plus测的是乱七八糟环境下的稳定性,它拿了89分,光照、背景、噪声全来也不慌。DreamGen里物理规律得分0.538,倒水、叠石头这些动作不会飘、不会穿模。
现在已有3家机器人公司开始用它的模型,包括一家做人形的。授权费还没公开,但听说是按年订阅的模式。

团队里不少人之前在商汤、京东、优必选干过,不是纯搞算法的,也懂怎么让模型真正在机器上跑起来。
家里用的Kairos-HomeWorld版本已经开源,但目前平面图多,动态人体动作标注还缺一大块。

它没拿28B大模型硬拼,4B参数就干翻一堆更大模型。不是参数不够,而是物理规律先验压得准。
榜单第一只是结果,真正重要的是,它让“机器人看懂世界再动手”这件事,第一次变得像呼吸一样自然。

它做到了。