深圳时报考拉悠然×同济空间智能团队:世界模型不是视频生成器,而是空间智能的决策引擎

考拉悠然×同济空间智能团队:世界模型不是视频生成器,而是空间智能的决策引擎

           

2026年5月29日,WorldArena Track-1(视频质量赛道)最终评测结果揭晓。考拉悠然联合上海码极客、同济大学空间智能团队打造的考拉悠然无界世界模型,开源版本 BLM 斩获全球第一,闭源版本 BWM-Fast 拿下全球第二。

图 1:考拉悠然无界世界模型开源版本 BLM 全球第一(共13个模型)

图 2:考拉悠然无界世界模型闭源版本 BWM-Fast 全球第二(共86个模型)

01

以小博大,算力不是唯一的入场券

架构原创才是真正的壁垒

当前世界模型领域存在一种惯性认知:高保真生成=海量数据+超大模型+天价算力,行业竞争正沦为“数据与算力”的军备竞赛。但考拉悠然无界世界模型选择了另外一条路。

数据工程层面,考拉悠然没有盲目追求训练数据规模扩张,而是通过训练数据增强与智能增广策略,最大化释放单位数据的训练价值,用更高的数据利用效率领先堆量选手。

模型架构层面,基于 DiT 架构,引入首帧引导、动态记忆机制以及双通路动作控制调制策略,从场景初始化、长时序记忆建模到动作响应控制多维度系统增强。生成结果在时空连贯性、动作可控性与物理一致性上全面领先。

大幅降低训练成本,依然拿下国际顶尖评测成绩——这正是考拉悠然、上海码极客、同济大学空间智能团队在世界模型核心技术方向上的原创突破力。

02

全场景霸榜

六大具身任务,物理世界精确复刻

考拉悠然无界世界模型在多类具身任务中展现出对复杂操作过程的精确建模能力:

·空间重排:保持物体身份与目标布局,维持稳定堆叠接触,预测自适应夹爪控制

·铰链交互:捕捉铰链约束下的开合动力学,旋转过程中保持几何连贯

·精细操作:捕捉细粒度可供性动态,接触位置与功能区域精准对齐

·双臂协同:建模同步双臂运动,避免近距离交接中的接触碰撞

·长程放置:维持长时序场景一致性,遮挡下避免物体漂移

·分布外泛化:面对未见初始场景和物体外观变化,仍能沿给定动作序列推演,保持物理一致性

世界模型的核心价值从来不是“生成好看的未来画面”,而是帮机器人提前回答:如果执行这个动作,环境会怎样变化?任务能否成功?策略是否值得继续优化?

03

最强考场WorldArena

全球世界模型的终极试金石

WorldArena 构建了一套全球最前沿的评估体系。Track-1(视频质量赛道)从视觉质量、运动质量、物理遵循性、内容一致性、三维空间准确性以及可控性 6 大评测维度(16 项细分指标)进行综合考量,全面检验世界模型的交互能力、物理一致性与未来时空预测能力。

Google、NVIDIA、高德、生数科技、极佳视界、流形空间、深度机智、北京人形机器人创新中心等国内外顶尖团队持续参与。每一次榜单更新,不仅是模型性能的动态演进,更是世界模型技术路线的重新洗牌。

04

开源与闭源并进

打破技术壁垒,推动生态普惠

当前世界模型行业两大痛点:学术成果难验证,顶尖技术难复现。

考拉悠然无界世界模型选择开源与闭源并进:

  • 开源 BLM:释放可复现技术底座,降低科研与开发门槛
  • 闭源 BWM-Fast:持续探索模型性能上限,验证技术路线竞争力
  • 生态共建:推动高校、企业与开发者共同参与世界模型迭代

此次悠然无界世界模型登顶 WorldArena 世界模型榜单,是考拉悠然与上海码极客、同济大学空间智能团队共同研发的成果,也体现了各方始终秉持打破技术壁垒、推动技术普惠、赋能空间智能生态发展的愿景追求。

免责声明:本网站内容均转载自其它媒体或互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。
相关推荐
返回列表

评论已关闭。

Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。