导读
近日,智元机器人推出行业首个面向真实世界机器人操控的统一世界模型平台 Genie Envisioner(GE),并宣布将开源全部代码、预训练模型及评测工具。
Genie Envisioner (GE)平台创新性地将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构,首次实现机器人在同一世界模型中完成从感知到决策再到执行的端到端推理流程。
平台的核心优势在于其无缝集成的闭环设计:GE-Base 模型基于超百万条数据训练,擅长解析环境布局与动作意图;GE-Act 动作解码器负责将理解转化为具体动作指令;而GE-Sim 则作为基于动作条件的神经仿真器,利用分层机制实现精准视觉预测。三者协同工作,驱动整个平台高效运行。
为构建这一强大平台,智元机器人利用了约3000小时的真实机器人操控视频数据。这些宝贵数据帮助 GE 建立了从语言指令到视觉空间的直接映射,完整保留了交互的时空信息,为模型的准确性和实用性奠定了坚实基础。
在实际测试中,搭载 GE-Act 组件的机器人已成功完成制作三明治、倒茶、擦拭桌面等多项任务。这有力验证了 GE 平台的性能,并展示了其在提升机器人智能交互与任务执行能力方面的广阔应用前景。
来源:快科技
往/期/回/顾 ]article_adlist-->REVIEW机器人“真干活”时代启幕:2025世界机器人大会揭新机
炒菜机器人从“实验室”跳进“烟火气” 将成为餐饮业新宠
]article_adlist-->“互联网+”服务平台
智造直播 | 智造课堂 | 展会合作
0571-89719789
]article_adlist-->中承配资提示:文章来自网络,不代表本站观点。