浙江与香港中文大学联合推出创新RAM三维空间理解模型

2周前更新 7g5rstyn
4 0 0

报道,浙江人形机器人创新中心与香港中文大学浙江大学等机构联合研发的机器人空间智能研究成果,近日在国际顶级期刊《Science Robotics》上发表。该研究提出了RAM三维空间理解与操作模型,成功解决了视觉语言大模型在三维空间感知方面的不足。通过检索增强技术,该模型构建了外部三维知识库,实现了物体位姿理解与长程任务规划。实机测试结果显示,语言指令驱动的操作平均成功率高达89.17%,而图像引导的操作成功率则达到92%。RAM模型可兼容GPT、Qwen-VL等大型模型及人形机器人平台。

浙江与香港中文大学联合推出创新RAM三维空间理解模型的封面图

相关快讯

地平线发布4亿参数开源机器人小脑大模型HoloMotion-1

地平线于5月18日宣布开源HoloMotion-1,这是一个拥有4亿参数的机器人小脑大模型,旨在实现人形机器人的全身控制。HoloMotion-1是HoloMotion技术路线的第一阶段,主要聚焦于模仿任意姿态,能够通过视频、动作捕捉(MoCap)和遥操作数据学习复杂的全身动作。

深度机智获得数亿融资,瞄准具身AGI的未来发展

某头部基金合伙人在听完陈凯关于通过人类第一视角训练实现具身智能AGI的观点后表示疑虑,认为这一方向在美国未能成功。随后,他提到了一些相关的进展:2025年5月,Tesla宣布其Optimus机器人的训练将转向人类视频数据;6月,GeneralistAI展示了机器人的拟人学习能力,并通过27万小时的人类数据验证了规模定律。与此同时,FigureAI与商业地产公司合作采集人类第一视角数据。到2026年2月,英伟达也利用2万小时的第一人称视角视频数据进行预训练,以提升机器人的灵巧操作能力。这些例子表明,行业内对人类第一视角数据的重视与应用逐渐增加。

宇树推出全新双臂人形机器人

宇树推出了一款双臂人形机器人,起售价为2.69万元。这款机器人具备双臂设计,可能用于各种应用场景。

“擎天租”成功获数亿元Pre-A轮融资,助力业务扩展

4月29日,“擎天租”宣布完成数亿元的Pre-A轮融资,投资方包括正大集团旗下的正大机器人、长信股份等产业公司,以及美格智能和蓝思科技等上市公司。老股东明嘉资本、知行投资和睿资创投也进行了超额认购。此次融资资金将主要用于全国履约服务网络建设、机器人资产与调度系统升级、完善物流保险体系、打磨标准化场景产品及拓展全球化服务网络。

千寻位置推出全新“具身时空大脑”产品系列

千寻位置于4月22日发布了“具身时空大脑(SpatiXBot)”产品集,基于其时空智能全链路技术,结合通用大模型与自研专业模型,具备自主行走、环境感知和群体协同能力。该产品主要面向机器人制造商和具身智能行业应用客户,适用于人形机器人、机器狗、无人机、无人车和割草机等多种具身形态,旨在为各类设备提供统一的时空基础支持。

机器人ToB加速发展:数据短板成关键挑战

近期,机器人技术在ToB领域加速发展,应用于仓储、车厂分拣、药店等场景,成为产业增长的核心动力。然而,业内人士认为,机器人的通用能力是实现大规模商业化的关键。尽管大模型的算力和算法已成熟,但数据短缺仍限制了机器人的应用范围。为此,业界希望政策能够在开放应用场景、提供数据建设补贴、降低企业风险和市场准入等方面给予支持,以促进机器人技术更快融入实际生产和生活中。

暂无评论

暂无评论...