人工智能(AI)工具的性能,包括用于自然语言处理(NLP)和计算机视觉算法的大型计算模型,在过去几十年里得到了迅速提高。其中一个原因是,用于训练这些算法的数据集呈指数级增长,收集了数十万张通常从互联网上收集的图像和文本。
另一方面,机器人控制和规划算法的训练数据仍然远没有那么丰富,部分原因是获取这些数据并不那么简单。因此,一些计算机科学家一直在尝试创建更大的数据集和平台,这些数据集和平台可用于训练用于广泛机器人应用的计算模型。
在最近的一篇论文中,德克萨斯大学奥斯汀分校和英伟达研究中心的研究人员介绍了其中一个名为RoboCasa的平台,该论文已在服务器arXiv上预发表,并将在2024年机器人:科学与系统会议上发表。
RoboCasa是一个大型模拟框架,可用于训练多面手机器人在日常环境中完成各种任务。
该论文的第一作者朱玉科在接受Tech explore采访时表示:“人工智能的最新进展在很大程度上是由在海量数据源上训练大型模型推动的。”
“受到这些进步的启发,我们寻求为能够执行各种日常任务的一般能力机器人开发基础模型。RoboCasa旨在提供训练此类机器人基础模型所需的高质量仿真数据。”
朱、Soroush Nasiriany、Abhiram Maddukuri、Lance Zhang、Adeet Parikh、Aaron Lo、Abhishek Joshi和Ajay Mandlekar最近工作的主要目标是开发一个新的开源仿真平台,以促进机器人算法的训练。
他们的努力最终促成了RoboCasa的开发,这是他们几年前推出的模拟框架RoboSuite的扩展。RoboSuite是团队用来创建RoboCasa模拟环境的模拟基础设施。
“我们利用生成式人工智能工具来创建各种对象资产、场景和任务,”朱解释说。“这些人工智能工具显著提高了模拟世界的多样性和真实感。此外,RoboCasa支持各种机器人硬件平台,并为模型训练提供超过10万条轨迹的大型数据集。”
RoboCasa平台包括数千个3D场景,其中包含150多种不同类型的日常物品和数十种家具和电器。RoboCasa具有高度逼真的模拟,并使用生成式人工智能工具进行了丰富。
朱和他的同事们设计了100个机器人算法可以训练的任务,并为这些任务编写了高质量的人类演示。他们的平台还包括生成有效轨迹和运动的方法,这些轨迹和运动可以让机器人完成这些任务。
“两个关键的发现最让我兴奋,”朱说。“首先,我们展示了一个缩放趋势:随着我们增加(机器生成的)训练数据集的规模,模型的性能稳步增长。其次,通过将模拟数据与现实世界数据相结合,我们发现增强的数据集增强了机器人在现实世界任务中的表现。”
在最初的实验中,新的仿真平台被证明是生成合成训练数据的宝贵资源,这些数据可用于训练模仿学习算法。总的来说,这项研究表明,模拟数据可以非常有效地训练用于机器人应用的人工智能模型。
未来,其他团队可以尝试RoboCasa,它是开源的,因此可以很容易地在GitHub上访问。与此同时,朱和他的同事们计划继续扩展和改进他们的平台,以促进其在机器人社区的广泛使用。
“首先,我们的目标是采用更先进的生成式人工智能方法,进一步扩展我们的模拟,捕捉以人为中心的环境的多样性和丰富性,从家庭、工厂到办公室,”朱补充说。
“其次,我们计划开发更好的算法,利用模拟数据构建在现实世界中更强大、更通用的机器人系统。”
更多信息:Soroush Nasiriany等人,RoboCasa:通才机器人日常任务的大规模模拟,arXiv(2024)。DOI: 10.48550/ arXiv .2406.02523
?2024 Science X Network
引用:一个新的大规模模拟平台,用于训练机器人的日常任务(2024年6月15日),从https://techxplore.com/news/2024-06-large-scale-simulation-platform-robots.html这个文档检索到2024年6月15日
作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司
内容仅供参考之用。