【机器人训练数据集迎来新突破,预训练数据集是影响大模型性能的核心要素】据工业专题研究指出,机器人大模型的发展离不开多样化的机器人训练数据集。然而,由于对任务相关性和多样性要求较高,...
【机器人训练数据集迎来新突破,预训练数据集是影响大模型性能的核心要素】据工业专题研究指出,机器人大模型的发展离不开多样化的机器人训练数据集。然而,由于对任务相关性和多样性要求较高,真实数据昂贵且耗时。近期,MimicGen基于175个人工示范数据,可以生成涵盖18个任务、多种场景、任务对象和机械臂的5万多个合成数据,并且与等量真实数据的训练效果相当;RoboGen可以无限生成任务、场景和训练数据,实现机器人7x24小时全自动技能学习。通过合成数据的训练,机器人的执行成功率显著提高,且等量的人工示范数据和合成数据对机器人的训练效果相当。预计预训练数据集来源的丰富将会加速机器人大模型的发展。然而,需要注意的是,模型泛化能力不足、数据集训练结果不及预期、机器人通用性不及预期等仍然存在风险。【免责声明】本文仅代表第三方观点,不代表本媒体立场。投资者据此操作,风险请自担。
最新评论