这只机器狗只经过一个小时的训练就学会了走路、打滚和穿越障碍

广告

研究人员发布了一段视频,在视频中,一开始可以看到这个四条腿的机器人在空中挥舞着双腿,挣扎着,10分钟后,它就能迈步了。它从背上滚下来,甚至被一名研究人员用棍子打翻。

加州大学伯克利分校(University of California, Berkeley)的人工智能研究员Danijar Hafner和他的同事们用强化学习的方法训练机器人。

哈夫纳通过电子邮件向《每日邮报》解释说:“通常情况下,机器人在计算机模拟中通过大量的试错来学习,而计算机模拟的速度要比实时快得多。”

“在模拟中完成像站起来和走路这样的任务后,学习到的行为就会在实体机器人上运行。”

“但模拟无法捕捉到现实世界的复杂性,因此在模拟中表现良好的行为可能无法解决现实世界中的任务。”

研究人员在他们的论文中说:“‘梦想者’算法最近显示出了巨大的希望,可以通过在一个有学识的世界模型中进行规划,从少量的互动中学习。”这篇论文尚未被同行审阅。

“学习一个世界模型来预测潜在行动的结果,可以在想象中规划,减少在现实环境中需要的试错次数。”

纽约大学(New York University)计算机科学助理教授、专门研究机器人和机器学习的莱雷尔·平托(Lerrel Pinto)向《麻省理工科技评论》(MIT Technology Review)解释说:“机器人专家将需要为他们希望机器人解决的每一项任务(或)问题做到这一点。”

研究团队还列举了这类技术的其他障碍:

他们在研究摘要中说:“虽然‘梦想家’展示了很有希望的结果,但在硬件上学习数小时会对机器人造成磨损,可能需要人工干预或修复。”

“此外,我们还需要做更多的工作来探索‘梦想家’的极限,以及通过更长时间的训练来探索我们的基线。”

“最后,我们认为解决更具挑战性的任务,结合快速现实世界学习和模拟器的好处,可能是未来有影响力的研究方向。”

在另一项独立的研究中,德国马克斯普朗克智能系统研究所(ppi - is)的研究人员在一项新的研究中透露,他们的机器狗Morti可以通过使用一种复杂的算法,在它的脚上安装传感器,来学习轻松地走路。

“如果一只动物跌倒了,那是错误吗?”只要发生一次就不会。但如果它经常跌倒,我们就可以衡量这个机器人走得多好。”

广告

留下一个回复

您的电邮地址将不会公布。