这只机器狗只经过一个小时的训练就学会了走路、打滚和穿越障碍——真是了不起的工程

研究人员发布了一段视频，在视频中，一开始可以看到这个四条腿的机器人在空中挥舞着双腿，挣扎着，10分钟后，它就能迈步了。它从背上滚下来，甚至被一名研究人员用棍子打翻。

加州大学伯克利分校(University of California, Berkeley)的人工智能研究员Danijar Hafner和他的同事们用强化学习的方法训练机器人。

哈夫纳通过电子邮件向《每日邮报》解释说:“通常情况下，机器人在计算机模拟中通过大量的试错来学习，而计算机模拟的速度要比实时快得多。”

“在模拟中完成像站起来和走路这样的任务后，学习到的行为就会在实体机器人上运行。”

“但模拟无法捕捉到现实世界的复杂性，因此在模拟中表现良好的行为可能无法解决现实世界中的任务。”

研究人员在他们的论文中说:“‘梦想者’算法最近显示出了巨大的希望，可以通过在一个有学识的世界模型中进行规划，从少量的互动中学习。”这篇论文尚未被同行审阅。

“学习一个世界模型来预测潜在行动的结果，可以在想象中规划，减少在现实环境中需要的试错次数。”

纽约大学(New York University)计算机科学助理教授、专门研究机器人和机器学习的莱雷尔·平托(Lerrel Pinto)向《麻省理工科技评论》(MIT Technology Review)解释说:“机器人专家将需要为他们希望机器人解决的每一项任务(或)问题做到这一点。”

研究团队还列举了这类技术的其他障碍:

他们在研究摘要中说:“虽然‘梦想家’展示了很有希望的结果，但在硬件上学习数小时会对机器人造成磨损，可能需要人工干预或修复。”

“此外，我们还需要做更多的工作来探索‘梦想家’的极限，以及通过更长时间的训练来探索我们的基线。”

“最后，我们认为解决更具挑战性的任务，结合快速现实世界学习和模拟器的好处，可能是未来有影响力的研究方向。”

在另一项独立的研究中，德国马克斯普朗克智能系统研究所(ppi - is)的研究人员在一项新的研究中透露，他们的机器狗Morti可以通过使用一种复杂的算法，在它的脚上安装传感器，来学习轻松地走路。

“如果一只动物跌倒了，那是错误吗?”只要发生一次就不会。但如果它经常跌倒，我们就可以衡量这个机器人走得多好。”