文/陈根

在DARPA(美国国防部高级研究计划局)部分资助下,MIT开启了猎豹机器人Cheetah项目。猎豹机器人从第一代开始便表现十分惊艳:它能自主跨越障碍物、实现每小时30 英里(约 48 公里)的高速奔跑。

在第一代猎豹机器人成功研发以后,MIT又对其进行了第二代、第三代的升级。其中,第三代猎豹机器人(Cheetah 3)是约90磅重的四足机器人,体型大约有一只成年拉布拉多犬那么大。由于采用的是腿式,而不是轮子,猎豹3能更好地在崎岖地形行走,它的稳定性十分可靠,甚至能依靠三只腿保持平衡。

不仅如此,2019年,MIT的研究人员还在三号猎豹机器人(Cheetah 3)基础上进行开发迷你猎豹机器人(Mini Cheetah)。迷你猎豹仅重20磅(9公斤),和一只金毛犬的重量差不多。小猎豹虽然体积较小,但它依然可以在经历侧踢时保持平衡。倒地后,也能够自行爬起。

当时,迷你猎豹整体配有12个模块化电动马达,每条腿都配有动力髋关节(2自由度)和膝关节。马达使用的是现成的廉价部件,而不是专门定制的昂贵设计模块,其最大的关节速度为40弧度每秒。

近日,MIT研究人员再次宣布,他们研发的四足迷你猎豹机器人,打破了之前创下的最佳速度记录——达到了 8.72 mph(14.04 km/h)。这项成绩主要归功于一套新颖的无模型强化学习系统,允许机器人自己找出最佳的跑步方式、以及适应不同的地形,而不再依赖于前置的人工分析。

具体来看,通常情况下,机器人都是在一套系统的指引下移动的。该系统会参考机械肢体是如何移动的,来分析并制作指导用的模型数据。但在实际应用中,这些模型往往效率低下、且在应对意外状况时不够全能。尤其当机器人已最高速度运行时,系统硬件更是面临极限压力,使得环境建模变得更加困难。

基于此,MIT 研究团队选择了一套独特的“经验学习”系统。MIT 的迷你猎豹机器人可以通过反复试验来自主学习,而无需人工介入。在积攒了对不同地形的足够经验后,它便可在后续工作中自动改进其行为,甚至无需在现实生活中积累这方面的经验。研究人员称,通过模拟,迷你猎豹机器人可在静止不动的三个小时内,迅速积累 100 天的经验。

在研究人员发布的视频中,这台机器人在撞到障碍物后迅速绕过,以及自主学习适应湿滑结冰路面、以及松散的砾石山丘等地形。在一套简单的神经网络的加持下,它能够对错综复杂的新环境展开相应的评估。

关键词: 研究人员 自主学习 保持平衡