正文内容 评论(0

独木桥、跳隔板、钻洞穴……百度强化学习新算法给机器狗装上新“大脑”
2021-09-28 16:28:01  作者:cici 编辑:cici     评论(0)点击可以复制本篇文章的标题和链接

说起机器狗,你会想到什么?有趣的造型,灵活的动作,连后空翻这种高难度操作也能轻松完成。实际上,机器狗还能用于物流送包裹、工程建设、家庭陪护等很多地方,是妥妥的实力派。

[MD:Title]

对于机器狗来说,想要在各种环境里如履平地,除了要有一双灵敏的“眼睛”之外,最重要的是要有一颗聪明的“大脑”——在技术领域,这颗“大脑”叫做控制算法,可以让机器狗在面对不同的情况时,用不同的方式移动、顺利过关。

传统的机器狗“大脑”一般有三种类型:第一种会先告诉好机器狗每一条腿的每一步该怎么走;

第二种是提前设计好一个方法,让机器狗在实际行动中套用这个方法、去找到最好的答案再走;

第三种是向真实的狗狗“取经”,在狗身上绑上一堆传感器来收集它移动的数据,再让机器狗去学习真实的狗是怎么走的。

不过以上这些方法都存在着一个重要的问题:就是方案制定和实施过程中需要依赖大量的人类专家经验。这就大大限制了机器狗“大脑“所能发挥的能力和触达的边界。

现在,百度团队为机器狗安上了一颗全新的“大脑”,让机器狗能够自己去主动学习和训练,面对高难度的环境挑战时,自己就可以探索出用什么方法才能成功穿越了。

这颗新“大脑”里,最关键的部位叫基于自进化步态生成器的强化学习框架——简单来说就是让机器狗分两步走:

第一步,机器狗能高效地通过“进化”的方式学习出自己的行动沿着什么轨迹走最合理,面对不同的环境要学习合适的“走法”。

第二步就要加上强化学习了,当机器狗在面对当前情况时使用了灵活的方式通过时,就给予“奖励”;如果机器狗笨拙地摔倒了导致没能完成任务,就会给予“惩罚”;就像真实世界里我们训练狗狗一样,机器狗通过训练之后也会形成条件反射,不断学会在各种环境中怎样才能走的更好、更稳。

百度提出的这种新控制算法,也在实验中取得了出色成绩:相比别的机器狗,在上下楼梯、走斜坡、走独木板、跳跃隔板等各种高难度的挑战中,百度牌“大脑”的机器狗走得更加稳当,而且是唯一一个能完成所有场景难关任务的。

[MD:Title]

最重要的是,百度还将这个宝贵的机器狗“大脑”进行了开源,在百度飞桨的机器人仓库中,你也可以使用这个“大脑”很方便地训练属于你自己的机器狗,发挥更多的创意和想象。

面对未来,机器狗也许会前往人们还没探索过的高山、峡谷,即使没有人类专家的经验,只要拥有百度这颗聪明的“大脑”,机器狗都可以自己学习、轻松地翻山越岭,把原本看不到的风景和知识带回给我们,看到世界的每一面。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:cookiequ

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...