Робот-собака учится передвижению по сложной местности при помощи обучения с подкреплением


Чевероного робота-собаку ANYmal научили передвигаться по сложной местности при помощи обучения с подкреплением (Reinforcement Learning).

Для обучения робота движению, авторы используют только проприоцептивную обратную связь. Контроллер обучается путем обучения с подкреплением при помощи симуляции. Управление контроллера осуществляется политикой нейронной сети, которая принимает на вход поток проприоцептивных сигналов.
Авторы обращают внимание, что контроллер сохраняет свою надежность даже в условиях, которые никогда не встречались во время тренировки: деформируемая местность (грязь, снег), динамические точки опоры (щебень), наземные препятствия (густая растительность).
Таким образом показано, что устойчивое передвижение в естественной среде может быть достигнуто путем обучения в простых областях.

Статьи
Learning quadrupedal locomotion over challenging terrain (PDF)

Ссылки
Learning Quadrupedal Locomotion over Challenging Terrain

По теме
Робота-собаку ANYmal снабдили колёсами
Три робота-собаки: SpotMini, Laikago, Anymal
Обучение четвероногого робота ходьбе при помощи тренировки нейронной сети в симуляции
Обучение робота действию через однократную демонстрацию
Робота научили решать задачи на основе базовых знаний
Обучение робота ходьбе при помощи нейронной сети
Стрим про Reinforcement Learning

Нейронная сеть
Нейронная сеть — введение
Принцип обучения многослойной нейронной сети с помощью алгоритма обратного распространения
Пример работы самоорганизующейся инкрементной нейронной сети SOINN
  • 0
  • 23 октября 2020, 07:10
  • admin

Комментарии (0)

RSS свернуть / развернуть

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.