Чевероного робота-собаку ANYmal научили передвигаться по сложной местности при помощи обучения с подкреплением (Reinforcement Learning).
Для обучения робота движению, авторы используют только проприоцептивную обратную связь. Контроллер обучается путем обучения с подкреплением при помощи симуляции. Управление контроллера осуществляется политикой нейронной сети, которая принимает на вход поток проприоцептивных сигналов.
Авторы обращают внимание, что контроллер сохраняет свою надежность даже в условиях, которые никогда не встречались во время тренировки: деформируемая местность (грязь, снег), динамические точки опоры (щебень), наземные препятствия (густая растительность).
Таким образом показано, что устойчивое передвижение в естественной среде может быть достигнуто путем обучения в простых областях.
Статьи
Learning quadrupedal locomotion over challenging terrain (PDF)
Ссылки
Learning Quadrupedal Locomotion over Challenging Terrain
По теме
Робота-собаку ANYmal снабдили колёсами
Три робота-собаки: SpotMini, Laikago, Anymal
Обучение четвероногого робота ходьбе при помощи тренировки нейронной сети в симуляции
Обучение робота действию через однократную демонстрацию
Робота научили решать задачи на основе базовых знаний
Обучение робота ходьбе при помощи нейронной сети
Стрим про Reinforcement Learning
Нейронная сеть
Нейронная сеть — введение
Принцип обучения многослойной нейронной сети с помощью алгоритма обратного распространения
Пример работы самоорганизующейся инкрементной нейронной сети SOINN