Инженеры из университетов Иллинойса и Стэнфорда (США) использовали метод обучения с подкреплением, чтобы улучшить возможности мобильных роботов по ориентации и передвижению среди людей.
Основная идея состоит в использовании окружающих робота людей в качестве индикаторов наличия поблизости препятствий.
Проще говоря — робот может наблюдать за поведением людей, и делать из этого выводы об окружающей действительности.
Подобная идея впервые использовалась для обучения робомобилей в 2018 году (People as Sensors: Imputing Maps from Human Actions) и затем была обобщена для отслеживания сразу за несколькими водителями.
В основе реализации — использование обучения с подкреплением, для обучения искусственной нейросети (вариационный автокодировщик (variational autoencoder, VAE)), чтобы сеть могла делать выводы о наличии препятствий, используя слежение за людьми. В результате — нейросеть может использоваться в качестве средства для облегчения навигации в помещениях.
Подобный подход можно сравнить с человеческой интуицией, действующей при передвижении в толпах людей.
Для своих экспериментов, исследователи использовали мобильного робота Turtlebot 2i.
Получившийся код можно посмотреть на гитхабе — PaS_CrowdNav.
Статьи
- Mun Y. J. et al. Occlusion-Aware Crowd Navigation Using People as Sensors //arXiv preprint arXiv:2210.00552. – 2022.
Ссылки
По теме