RoboCat — проект системы для управления роботами-манипуляторами от Google Deepmind


Исследователи из Google DeepMind показали проект RoboCat, который представляет собой самообущающуюся ИИ-систему для управления роботами-манипуляторами.

Как работает RoboCat

В основе RoboCat лежит разработанная ранее мультимодальная модель Gato, которая умеет обрабатывать текстовые данные, изображения, аналоговые и дискретные данные. Gato обучили на большом наборе последовательностей изображений и действий различных манипуляторов, решающих сотни различных задач.

После этого первого раунда обучения, RoboCat запустили в режиме «самосовершенствования» на наборе задач, которые модель раньше не видела. Обучение каждой новой задаче проходило в пять этапов:

  1. Собрать от 100 до 1000 демонстраций новой задачи или робота, используя робот-манипулятор, управляемый человеком.
  2. Настроить RoboCat на эту новую задачу/манипулятор, создав специализированного агента.
  3. Специализированный агент практикуется с этой новой задачей/манипулятором около 10’000 раз, генерируя больше обучающих данных.
  4. Расширение тренировочного набора данных за счёт новых самостоятельно сгенерированных данных.
  5. Обучение новой версии RoboCat на новом тренировочном наборе данных.

Подобный подход приводит к тому, что новая версия RoboCat обучается на наборе данных из миллионов траекторий как реальных, так и смоделированных манипуляторов, включая данные, сгенерированные самостоятельно.

Подобный подход позволяет снизить потребность в обучении под присмотром человека и позволяет продвинуться на пути к созданию универсального робота. Например, первая версия RoboCat успешно выполняла ранее неизвестные задачи только в 36% случаев, а после изучения 500 демонстраций каждой задачи — удвоила показатель успеха выполнения задач (74%).

Статьи

  1. Bousmalis K. et al. RoboCat: A Self-Improving Foundation Agent for Robotic Manipulation //arXiv preprint arXiv:2306.11706. – 2023.

Ссылки

По теме


Добавить комментарий

Arduino

Что такое Arduino?
Зачем мне Arduino?
Начало работы с Arduino
Для начинающих ардуинщиков
Радиодетали (точка входа для начинающих ардуинщиков)
Первые шаги с Arduino

Разделы

  1. Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

  2. Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

3D-печать AI Arduino Bluetooth CraftDuino DIY Google IDE iRobot Kinect LEGO OpenCV Open Source Python Raspberry Pi RoboCraft ROS swarm ИК автоматизация андроид балансировать бионика версия видео военный датчик дрон интерфейс камера кибервесна манипулятор машинное обучение наше нейронная сеть подводный пылесос работа распознавание робот робототехника светодиод сервомашинка собака управление ходить шаг за шагом шаговый двигатель шилд юмор

OpenCV
Робототехника
Будущее за бионическими роботами?
Нейронная сеть - введение