Прогнозное управление языковой моделью (Language Model Predictive Control) ускоряют адаптацию робота к управляющим командам


Language Model Predictive Control (LMPC) — Прогнозное управление языковой моделью — это метод от Google DeepMind, позволяющий ускорить обучаемость (быструю адаптацию к обратной связи) большой языковой модели (БЯМ, LLM), пишущей код для управления действиями робота.

Используя собранный набор данных пользователей, обучающих роботов новым задачам с помощью языковых инструкций (в виде текстового ввода пользовательских команд и получаемого кода (на рисунке — слева)), можно обучить БЯМ прогнозировать последующие команды и код с учетом текущей истории чата (на рисунке — в центре (LMPC-Rollouts)), либо обучить БЯМ предсказывать сразу последнее правильно действие (на рисенке — справа (LMPC-Skip)). Оба варианта LMPC ускоряют адаптацию робота  посредством контекстного обучения.

Статьи

  1. Learning to Learn Faster from Human Feedback with Language Model Predictive Control

Ссылки

По теме


Добавить комментарий

Arduino

Что такое Arduino?
Зачем мне Arduino?
Начало работы с Arduino
Для начинающих ардуинщиков
Радиодетали (точка входа для начинающих ардуинщиков)
Первые шаги с Arduino

Разделы

  1. Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

  2. Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

3D-печать AI Android Arduino Bluetooth CraftDuino DIY IDE iRobot Kinect LEGO OpenCV Open Source Python Raspberry Pi RoboCraft ROS swarm ИК автоматизация андроид балансировать бионика версия видео военный датчик дрон интерфейс камера кибервесна манипулятор машинное обучение наше нейронная сеть подводный пылесос работа распознавание робот робототехника светодиод сервомашинка собака управление ходить шаг за шагом шаговый двигатель шилд юмор

OpenCV
Робототехника
Будущее за бионическими роботами?
Нейронная сеть - введение