Language Model Predictive Control (LMPC) — Прогнозное управление языковой моделью — это метод от Google DeepMind, позволяющий ускорить обучаемость (быструю адаптацию к обратной связи) большой языковой модели (БЯМ, LLM), пишущей код для управления действиями робота.
Используя собранный набор данных пользователей, обучающих роботов новым задачам с помощью языковых инструкций (в виде текстового ввода пользовательских команд и получаемого кода (на рисунке — слева)), можно обучить БЯМ прогнозировать последующие команды и код с учетом текущей истории чата (на рисунке — в центре (LMPC-Rollouts)), либо обучить БЯМ предсказывать сразу последнее правильно действие (на рисенке — справа (LMPC-Skip)). Оба варианта LMPC ускоряют адаптацию робота посредством контекстного обучения.
Статьи
Ссылки
По теме
- Dobb·E — открытый проект по обучению робота выполнять домашние дела
- TidyBot — персонализированный робот-помощник на основе больших языковых моделей
- Awesome-LLM-Robotics — список статей про использование больших языковых моделей в робототехнике
- Microsoft предложила использовать ChatGPT для управления роботами
- Роботы Everyday Robots от Alphabet начали выполнять уборку в офисе Google