-
HumanPlus — имитация действий людей роботом-андроидом
Исследователи из Стэнфорда использовали 40-часовой набор данных о движениях человека чтобы обучить робота повторять движения человека по данным от RGB-камеры.
-
OpenVLA — открытая модель Vision-Language-Action
OpenVLA — это модель Vision-Language-Action (VLA) с открытым исходным кодом.
-
LeRobot — открытые модели и утилиты для робототехники от Hugging Face
LeRobot — это открытые модели и утилиты машинного обучения для робототехники от Hugging Face 🤗.
-
Self-Discover — подход к использованию различных техник рассуждения для LLM
Как уже отмечалось, для успешного использования универсального робота — его требуется научить разбивать сложные цели/команды на простые выполнимые задачи. Простого добавления к промпту «Let’s think step by step.» [1] может оказаться недостаточно. Как же тогда научить робота думать?
-
Нейросеть Jack of All Trades от HuggingFace — открытый аналог Gato от Deepmind
HuggingFace опубликовали свою открытую реализацию нейросети Gato. Назвали эту сеть — «Мастер на все руки» (Jack of All Trades (JAT)).
-
DROID — большой набор данных для обучения роботов
DROID (Distributed Robot Interaction Dataset — Распределенный набор данных о взаимодействии роботов) — это новый большой набор данных о взаимодействии роботов.
-
Лекция Andrej Karpathy о разработке токенизатора для GPT
Let’s build the GPT Tokenizer — интересная лекция от Andrej Karpathy о том как разработать и обучить собственный токенизатор для GPT (minbpe).
-
GenEM — генерация выразительного поведения роботов с помощью LLM
Generative Expressive Motion (GenEM) — Генеративное выразительное поведение — новый метод от Google DeepMind по созданию выразительного поведения роботов с помощью больших языковых моделей (БЯМ, LLM).
-
Yann LeCun: на пути к машинам, которые могут понимать, рассуждать и планировать
Прошлогоднее выступление Яна Лекуна (Yann LeCun) про его подход к автономному искусственному интеллекту (ИИ).
-
Awesome-LLM-Robotics — список статей про использование больших языковых моделей в робототехнике
Awesome-LLM-Robotics — git-репозиторий со внушительным списком статей, использующих большие языковые/мультимодальные модели в робототехнике. Кроме ссылок на сами статьи есть ещё ссылки на код и соответствующие веб-сайты.
Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…