Google представил Gemini Robotics-ER 1.5


Компания Google DeepMind выпустила новые модели для робототехники: Gemini Robotics 1.5 и Gemini Robotics-ER 1.5.

Если Gemini Robotics 1.5 — это модель «зрение-язык-действие» (vision-language-action, VLA), предназначенная для непосредственного управления роботами, то ER — это embodied reasoning, т.е. модель умеет рассуждать, что позволяет ей справляться со сложными заданиями

Gemini Robotics-ER 1.5  предлагает новые возможностей, специально разработанные для робототехнических приложений:

  • Пространственное мышление (Возможность пространственного понимания, предоставляется моделью Gemini Flash. Модель умеет генерировать семантически точные двумерные точки, основанные на рассуждениях о размерах, весе и возможностях предметов.).
  • Расширенное агентное поведение (Использование  пространственного и временного мышления, планирования и обнаружения успеха выполнения задач. Возможность вызова внешних инструментов: поиск (Google Search), сторонние пользовательские функции.).
  • Регулирование ресурса мышления (Контроль соотношения задержки и точности: модель может «думать дольше» для решения сложной задачи (например, планирования многоэтапной сборки), или, наоборот — отвечать быстро для простой задачи (обнаружение или указание объекта)).
  • Улучшенные фильтры безопасности (Улучшена семантическая безопасность модели. Теперь модель лучше распознаёт и отклоняет создание планов, нарушающих физические ограничения робота).

Фактически, Gemini Robotics-ER 1.5 выступает мозгом для робота. Модель способна понимать сложные команды на естественном языке, выполнять долгосрочные задачи и организовывать сложное поведение.

Gemini Robotics-ER 1.5 может разбить сложный запрос, например, «убрать со стола», на план и вызвать необходимые инструменты для выполнения задачи, будь то аппаратный API робота, специализированная модель захвата или VLA-модель для управления моторикой.

Попробовать модель Gemini Robotics-ER 1.5 можно в Google AI Studio.

Ссылки

По теме


Добавить комментарий

Arduino

Что такое Arduino?
Зачем мне Arduino?
Начало работы с Arduino
Для начинающих ардуинщиков
Радиодетали (точка входа для начинающих ардуинщиков)
Первые шаги с Arduino

Разделы

  1. Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

  2. Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

3D-печать AI Arduino Bluetooth CraftDuino DIY Google IDE iRobot Kinect LEGO OpenCV Open Source Python Raspberry Pi RoboCraft ROS swarm ИК автоматизация андроид балансировать бионика версия видео военный датчик дрон интерфейс камера кибервесна манипулятор машинное обучение наше нейронная сеть подводный пылесос работа распознавание робот робототехника светодиод сервомашинка собака управление ходить шаг за шагом шаговый двигатель шилд юмор

OpenCV
Робототехника
Будущее за бионическими роботами?
Нейронная сеть - введение