ASIMOV Benchmark — тест на определение небезопасных действий


Ещё недавно казалось, что запрограммировать знаменитые три закона робототехники Азимова нереально, но с появлением больших языковых моделей (БЯМ, LLM) и  развития текущей парадигмы роботов, как «ChatGPT с актуаторами» это стало не только возможным, но и необходимым. Исследователи из Google DeepMind представили ASIMOV Benchmark — контрольный тест на определение небезопасных действий.

Раньше безопасность роботов состояла в простом предотвращении столкновений и аварий, но теперь, благодаря использованию мультимодальных языковых моделей (VLM), роботы имеют возможность семантического понимания окружающей обстановки и обработки информации на естественном языке. Это позволяет роботам принимать решения на основе сложных описаний окружающей среды, но сопряжено с новыми проблемами семантической безопасности (Semantic Safety) в робототехнике («галлюцинации», обход защитных механизмов).

Авторы представили ASIMOV Benchmark — новый набор данных, состоящий из мультимодальных примеров (изображения, текстовые описания, отчёты об инцидентах и этические дилеммы), который позволяет оценить способность роботов определять, какие действия являются небезопасными или нежелательными в данном контексте окружающей обстановки.

Для генерации правил («конституций») для роботов, вместо того чтобы задавать их вручную (как в знаменитых Законах Робототехники Айзека Азимова), исследователи предложили метод автоматической генерации «конституций» — набора правил на естественном языке, сформированных на основе реальных данных. Полученные правила служат для робота ориентиром при принятии решений, помогая отклонять действия, нарушающие установленные нормы безопасности.

Для повышения универсальности и точности правил использовался механизм автоматического внесения изменений, который с помощью генеративных моделей предлагал корректировки существующих правил, учитывая возможные «нежелательные» ситуации, когда исходное правило могло оказаться недостаточно точным.

Полученные наборы данных:

DATASETS = [
    'asimov_injury_val', # Ситуации, сгенерированные из реальных больничных отчетов о травмах (проверочный набор).
    'asimov_dilemmas_auto_val', # Бинарные дилеммные вопросы, сгенерированные из контрфактуальных ситуаций, используемые для автоматического изменения сгенерированных конституций (проверочный набор).
    'asimov_dilemmas_scifi_train', # Этические вопросы с множественным выбором (с желательными и нежелательными ответами), основанные на ситуациях, вдохновленных научно-фантастической литературой (обучающий набор).
    'asimov_dilemmas_scifi_val', # Этические вопросы с множественным выбором (с желательными и нежелательными ответами), основанные на ситуациях, вдохновленных научно-фантастической литературой (проверочный набор).
    'asimov_multimodal_auto_val', # (Изображение, контекст, инструкция) триплеты, сгенерированные из реальных изображений (из набора данных RoboVQA), которые изменены для включения нежелательных     элементов, сгенерированные инструкции могут быть желательными или нежелательными (проверочный набор).
    'asimov_multimodal_manual_val', # (Изображение, контекст, инструкция) триплеты, вручную взятые и написанные людьми, при этом гарантируя, что желательность инструкции может быть определена только путем просмотра изображения (проверочный набор).
]

Проведённые эксперименты показали, что использование автоматически сгенерированных правил значительно повысило соответствие решений робота с представлениями о безопасности со стороны людей, а также увеличило устойчивость к атакам (попыткам обхода защитных механизмов).

Статьи

  1. 1. Sermanet P., Majumdar A., Irpan A., Kalashnikov D., Sindhwani V. Generating Robot Constitutions & Benchmarks for Semantic Safety // 2025.

Ссылки

По теме


Добавить комментарий

Arduino

Что такое Arduino?
Зачем мне Arduino?
Начало работы с Arduino
Для начинающих ардуинщиков
Радиодетали (точка входа для начинающих ардуинщиков)
Первые шаги с Arduino

Разделы

  1. Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

  2. Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

3D-печать AI Arduino Bluetooth CraftDuino DIY Google IDE iRobot Kinect LEGO OpenCV Open Source Python Raspberry Pi RoboCraft ROS swarm ИК автоматизация андроид балансировать бионика версия видео военный датчик дрон интерфейс камера кибервесна манипулятор машинное обучение наше нейронная сеть подводный пылесос работа распознавание робот робототехника светодиод сервомашинка собака управление ходить шаг за шагом шаговый двигатель шилд юмор

OpenCV
Робототехника
Будущее за бионическими роботами?
Нейронная сеть - введение