Jim Fan (AI-директор в NVIDIA) рассказал о дорожной карте Nvidia по внедрению физического искусственного интеллекта.
По аналогии с известным Тестом Тьюринга для систем ИИ — предлагается физический тест Тьюринга (Physical Turing Test), который заключается в том, что робот убирает беспорядок и готовит ужин, а мы не можем определить — выполнил эту работу робот или человек.
Отмечается существующая проблемы с данными: их не хватает, а процесс сбора данных медленный и дорогой (для сбора данных используется система телеуправления с управлением операторами).
Для преодоления этого барьера используются системы симуляции, в которых цифровые двойники роботов обучаются и затем переносятся в реальный мир (гуманоидный робот может обучиться ходьбе за два часа моделирования, при этом нейронная сеть контролирующая сложные движения робота имеет всего 1.5 миллиона параметров).
Robocasa — фреймворк для крупномасштабного моделирования, позволяет аугментировать данные симуляции, используя генеративные модели. Подход получил название «цифровой кузен«.
Подход «цифровой кочевник», в котором используются диффузионные модели для видеогенерации, позволяет использовать модели, обученные на видео из интернета для создания реалистичных симуляций (требует очень много вычислений для масштабирования).
В ближайшем будущем, будет наблюдаться переход от физического AI к физическому API.
Роботы станут частью повседневной жизни.
По теме