-
EMMA — мультимодальная модель для управления автомобилем от Waymo
Исследователи Waymo представили EMMA (End-to-End Multimodal Model for Autonomous Driving) — сквозную мультимодальную модель для автономного вождения.
-
pi0 — фундаментальная модель для роботов от Physical Intelligence
Стартап Physical Intelligence, разрабатывающий фундаментальную модель для управления роботами, получил $400M инвестиций от Jeff Bezos, Thrive Capital и OpenAI.
-
Резервуарные вычисления для бортового ИИ
Авторы статьи Classical and Quantum Physical Reservoir Computing for Onboard Artificial Intelligence Systems: A Perspective поднимают вопрос о высоком энергопотреблении современных систем искусственного интеллекта (ИИ), что сильно ограничивает возможности автономной работы роботов, дронов и беспилотных автомобилей. Авторы отмечают, что решить эту проблему с помощью традиционных вычислительных устройств — невозможно, поэтому они рассматривают перспективы использования резервуарных…
-
Molmo — семейство открытых мультимодальных AI-моделей
Molmo (Multimodal Open Language Model) — открытая мультимодальная модель, умеющая обрабатывать картинки и текст (vision-language model (VLM)).
-
Робот-манипулятор обыгрывает новичков в настольный теннис
Исследователи из Google DeepMind представили проект по разработке обучаемого робота, который способен достичь уровня человека-любителя в настольном теннисе.
-
Figure AI показал работу своего робота на заводе BMW
Стартап Figure AI (партнёр OpenAI), показал работу своего робота-андроида FIGURE 01 на автомобильном заводе BMW (Plant Spartanburg).
-
OpenVLA — открытая модель Vision-Language-Action
OpenVLA — это модель Vision-Language-Action (VLA) с открытым исходным кодом.
-
LeRobot — открытые модели и утилиты для робототехники от Hugging Face
LeRobot — это открытые модели и утилиты машинного обучения для робототехники от Hugging Face 🤗.
-
Нейросеть Jack of All Trades от HuggingFace — открытый аналог Gato от Deepmind
HuggingFace опубликовали свою открытую реализацию нейросети Gato. Назвали эту сеть — «Мастер на все руки» (Jack of All Trades (JAT)).
-
Thomas Wolf показал как можно сделать умного робота в 250 строчек кода
Thomas Wolf (со-основатель и CSO HuggingFace) показал как можно сделать умного робота с именем «Немо» в 250 строчек кода.
Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…