-
Butter-Bench — проверка как LLM справляются с управлением роботом
Исследователи из Andon Labs представили свою работу по изучению использования современных больших языковых моделей (БЯМ, LLM) для управления роботом. Робот должен был справиться с простой задачей — передать масло. Выяснилось, что текущие БЯМ испытывают трудности: лучшая модель справляется с задачей в 40% случаев, в то время как человек в 95%.

Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…