Это пример обучения с подкреплением при помощи Q-Learning и простой нейронной сети прямого распространения.
Робот учится двигаться вперёд (положительное вознаграждение — считывание расстояния от ультразвукового датчика расстояния после каждого хода).
Нейронная сеть имеет 12 выходов (каждая сервомашинка может находиться в трёх различных положениях (60,90 и 120 градусов)).
Ссылки
Robot controlled by artificial neural network
https://github.com/Counterfeiter/Q-LearningRobot
По теме
Нейронная сеть — введение
Принцип обучения многослойной нейронной сети с помощью алгоритма обратного распространения
Пример работы самоорганизующейся инкрементной нейронной сети SOINN
RC-машинка управляется нейронной сетью
Нейронная сеть учится играть в Марио