Стрим, на котором sim0nsays (Simon Kozlov) рассказывается про AlphaGo(Zero), policy gradients и вообще Deep Reinforcement Learning.
далее: Стрим про капсульные нейронные сети
Ссылки
https://alphagoteach.deepmind.com
По теме
Обучение робота ходьбе при помощи нейронной сети
Нейронная сеть учится играть в Марио
Глубокие нейронные сети как следующий этап развития программного обеспечения
Нейронные сети — Математика интеллекта
Нейронная сеть
Нейронная сеть — введение
Принцип обучения многослойной нейронной сети с помощью алгоритма обратного распространения
Пример работы самоорганизующейся инкрементной нейронной сети SOINN