Что не так со свёрточными нейронными сетями?

Свёрточные нейронные сети (convolutional neural networks (CNNs)) показывают отличные результаты по распознаванию.
Однако, по словам Хинтона (Geoffrey Hinton), на самом деле очень жаль, что CNN работают так хорошо, потому что у них есть серьёзные недостатки, от которых, по его мнению, «будет трудно избавиться».

Существующие проблемы свёрточных нейронных сетей:
— плохая трансляционная инвариантность и отсутствие информации о ориентации (CNN имеют проблемы при повороте объектов или при изменении условий освещения — чтобы как-то решить эти проблемы — применяется аугментация данных).
— сильная потеря информации на пулинге

Согласно Хинтону, психология восприятия формы предполагает, что человеческий мозг достигает трансляционной инвариантности намного лучше. Грубо говоря, мозг имеет два отдельных пути: «какой» и «где». Нейроны в пути «какой» реагируют на определенный тип раздражителя независимо от того, где он находится в поле зрения. Нейроны в пути «где» несут ответственность за кодирование, где это происходит.

Разница между мозгом и свёрточными сетями происходит на более высоких уровнях. Хинтон утверждает, что мозг имеет модули, которые он называет «капсулами» (Capsule), которые особенно хороши при обращении с различными видами визуального стимула и кодировании таких вещей, как поза.

Capsule Networks: An Improvement to Convolutional Networks

UPD 2017-11-02
Understanding the letter ‘a’
К проблемам CNN: Fooling Neural Networks in the Physical World with 3D Adversarial Objects

далее: Стрим про капсульные нейронные сети

Статьи
Dynamic Routing Between Capsules

Ссылки
Geoffrey Hinton on what’s wrong with CNNs

Нейронная сеть
Нейронная сеть — введение
Принцип обучения многослойной нейронной сети с помощью алгоритма обратного распространения
Пример работы самоорганизующейся инкрементной нейронной сети SOINN

Что такое Arduino? Зачем мне Arduino? Начало работы с Arduino Для начинающих ардуинщиков Радиодетали (точка входа для начинающих ардуинщиков) Первые шаги с Arduino

Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

если у вас черное окно попробуйте так. #include <opencv2/opencv.hpp> #include<iostream> #include <stdlib.h> #include <stdio.h> using namespace cv; using namespace std;…

Для Python 3.4: pip3 install tensorflow-1.1.0-cp34-cp34m-linux_armv7l.whl https://github.com/samjabrahams/tensorflow-on-raspberry-pi

PORTB = (PORTB & 0b11100111) | (i & 0b00000011); А почему Вы обнуляете биты 3 и 4, а заполняете биты…

RoboCraft

Что не так со свёрточными нейронными сетями?

Добавить комментарий Отменить ответ