27. OpenCV шаг за шагом. Обработка изображения — детектор границ Кенни (Canny)

Оглавление
1. OpenCV шаг за шагом. Введение.
2. Установка.
3. Hello World.
4. Загрузка картинки.
…
25. Обработка изображения — свёртка
26. Обработка изображения — операторы Собеля и Лапласа
27. Обработка изображения — детектор границ Кенни (Canny)

Края(границы) — это такие кривые на изображении, вдоль которых происходит резкое изменение яркости или других видов неоднородностей.

Проще говоря, край — это резкий переход/изменение яркости.
Причины возникновения краёв:
* изменение освещенности
* изменение цвета
* изменение глубины сцены (ориентации поверхности)

Получается, что края отражают важные особенности изображения и поэтому, целями преобразования изображения в набор кривых являются:
* выделение существенных характеристик изображения
* сокращение объема информации для последующего анализа

Самым популярным методом выделения границ является детектор границ Кенни.

Хотя работа Кенни была проведена на заре компьютерного зрения (1986), детектор границ Кенни до сих пор является одним из лучших детекторов.

Шаги детектора:
— Убрать шум и лишние детали из изображения
— Рассчитать градиент изображения
— Сделать края тонкими (edge thinning)
— Связать края в контура (edge linking)

Детектор использует фильтр на основе первой производной от гауссианы. Так как он восприимчив к шумам, лучше не применять данный метод на необработанных изображения. Сначала, исходные изображения нужно свернуть с гауссовым фильтром.

Границы на изображении могут находиться в различных направлениях, поэтому алгоритм Кенни использует четыре фильтра для выявления горизонтальных, вертикальных и диагональных границ. Воспользовавшись оператором обнаружения границ (например, оператором Собеля) получается значение для первой производной в горизонтальном направлении (Gу) и вертикальном направлении (Gx).
Из этого градиента можно получить угол направления границы:

Q=arctan(Gx/Gy)

Угол направления границы округляется до одной из четырех углов, представляющих вертикаль, горизонталь и две диагонали (например, 0, 45, 90 и 135 градусов).
Затем идет проверка того, достигает ли величина градиента локального максимума в соответствующем направлении.

Например, для сетки 3×3:
* если угол направления градиента равен нулю, точка будет считаться границей, если её интенсивность больше чем у точки выше и ниже рассматриваемой точки,
* если угол направления градиента равен 90 градусам, точка будет считаться границей, если её интенсивность больше чем у точки слева и справа рассматриваемой точки,
* если угол направления градиента равен 135 градусам, точка будет считаться границей, если её интенсивность больше чем у точек находящихся в верхнем левом и нижнем правом углу от рассматриваемой точки
* если угол направления градиента равен 45 градусам, точка будет считаться границей, если её интенсивность больше чем у точек находящихся в верхнем правом и нижнем левом углу от рассматриваемой точки.

Таким образом, получается двоичное изображение, содержащее границы (т.н. «тонкие края»).

В OpenCV, детектор границ Кенни реализуется функцией cvCanny(), которая обрабатывает только одноканальные изображения.

CVAPI(void)  cvCanny( const CvArr* image, CvArr* edges, double threshold1,
                      double threshold2, int  aperture_size CV_DEFAULT(3) );

— выполнение алгоритма Canny для поиска границ

image — одноканальное изображение для обработки (градации серого)
edges — одноканальное изображение для хранения границ, найденных функцией
threshold1 — порог минимума
threshold2 — порог максимума
aperture_size — размер для оператора Собеля

//
// пример работы детектора границ Кенни - cvCanny()
//
// robocraft.ru
//

#include <cv.h>
#include <highgui.h>
#include <stdlib.h>
#include <stdio.h>

IplImage* image = 0;
IplImage* gray = 0;
IplImage* dst = 0;

int main(int argc, char* argv[])
{
	// имя картинки задаётся первым параметром
	char* filename = argc == 2 ? argv[1] : "Image0.jpg";
	// получаем картинку
	image = cvLoadImage(filename,1);

	printf("[i] image: %s\n", filename);
	assert( image != 0 );

	// создаём одноканальные картинки
	gray = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
	dst = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );

	// окно для отображения картинки
	cvNamedWindow("original",CV_WINDOW_AUTOSIZE);
	cvNamedWindow("gray",CV_WINDOW_AUTOSIZE);
	cvNamedWindow("cvCanny",CV_WINDOW_AUTOSIZE);

	// преобразуем в градации серого
	cvCvtColor(image, gray, CV_RGB2GRAY);

	// получаем границы
	cvCanny(gray, dst, 10, 100, 3);

	// показываем картинки
	cvShowImage("original",image);
	cvShowImage("gray",gray);
	cvShowImage("cvCanny", dst );

	// ждём нажатия клавиши
	cvWaitKey(0);

	// освобождаем ресурсы
	cvReleaseImage(&image);
	cvReleaseImage(&gray);
	cvReleaseImage(&dst);
	// удаляем окна
	cvDestroyAllWindows();
	return 0;
}

скачать иcходник (27-cvCanny.cpp)

Обратите внимание, как меняется картина, если увеличить размер оператора Собеля:
вот результат работы функции

cvCanny(gray, dst, 10, 100, 5);

И в качестве бонуса 🙂
Вот какой прикольный эффект можно получить, если найденные контуры вычесть из изображения.

Выглядит, как комикс 🙂

Для вычитания используем функцию cvSub():

cvSub — поэлементрная разница между двумя массивами
cvSubS — разница между элементами массива и скаляром
cvSubRS — разница между скаляром и элементами массива

CVAPI(void)  cvSub( const CvArr* src1, const CvArr* src2, CvArr* dst,
                    const CvArr* mask CV_DEFAULT(NULL));

— поэлементрная разница между двумя массивами:
dst(mask) = src1(mask) — src2(mask)
src1 — первый исходный массив
src2 — второй исходный массив
dst — целевой массив
mask — маска (8-битный однаканальный массив, указывающий какие элементы целефого массива могут быть изменены)

функция вычитает один массив из другого по формуле:

dst(I)=src1(I)-src2(I) if mask(I)!=0

массивы должны быть одного типа (кроме маски) и одинакового размера (или ROI).

//
// Прикольный эффект с использованием детектора Кенни:
// находятся контуры и вычитаются из изображения
//
// robocraft.ru
//

#include <cv.h>
#include <highgui.h>
#include <stdlib.h>
#include <stdio.h>

int main(int argc, char* argv[])
{
	IplImage *src=0, *dst=0, *dst2=0;

	// имя картинки задаётся первым параметром
	char* filename = argc >= 2 ? argv[1] : "Image0.jpg";
	// получаем картинку в градациях серого
	src = cvLoadImage(filename, 0);

	printf("[i] image: %s\n", filename);
	assert( src != 0 );

	// покажем изображение
	cvNamedWindow( "original", 1 );
	cvShowImage( "original", src );

	// получим бинарное изображение
	dst2 = cvCreateImage( cvSize(src->width, src->height), IPL_DEPTH_8U, 1);
	cvCanny(src, dst2, 50, 200);

	cvNamedWindow( "bin", 1 );
	cvShowImage( "bin", dst2);

	//cvScale(src, dst);
	cvSub(src, dst2, dst2);
	cvNamedWindow( "sub", 1 );
	cvShowImage( "sub", dst2);


	// ждём нажатия клавиши
	cvWaitKey(0);

	// освобождаем ресурсы
	cvReleaseImage(&src);
	cvReleaseImage(&dst);
	cvReleaseImage(&dst2);
	// удаляем окна
	cvDestroyAllWindows();
	return 0;
}

Ещё вариации функции вычитания cvSubS и cvSubRS:

/* dst(mask) = src(mask) - value = src(mask) + (-value) */
CV_INLINE  void  cvSubS( const CvArr* src, CvScalar value, CvArr* dst,
                         const CvArr* mask CV_DEFAULT(NULL))
{
    cvAddS( src, cvScalar( -value.val[0], -value.val[1], -value.val[2], -value.val[3]),
            dst, mask );
}

— разница между элементами массива и скаляром

/* dst(mask) = value - src(mask) */
CVAPI(void)  cvSubRS( const CvArr* src, CvScalar value, CvArr* dst,
                      const CvArr* mask CV_DEFAULT(NULL));

— разница между скаляром и элементами массива
src — первый исходный массив
value — скаляр из которого производится вычитание
dst — целевой массив
mask — маска (8-битный однаканальный массив, указывающий какие элементы целефого массива могут быть изменены)

функция вычитает каждый элемент массива из скаляра:

dst(I)=value-src(I) if mask(I)!=0

массивы должны быть одного типа (кроме маски) и одинакового размера (или ROI).

Получающиеся картинки мне очень понравились и я на скорую руку набросал сервис Генератора комиксов 🙂

примеры его работы можно посмотреть здесь:

например, вот пример работы Генератора:

Далее: 28. Преобразование Хафа

Ссылки
http://en.wikipedia.org/wiki/Canny_edge_detector
http://ru.wikipedia.org/wiki/Выделение_границ
Оригинальная статья: JOHN CANNY, A Computational Approach to Edge Detection
И.М.Журавель «Краткий курс теории обработки изображений»: Границы изображений: Края и их обнаружение

Дополнительно:
Deriche edge detector

cvCanny, cvSub, cvSubRS, cvSubS, OpenCV, шаг за шагом

1 апреля, 2011

noonv

Компьютерное зрение

28 комментариев на «“27. OpenCV шаг за шагом. Обработка изображения — детектор границ Кенни (Canny)”»

Romiks:

2011-04-01 в 19:26

чтобы получить цветное изображение, я так понимаю нужно разбить исходное на три ч/б, выполнить поиск границ, затем вычитание, а затем опять слить их в одно да?

Войдите, чтобы ответить
- noonv:
  
  2011-04-01 в 19:27
  
  точно так 🙂
- Romiks:
  
  2011-04-01 в 19:29
  
  ок, надо попробовать в реальном времени, наверно прикольно получится
Romiks:

2011-04-02 в 15:24

сделал, но получилось не совсем так, какие значения для cvCanny использовали???
и у меня контуры цветные а не чёрные получились

Войдите, чтобы ответить
- noonv:
  
  2011-04-02 в 16:29
  
  экспериментируйте 🙂 но если вы хотите повторить Генератор комиксов, то там ещё применена сегментация 😉
Romiks:

2011-04-02 в 16:29

ок, ща ползунки прикручу

Войдите, чтобы ответить
Romiks:

2011-04-02 в 16:34

9 глава, Mean-shift segmentation, да???

Войдите, чтобы ответить
- noonv:
  
  2011-04-02 в 16:47
  
  угу — cvPyrMeanShiftFiltering(), но обратите внимание, что в версии 2.1 в реализации этой функции есть ошибка. Впрочем, у меня она нормально работала в Release-версиях программы.
  Можете погуглить и найти, как пофиксить эту ошибку, а затем пересобрать библиотеку, или же использовать версию 2.2, где эта ошибка исправлена.
- Romiks:
  
  2011-04-02 в 17:01
  
  ошибка заключается в исключении, которое происходит непонятно почему?
Romiks:

2011-04-02 в 18:15

поставил 2.2, теперь даже не компилится, cvCanny ваще нет, Canny принимает не IplImage а Mat, как перейти на 2.2, теперь вместо IplImage Mat писать чтоли???

Войдите, чтобы ответить
- noonv:
  
  2011-04-02 в 18:17
  
  у меня таких проблем не возникало 🙂
Romiks:

2011-04-02 в 18:29

нашёл! она в legacy лежит, только теперь камера на ноуте не работает, а на компе всё норм вроде

Войдите, чтобы ответить
Romiks:

2011-04-03 в 09:09

всё, работает! только ужасно медленно, примерно 1 кадр в 5-10 секунд, нельзя ли как-нить ускорить сегментацию?

Войдите, чтобы ответить
- noonv:
  
  2011-04-03 в 10:01
  
  если сможете это сделать — расскажите :))
- Romiks:
  
  2011-04-03 в 12:15
  
  ??
Romiks:

2011-04-03 в 10:37

применил вместо cvPyrMeanShiftFiltering cvPyrSegmentation, результат неплохой, примерно кадр в секунду
только всёравно линии цветные а не чёрные как у вас, может вы ещё чего добавили?

Войдите, чтобы ответить

И меня интересуют линии эти черные) хоть ты тресни, но разноцветными получаются. Колдунство какое-то)

у меня нормально получилось как в статье. Правда я на c# пишу. Предоставляю код, может он подскажет вам как изменить ваш алгоритм:

            var filename = "cat1.jpg";
            using (var image = Cv.LoadImage(filename)) {
                CvWindow w = null;
                CvWindow gray = null;
                CvWindow canny = null;
                CvWindow comix = null;
                IplImage grayImg = null;
                IplImage cannyImg = null;
                IplImage comixImg = null;
                var imgColors = new List<IplImage>();
                try {
                    w = new CvWindow("границы Кенни - Оригинал");
                    gray = new CvWindow("границы Кенни - Серость");
                    canny = new CvWindow("границы Кенни - Кенни");
                    comix = new CvWindow("границы Кенни - границы на оригинале");
                    grayImg = new IplImage(image.Size, BitDepth.U8, 1);
                    cannyImg = new IplImage(image.Size, BitDepth.U8, 1);
                    comixImg = new IplImage(image.Size, BitDepth.U8, 3);

                    image.CvtColor(grayImg, ColorConversion.RgbToGray);
                    grayImg.Canny(cannyImg, 10, 100, ApertureSize.Size3);

                    for (var i = 0; i < 3; i++) {
                        imgColors.Add(new IplImage(image.Size, BitDepth.U8, 1));
                    }
                    image.Split(imgColors[0], imgColors[1], imgColors[2], null);
                    for (var i = 0; i < 3; i++) {
                        imgColors[i].Sub(cannyImg, imgColors[i]);
                    }
                    comixImg.Merge(imgColors[0], imgColors[1], imgColors[2], null);

                    w.ShowImage(image);
                    gray.ShowImage(grayImg);
                    canny.ShowImage(cannyImg);
                    comix.ShowImage(comixImg);

                    Cv.WaitKey(0);
                } finally {
                    w?.Dispose();
                    gray?.Dispose();
                    canny?.Dispose();
                    comix?.Dispose();
                    grayImg?.Dispose();
                    cannyImg?.Dispose();
                    comixImg?.Dispose();
                    foreach (var img in imgColors) {
                        img?.Dispose();
                    }
                }
            }

Yuliia_Dziuba:

2018-12-02 в 23:35

Автор noonv, добрый день. Я только знакомлюсь с OpenCV и у меня стоит задание распознать сколько на рисунке кругов и сколько прямоугольников. Хочу написать эту программу в VisualStudio2017 с использованием библиотеки OpenCv 2014 или 2015. Буду очень благодарна, если Вы подскажите, какие настройки нужно сделать, чтобы все Ваши программы на стирание контуров и т. д. заработали у меня в Вижуал.

Войдите, чтобы ответить
- noonv:
  
  2018-12-03 в 08:35
  
  Привет! Думаю, сейчас стоит использовать С++ интерфейс библиотеки OpenCV.
  Пример: Finding contours in your image
Yuliia_Dziuba:

2018-12-03 в 11:01

Спасибо. А как Вы порекомендуете дальше писать эту программу? Если у Вас есть идеи готова заплатить.

Войдите, чтобы ответить
- noonv:
  
  2018-12-03 в 11:11
  
  OpenCV shape detection
Yuliia_Dziuba:

2018-12-07 в 19:47

Спасибо за ссылку. Но мне нужно посчитать сколько на рисунке четырехугольников и сколько кругов. https://docs.google.com/document/d/1K1iiHKvLjuecAPoV9d0wrVAdIjfk6tNTG8Y7bktIgqQ/edit Может, у Вас получится что-то подобрать к этому заданию? Буду очень очень благодарна!)))

Войдите, чтобы ответить
Romiks:

2011-04-02 в 18:50
почему вот это не работет:
```
VideoCapture cap("0");

if(!cap.isOpened()) {
	cout << "Can't create camera capture, check your camera!";
	_getch();
	return 1;
}

namedWindow("Original video");

while(1)
{
	Mat img;
	cap >> img;

	imshow("Original video", img);

	if(waitKey(33) >= 0)
		break;
}
```
сразу же вылетает «Access violation», а по старому либо ваще не работает либо чёрный экран
Войдите, чтобы ответить
r2d2:

2016-08-12 в 08:26
У меня переделанный пример с cvQueryFrame выдает ошибку:
```
frame1 = cvQueryFrame( capture );
frame = cvCreateImage( cvSize(frame1->width, frame1->height), IPL_DEPTH_8U, 1);
cvCvtColor(frame1, frame, CV_RGB2GRAY);
cvCanny(frame, frame2, 10, 100, 3);
cvShowImage("capture", frame2);
```
Необработанное исключение в «0x766eb727» в «cv1.exe»: Исключение Microsoft C++: cv::Exception по адресу 0x0015e71c…

А с cvLoadImage без проблем. Как сделать сделать правильно манипуляции с захваченным видео на лету?
Войдите, чтобы ответить

Спасибо за статью. Если определять контуры по исходному изображению, то видно много шумовых контуров. Сначала наеобходимо убрать шум из мелких деталей, те немного размыть изображение и определить контуры, потом еще немного размыть. Предлагаю готовый код. Что вам мешает найти контуры на изображениии комиксов?

// contours.cpp: определяет точку входа для консольного приложения.
//

#include "stdafx.h"


#include <cv.h>
#include <highgui.h>
#include <stdlib.h>
#include <stdio.h>

IplImage* image = 0;
IplImage* gray = 0;
IplImage* dst1 = 0; IplImage* dst2 = 0; IplImage* dst3 = 0;
IplImage* smgray2 = 0;
IplImage* smgray3 = 0;
int main(int argc, char* argv[])
{
        // имя картинки задаётся первым параметром
        char* filename = argc == 2 ? argv[1] : "lena.jpg";
        // получаем картинку
        image = cvLoadImage(filename,1);

        printf("[i] image: %s\n", filename);
        assert( image != 0 );

        // создаём одноканальные картинки
        gray = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
		smgray2 = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
		smgray3 = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
        dst1 = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
		dst2 = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );
		dst3 = cvCreateImage( cvGetSize(image), IPL_DEPTH_8U, 1 );

        // окно для отображения картинки
        cvNamedWindow("original",CV_WINDOW_AUTOSIZE);
        cvNamedWindow("gray",CV_WINDOW_AUTOSIZE);
		cvNamedWindow("smoothgray1",CV_WINDOW_AUTOSIZE);
		cvNamedWindow("smoothgray2",CV_WINDOW_AUTOSIZE);
        cvNamedWindow("cvCanny1",CV_WINDOW_AUTOSIZE);
		cvNamedWindow("cvCanny2",CV_WINDOW_AUTOSIZE);
		cvNamedWindow("cvCanny3",CV_WINDOW_AUTOSIZE);


        // преобразуем в градации серого
        cvCvtColor(image, gray, CV_RGB2GRAY);
		// получаем границы
		cvCanny(gray, dst1, 10, 100, 3);

		// размываем изображение
		cvSmooth(gray, smgray2, CV_GAUSSIAN, 5, 5);
		// получаем границы
		cvCanny(smgray2, dst2, 10, 100, 3);

		// еще раз размываем изображение
		cvSmooth(smgray2, smgray3, CV_GAUSSIAN, 3, 3);
		// получаем границы
        cvCanny(smgray3, dst3, 10, 100, 3);

        // показываем картинки
        cvShowImage("original",image);
        cvShowImage("gray",gray);
		cvShowImage("cvCanny1", dst1 );

		cvShowImage("smoothgray2",smgray2);
		cvShowImage("cvCanny2", dst2 );

		cvShowImage("smoothgray3",smgray3);
        cvShowImage("cvCanny3", dst3 );

        // ждём нажатия клавиши
        cvWaitKey(0);

        // освобождаем ресурсы
        cvReleaseImage(&image);
        cvReleaseImage(&gray);
		cvReleaseImage(&smgray3);
		cvReleaseImage(&smgray2);
        cvReleaseImage(&dst1);
		cvReleaseImage(&dst2);
		cvReleaseImage(&dst3);

        // удаляем окна
        cvDestroyAllWindows();
        return 0;
}

tester:

2016-11-04 в 07:48

Еще лучше размывать изображение и увеличивать контрастность в несколько итераций.

Лучший результат позволяет получить следующий код:

//Нижегородский государственный университет им. Н.И. Лобачевского
//Факультет вычислительной математики и кибернетики
//Учебный курс «Разработка мультимедийных приложений
//с использованием библиотек OpenCV и IPP», Lec06_OpenCV_text.pdf

#include "stdafx.h"

#include <cv.h>
#include <highgui.h>
#include <stdlib.h>
#include <stdio.h>

using namespace cv;

int main(int argc, char** argv)
{
Mat img, gray, edges; // Объявление матриц

char* filename = argc == 2 ? argv[1] : "lena.jpg";
// имя картинки задаётся первым параметром

//img = imread(filename, 1); // не работает
img = cvLoadImage(filename,1);// Читаем изображение
// получаем картинку

imshow("original", img);
// Отрисовываем изображение

cvtColor(img, gray, CV_RGB2GRAY);
// Конвертируем в монохромный формат

GaussianBlur(gray, gray, Size(7, 7), 1.5);
// Устраняем размытие

imshow("gray", gray);
// Отрисовываем изображение

Canny(gray, edges, 0, 50);
// Запускаем детектор ребер

imshow("edges", edges);
// Отрисовываем изображение

waitKey();
//Ожидаем нажатия клавиши
return 0;
}

Добавить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

если у вас черное окно попробуйте так. #include <opencv2/opencv.hpp> #include<iostream> #include <stdlib.h> #include <stdio.h> using namespace cv; using namespace std;…

Для Python 3.4: pip3 install tensorflow-1.1.0-cp34-cp34m-linux_armv7l.whl https://github.com/samjabrahams/tensorflow-on-raspberry-pi

PORTB = (PORTB & 0b11100111) | (i & 0b00000011); А почему Вы обнуляете биты 3 и 4, а заполняете биты…