МЕТОДЫ ПОВЫШЕНИЯ КАЧЕСТВА ИЗОБРАЖЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ

Захаров Р.К.
Самарский государственный аэрокосмический университет

Аннотация
В статье будут рассмотрены наиболее популярные методы, которые позволяют решить задачу повышения качества изображения.

Ключевые слова: гистограмма, распознавание


METHODS OF IMPROVING QUALITY OF IMAGES IN PATTERN RECOGNITION

Zaharov R.K.
Samara State Aerospace University

Abstract
This article describes the most popular methods to solve the problem of improving quality of images in pattern recognition

Рубрика: 05.00.00 ТЕХНИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Захаров Р.К. Методы повышения качества изображений в задачах распознавания // Современные научные исследования и инновации. 2012. № 8 [Электронный ресурс]. URL: https://web.snauka.ru/issues/2012/08/16488 (дата обращения: 18.04.2024).

Введение

Задача повышения качества изображения включает несколько подзадач, которые будут рассмотрены в статье это:

  • Улучшение качества изображения
  • Устранение шума в изображениях
  • Усиления полезной и подавления нежелательной (в контексте конкретной задачи) информации

В статье будут рассмотрены наиболее популярные методы, которые позволяют решить поставленные задачи перед нами. Данные алгоритмы и методы работают как часть предобработки изображений в системах компьютерного зрения, к примеру, в системах распознавания изображений, когда для работы алгоритма важно, что бы изображение поступало как можно более хорошего качества.

Гистограмма

Для анализа изображений можно использовать гистограммы яркости. Гистограммы строят как для цветных изображений по каждому из каналов, так и для изображений в оттенках серого. Гистограмма — это график распределения полутонов изображения, в котором по горизонтальной оси представлена яркость, а по вертикали— относительное число пикселов с данным значением яркости.

Алгоритм построения гистограммы

Строим массив, заполняем нулями. Обычно массив [0..255]

Цикл, для каждого пикселя:

Выделяем нужный цветовой канал или находим яркость по формуле. Пиксель -> значение

Полученное значение должно укладываться в диапазон индексов массива, например [0..255].

Увеличиваем значение элемента массив[значение] на 1.

Конец цикла.

Полученный массив и представляет собой гистограмму, элементы массива – означают высоты столбиков.

Ниже представлен рисунок и его гистограмма для каждого из каналов.

Рисунок

Гистограмма

Линейная коррекция

Линейную коррекцию можно задать следующей формулой


Изображение

Изображение после преобразования

Нелинейные коррекции

В нелинейной коррекции часто применяются

  • Гамма-коррекция
  • Логарифмическая коррекция

Гамма-коррекция

Изначально цель коррекции для правильного отображения на мониторе. Задаётся следующим выражением


Ниже представлены рисунки до и после обработки изображения с помощью гамма коррекции

Оригинальный рисунок

Обработанное изображение γ=0.4

Логарифмическая коррекция

Цель – сжатие динамического диапазона при визуализации данных. Задаётся следующим выражением


Ниже представлены рисунки до и после обработки с помощью логарифмической коррекции.

Оригинальное изображение

Обработанное изображение

Серый мир

На рисунках представлены изображения до и после обработки с помощью серого мира.

Оригинальное изображение

Изображение после обработки

Задаётся с помощью следующих соотношений. Пусть – это изображение, – это площадь этого изображение произведение длины на ширину. А его размер. Вычислим средний цвет для каждого из каналов и общий для всех каналов следующим образом:



И среднее значение по всем каналам будет следующим:

Далее значение каждого пикселя изменяется таким образом:


Бинаризация

Бинаризация изображение – построение изображение по полутоновому/цветному изображению, что бы фон отделялся от объектов на изображении, то есть всё изображение помечено, к примеру, 1 фон 0 не фон. Таким образом, задача бинаризации является простейшей задачей распознавания объекта на кадре с помощью бинарного классификатора (фон/не фон). Для бинаризации задаётся порог


Где Tпорог – это пороговое значение пикселей которое задаётся в зависимости от анализа гистограммы изображения, или отдельно подбирается для конкретной задачи. Приведём алгоритм адаптивной бинаризации изображения

Алгоритм адаптивной бинаризации изображения

Для каждого пикселя изображения

  1. В окрестности пикселя радиуса r высчитывается индивидуальный для данного пикселя порог T;
  2. Если , результат равен 1, иначе 0;

Данный алгоритм применяется в случае не равномерной яркости фона или объекта

Шум и шумоподавление

Причинами возникновения шума могут быть

  • Несовершенство приборов (фотоаппаратов, теле/видеокамер)
  • Обработка изображений с потерей данных

Виды шума

  1. Соль и перец – это случайные чёрные и белые пиксели
  2. Импульсный – это случайные белые пиксели
  3. Гауссов – это колебания яркости, распределённые по нормальному закону

Ниже представлены изображения с различным шумом

Оригинальное изображение

Соль и перец

Импульсный шум

Гауссов шум

Для устранения Гауссова шума применяется фильтр Гаусса.

Для устранения шума соль и перец и импульсного применяется медианный фильтр.

Retinex

Это метод выравнивания освещения на изображении. Идея заключается в следующем. Само изображение формируется как произведение низких и высоких частот, то есть самого освещения и объекта.
где l – это освещение, а r – это сам объект.

Алгоритм Single Scale Retinex (SSR)

Получить приближённую карту освещённости путём низкочастотной фильтрации

, где G – это фильтр Гаусса.

Восстановить изображение по формуле

Многомасштабный вариант алгоритма Retinex

Алгоритм Multi Scale Retinex (MSR)

Получить приближённую карту освещённости путём низкочастотной фильтрации

, где G – это фильтр Гаусса.

Восстановить изображение по формуле

изображение

Чаще всего выбирают три масштаба с равными весами wk, равными 1/3

Ниже приведены изображения до и после обработки методом Retinex.

Оригинальное изображение

Обработанное


Библиографический список
  1. Marcelo Bertalmío, Vicent Caselles, Edoardo Provenzi (2009) Issues About Retinex Theory and Contrast Enhancement. IJCV, Vol. 83, pages 101–119.
  2. Nigel W. Daw (17 November 1967). “Goldfish Retina: Organization for Simultaneous Colour Contrast”. Science 158 (3803): 942 4.doi:10.1126/science.158.3803.942PMID 6054169.
  3. G. A. Woodell, D. J. Jobson, Z. Rahman Scene Context Dependency of Pattern Constancy of Time Series Imagery Visual Information Processing XVII, Proc. SPIE 6978, (2008)
  4. Z. Rahman, D. J. Jobson, and G. A. Woodell, Retinex Processing for Automatic Image Enhancement, Journal of Electronic Imaging, January 2004.


Количество просмотров публикации: Please wait

Все статьи автора «ProgRoman»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться:
  • Регистрация