УДК 528.854.4

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ЦЕЛЕЙ АНАЛИЗА ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ

Зарубин Олег Александрович
Федеральное государственное бюджетное образовательное учреждение высшего образования «Национальный исследовательский Мордовский государственный университет им. Н. П. Огарёва»
аспирант кафедры землеустройства и ландшафтного планирования

Аннотация
Статья посвящена вопросам использования нейронных сетей для решения задач анализа данных дистанционного зондирования Земли. Рассмотрены этапы реализации нейросетевого метода в программном комплексе ScanEx Image Processor на примере картографирования научно-исследовательского полигона (НИП) «Новое Мамангино» на базе многозональных космических снимков спутника Landsat-8.

Ключевые слова: автоматизированное дешифрирование, архитектура нейронной сети, данные дистанционного зондирования Земли, ландшафтно-экологическая система, многозональные космические снимки, нейронные сети, обучение, пиксель


THE USE OF NEURAL NETWORKS FOR ANALYSIS REMOTE SENSING DATA

Zarubin Oleg Aleksandrovich
Federal State Budgetary Educational Institution of Higher Education «National Research Ogarev Mordovia State University»
postgraduate student at Department of land management and landscape planning chair

Abstract
The article is devoted to the use of neural networks for analysis remote sensing data. The stages of implementation of neural network method are considered in the software package ScanEx Image Processor the example of mapping research polygon (NIP) «New Mamangino» on the basis of multispectral satellite imagery satellite Landsat-8.

Keywords: architecture of the neural network, automated interpretation multispectral satellite images, data of remote sensing, landscape and ecological system, learning, neural networks, pixel


Рубрика: 11.00.00 ГЕОГРАФИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Зарубин О.А. Применение нейронных сетей для целей анализа данных дистанционного зондирования Земли // Современные научные исследования и инновации. 2016. № 8 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2016/08/70887 (дата обращения: 29.09.2017).

На современном этапе развития науки и техники ключевым источником информации, наряду с полевыми и стационарными исследованиями, являются данные дистанционного зондирования Земли (ДЗЗ). Синтетическая природа, заложенная в космических снимках, позволяет использовать их для решения практико-ориентированных задач в строительстве, сельском хозяйстве, лесном хозяйстве, территориальном планировании и т. д., направленных на анализ ландшафтно-экологических систем с целью оптимальной пространственной организации территории [1-3].

Материалы и методика исследований 

Космический снимок представляет собой зарегистрированное определенным видом сенсоров электромагнитное излучение. В качестве территориального носителя информации выступает пиксель – неделимый наименьший элемент двумерного изображения, характеризующийся яркостью – способностью участка земной поверхности отражать или поглощать свет определенной длины волны.

Наиболее перспективным для решения географических, экологических, технических задач являются многозональные космические снимки высокого разрешения, в пиксельной совокупности которых содержатся отражательные свойства природных и антропогенных объектов.

На сегодняшний день существует целый ряд сервисов (спутников и их сенсоров), представляющих космические снимки с разным разрешением, периодичностью, количеством спектральных каналов. Среди наиболее успешных проектов отмечаем данные ДЗЗ, получаемые со спутников SPOT, IKONOS, QuickBird, Landsat, TERRA (платформа ASTER) и другие.

В качестве ресурса данных ДЗЗ в исследовании нами был выбран комплекс Landsat – старейший проект по получению космофотоснимков. В настоящее время на орбите Земли действуют спутники Landsat-7 (сенсор ETM+) и Landsat-8 (сенсоры OLI и TIRS). Пространственное разрешение основных каналов соответствует 30 м длины стороны пикселя, что позволяет позиционировать их как снимки высокого разрешения. Сравнение спектральных диапазонов приведено в таблице 1.

Однако отдельно взятый канал представляет крайне ограниченную вариацию действий по интерпретации свойств ландшафтно-экологических систем. Специфика применения космофотоснимков заключается в возможности комбинирования каналов, помещая их в красную (R), зеленую (G) и синюю (B) позиции. Таким образом, каждый канал представляет интерес для решения тематических прикладных задач, но синтетическую информацию о ландшафтно-экологических системах можно получить только в рамках комбинирования каналов при комплексном дешифрировании.

Таблица 2 – Спектральные каналы сенсоров ETM+ спутника Landsat-7 и OLI/TIRS спутника Landsat-8 (по данным NASA и геологической службы США [4], методических разработок James W. Quinn [5])

Спектральные характеристики

Применение в ландшафтно-экологических исследованиях некоторых комбинаций каналов

Каналы ETM+ (Landsat-7)

Каналы OLI/TIRS  (Landsat-8)

ETM+

OLI

Область применения

Название

Длина волны, мкм

Разрешение (размер на 1 пиксель), м

Название

Длина волны, мкм

Разрешение (размер на 1 пиксель), м

-

Канал 1 – Побережья и аэрозоли 0,433–0,453 30 4-3-2 5-4-3 Изучения состояния растительного покрова, почвенного покрова, с/х культур
Канал 1 – Синий 0,450–0,515 30 Канал 2 – Синий 0,450–0,515 30 3-2-1 4-3-2 Комбинация «естественные цвета». Применяется для визуального дешифрирования природных и антропогенных объектов
Канал 2 – Зеленый 0,525–0,605 30 Канал 3 – Зеленый 0,525–0,600 30 7-4- 2 7-5-3 Изучение состояния и динамики пирогенных ландшафтов
Канал 3 – Красный 0,630–0,690 30 Канал 4 – Красный 0,630–0,680 30 7-5-4 7-6-5 Картографирование почвенного покрова
Канал 4 – Ближний ИК 0,775–0,900 30 Канал 5 – Ближний ИК 0,845–0,885 30 4-5-3 5-6-4 Изучение влажностных характеристик  почв и растительного покрова, детектирование водных объектов
Канал 5 – Средний ИК 1 1,550–1,750 30 Канал 6 – Ближний ИК 1,560–1,660 30 5-4-3 6-5-4 Картографирование лесных сообществ с возможностью детектирования породового состава
Канал 7 – Средний ИК 2 2,090–2,350 30 Канал 7 – Ближний ИК 2,100–2,300 30 7-5-3 7-6-4 Мониторинг лесных пожаров и подтопления территории
Канал 8 – Панхроматический 0,520–0,900 15 Канал 8 – Панхроматический 0,500–0,680 15

-

Канал 9 – Перистые облака 1,360–1,390 30
Канал 6 – Дальний ИК 10,00 – 12,50 60 Канал 10 – Дальний ИК 10,30–11,30 100

-

Канал 11 – Дальний ИК 11,50–12,50 100

Развитие программно-аппаратных комплексов и вычислительных алгоритмов сделало возможным развитие автоматизированного дешифрирования, основанного на применении компьютерных технологий.

Потребность в совершенствовании методов автоматизированной классификации данных ДЗЗ и развитие соответствующих методов, основанное на качественном изменении программных средств и вычислительных устройств, делают возможным применение сложных математических алгоритмов для решения географических задач. Так, в Мордовском университете на базе тестовых научно-исследовательских полигонов (НИП) апробированы методики вычисления и оценки ландшафтного разнообразия [6, 7], выделения границ ландшафтов [8] и другие.

Использование монохромных изображений или космических снимков в естественных цветах предоставляет ограниченное количество информации. Гораздо более ценным ресурсом является визуальный и автоматизированный анализ комбинаций спектральных каналов. На современном этапе для анализа и интерпретации радиометрически и геометрически скорректированных данных, представленных в картографической проекции, используется ряд программных комплексов: ERDAS IMAGINE, ScanEx Image Processor, ENVI, ER Mapper и другие. Некоторые возможности заложены в неспециализированных на дешифрировании ГИС и их модулях, например, в ArcView и ArcGis.

В рамках данного исследования в качестве программного продукта для анализа многоканальных снимков нами выбран ScanEx Image Processor, разработанный группой компаний «СКАНЭКС».

Ключевым инструментом любого программного обеспечения для автоматизированной обработки космических снимков являются алгоритмы компьютерного дешифрирования, основанные на спектральных признаках, характеризующих пиксели. Конечная задача сводится к их классификации в определенное количество групп. В комплексе ScanEx Image Processor представлены:

- Классификация без обучения (кластеризация с помощью метода ISODATA);

- Классификация с обучением. При данном типе пиксели снимка объединяются в группы на основе сравнения их яркостей с эталонными значениями. В ScanEx Image Processor представлен ряд инструментов: классификация с помощью метода деревьев, бинарная классификация, классификация с помощью нейронных сетей и другие.

Перспективным методом интеллектуальной интерпретации информации данных ДЗЗ являются нейронные сети [9, 10 и др.], что связано с возможностью их обучения, выбора топологии построения и минимизацией влияния «шума» в структуре многозонального снимка.

В основе работы нейронной сети, представленной системой взаимосвязанных простых процессоров, заложен принцип функционирования человеческой нервной системы. Нейроны нейронной сети сгруппированы в слои так, что выходной сигнал предыдущего слоя подается на входы всех нейронов последующего.

Для классификации данных ДЗЗ в программе ScanEx Image Processor с применением нейросетевого метода необходимо решить ряд взаимосвязанных задач.

1. Определение входных данных. В зависимости от решаемой проблемно-ориентированной задачи исходные данные могут быть представлены многозональными, гиперспектральными космическими снимками различного пространственного и временного разрешения. Для целей ландшафтного картографирования необходимо определить канал многозонального снимка для каждого входного нейрона в позициях R, G и B. При этом исключительную важность представляет комбинация каналов, позволяющая наиболее четко выделять те или иные компоненты ландшафтно-экологических систем.

2. Определение выходных данных. Количество выходных узлов нейронной сети зависит от предполагаемого результата классификации, т.е. количества структурных подразделений ландшафтов картографируемой территории.

3. Задание источника меток. Источник меток определяет эталоны для обучения нейронной сети. Программный комплекс позволяет использовать в качестве них растровые или векторные слои (слой с атрибутами).

4. Выбор параметров обучения. В ScanEx Image Processor основными параметрами являются: максимальная ошибка (задает среднеквадратическую ошибку, при достижении которой сеть считается обученной), максимальное число эпох (циклов использования всех входных нейронов), эпсилон (скорость обучения), ошибка выборки (параметр задает последовательный ряд пикселей, при которых выполняется перекрестная проверка качества обучения сети).

5. Выбор архитектуры нейронной сети. В вопросе выбора архитектуры нейронной сети важно выделить два направления. Во-первых, определение связей между слоями нейронов, которые могут быть прямыми и обратными. Нейронные сети прямого распределения, являющиеся наиболее перспективными для решения задач картографирования ландшафтно-экологических систем [9], носят однонаправленный характер, при этом их точность зависит от числа нейронов.

Второе направление, решаемое в задаче определения архитектуры сети, связано с определением количества так называемых «скрытых» слоев и числа их нейронов. В используемом программном обеспечении возможен сценарий с применением от 0 до 2 скрытых слоев, однако при проведении аналогичных экспериментов другими авторами [9] доказана целесообразность использования одного скрытого слоя.

Подбор числа нейронов в «скрытом слое» может быть осуществлен расчетным путем, однако формализованный подход необходимо проверять эмпирически. Основным методом определения числа нейронов является геометрическое правило пирамиды [9], вычисляемое по формуле:

где  k – число нейронов в «скрытом слое»;

n – число нейронов во входном слое;

m – число нейронов в выходном слое.

6. Обучение нейронной сети и классификация данных ДЗЗ. Обучение сети происходит с помощью введения в программу исходных растров (входных каналов), источника меток, топологии нейронной сети и параметров обучения. Оптимальным является применение «обучения с учителем», при котором типам ландшафтно-экологических систем задаются участки космического снимка со сходными спектральными характеристиками. Результатом процесса обучения является обученная нейронная сеть, которая сохраняется в файле и используется для последующей классификации космического снимка.

Для целей отработки картографирования ландшафтно-экологических систем с применением нейронных сетей прямого распределения нами выбран научно-исследовательский полигон (НИП) «Новое Мамангино» (рисунок 1), получивший название по одноименному населенному пункту на его территории. Полигон расположен в западной части Мордовии, в Ковылкинском и Краснослободском районах. Наиболее крупные населенные пункты – с. Новое Мамангино, с. Мамолаево, с. Самозлейка, с. Старая Рябка.

Рисунок 1. НИП «Новое Мамангино» на космическом снимке Landsat-8

Ландшафтно-экологические системы полигона детально изучены учеными Мордовского университета, сотрудниками профильных министерств и ведомств в рамках проведения геоэкологического анализа территории для целей строительства Мордовской ГРЭС. Приведем основные положения.

Геологическая среда тестового НИП формируется каменноугольными, юрскими, меловыми и четвертичными отложениями, перекрываемыми четвертичными породами мощностью до 25 м – моренными суглинками и водно-ледниковыми песками [11].

Долина р. Мокши – основного водотока полигона – имеет ширину около 20 км и характеризуется резко выраженным асимметричным строением с левым крутым коренным берегом и пологий с тремя надпойменными террасами правый. Ширина поймы от 3 до 5 км. По характеру морфологического строения она подразделяется на прирусловую, центральную и притеррасовую.

К востоку от долины Мокши простирается водно-ледниковая равнина, абсолютные отметки которой доходят до 200 м. Ее краевая часть сильно рассе-чена линейно вытянутыми эрозионными формами рельефа. По левому берегу Мокши протягивается левый коренной борт долины высотой 80–90 м, характеризующийся значительной крутизной и пересеченным рельефом.

В почвенном покрове территории полигона преобладают дерново-подзолистые, серые лесные, аллювиально-дерновые, аллювиально-болотные и торфяно-болотные почвы.

Полигон расположен на границе лесостепных комплексов, широколист-венных и смешанных лесов. Сосняки – наиболее распространенная формация – доминируют по надпойменным террасам. Широколиственные леса, представленные дубом, липой, кленом остролистным, ясенем и вязом, распространены преимущественно на аллювиально-водно-ледниковой и вторичной моренной равнине. Значительное распространение имеют вторичные и производные мелколиственные леса [11].

В морфологической структуре ландшафтов А. А. Ямашкин [11] выделил следующие геокомплексы (рисунок 2): местность водно-ледниковой (зандровой) равнины (В); местность аллювиально-водно-ледниковой равнины (Г цифрами обозначены урочища); местность надпойменных террас (Д, цифрами обозначены урочища); природные территориальные комплексы овражно-лощинно-балочной сети (Е, цифрами обозначены урочища); природные территориальные комплексы котловин, западин, понижений (Ж, цифрами обозначены урочища); местность поймы (З, цифрами обозначены урочища).

Результаты и их обсуждение

Первостепенной задачей для картографирования территории тестового полигона является определение входных и выходных нейронов – каналов съемки. Очевидно, что перспективными для автоматизированного дешифрирования являются комбинации каналов, при которых оптимальны яркостные характеристики физиономичных признаков – растительности, открытых участков почв или водных поверхностей. Этим критериям подходит комбинация каналов Landsat-8 6-5-4. Однако в ходе аналогичных исследований тестового НИП «Смольный» учеными Мордовского университета [9] были апробированы каналы 2, 3 и 4-й спутника Landsat-7, которым соответствует комбинация 3-4-5 Landsat-8. Целесообразным видится проведение экспериментов с целью выявления оптимальной комбинации.

Выходные нейроны представлены классами земной поверхности. Зададим слой из 7 нейронов: хвойная растительность, широколиственная растительность, мелколиственная растительность, луговая растительность, водные поверхности, с/х модификации, селитебные ландшафты.

Рисунок 2. Ландшафтная карта НИП «Новое Мамангино» [11] 

Начальное количество нейронов в «скрытом слое» было определено в рамках геометрического правила пирамиды, т. е. равно 6. Для целей уточнения результатов и тестирования метода проведены эксперименты с 4, 5, 7, 8 и 15 нейронами. Результаты показаны на рисунках 3 и 4.

При количестве нейронов в «скрытом слое» равном трем результат классификации имеет большие погрешности при сопоставлении с данными полевых исследований и космическими снимками в естественных цветах более высокого разрешения. Тонкий слой при входных нейронах, представленный каналами 3-4-5, позволяет уверенно лишь отделять луговые комплексы от лесной растительности, при этом хвойные, мелколиственные и смешанные формации не выделяются. Не выделены водные комплексы и селитебные ландшафты. Велика доля не классифицированных пикселей, что свидетельствует о недообучении нейронной сети. При синтезе входных каналов 6-5-4 результат значительно лучше: лесная растительность дифференцирована по породовому составу, выделены водные объекты, сеть имеет гораздо меньше признаков недообучения.

Резкое увеличение количества нейронов в «скрытом слое» до 15 для первого варианта синтеза каналов ведет к переобучению сети, что сказывается на выделении селитебных ландшафтов, в класс которых ошибочно попадают некоторые с/х угодья, сходные по спектральным характеристикам с населенными пунктами.

Рисунок 3. Результат классификации территории тестового НИП  «Новое Мамангино» с помощью нейронной сети прямого распределения (каналы 3-4-5)

Рисунок 4. Результат классификации территории тестового НИП «Новое  Мамангино» с помощью нейронной сети прямого распределения (каналы 6-5-4)

Признаки переобучения характерны и для синтеза 6-5-4. Несмотря на то, что селитебные территории интерпретированы наиболее строго, в класс селитьбы классифицированы краевые части с/х ландшафтов и геокомплексов с луговой растительностью.

Для второй комбинации входных каналов наилучшие показатели классификации показала нейронная сеть прямого распределения с числом нейронов, рассчитанных на основе геометрического правила пирамиды. При 6 нейронах в «скрытом слое» наиболее точно из всех вариантов эксперимента выделены урочища, в растительном покрове которого преобладает хвойная растительность. Строго классифицировались геокомплексы с доминантными кустарниковыми фитоценозами. Однако не выделенными остались селитебные ландшафты сельских населенных пунктов тестового полигона. Для первой комбинации каналов наиболее оптимальной является величина «скрытого слоя», увеличенная на один нейрон. Но ошибки по всем классифицируемым классам больше, чем у второй комбинации.

Выводы

На основании проведенных экспериментов можно сделать ряд выводов.

Во-первых, классификация космического снимка зависит от характера входных каналов. В зависимости от характера подстилающей поверхности территории необходимо использовать ту комбинацию каналов, которая наиболее подробно отражает свойства физиономичных дешифровочных признаков. Из двух сочетаний каналов, ориентированных на изучение состояния растительного покрова, обобщенный лучший результат показала комбинация 6-5-4.

Во-вторых, успешность классификации зависит от архитектуры нейронной сети, т.е. от количества нейронов в «скрытом слое». Расчетная модель подбора их количества (использование геометрического правила пирамиды) не всегда дает наилучший результат, однако количество нейронов, подобранное таким путем может служить ориентиром для эмпирического подбора, т. к. размер слоя, сильно отличающийся от формализованного, дает значительные ошибки классификации или переобученность сети.

В-третьих, различные компоненты ландшафтно-экологических систем наиболее строго интерпретируются выходными нейронами при неодинаковом размере «скрытого слоя». Водные комплексы уверенно дешифрируются при значительном увеличении «скрытого слоя», в то время как основная часть объектов – при количестве нейронов, подобранном с помощью геометрического правила пирамиды, или близком к нему.

В-четвертых, применение нейронной сети прямого распределения позволяет детектировать сложные границы урочищ в морфологической структуре ландшафтов. Так, например, однозначно по космическому снимку выделяются крутые склоны, сложенные песками в составе местности надпойменных террас, балки сырые и балки заболоченные в природных территориальных комплексах овражно-лощинно-балочной сети; котловины (древне-озерные), сложенные делювиальными, древне-озерными и торфяными отложениями и другие. По характеру увлажнения и растительным формациям уверенно детектируется граница между местностью пойм и местностью надпойменной террасы.

Таким образом, использование нейронных сетей прямого распределения для дешифрирования и интерпретации данных ДЗЗ сопряжено с рядом задач по планированию топологии сети, определению состава ее слоев. Проведенные эксперименты показали необходимость рекогносцировки формализовано рассчитанной архитектуры для целей более четкого выделения классов поверхности – выходных нейронов.


Библиографический список
  1. Зарубин О. А. Теоретико-методологические особенности анализа ландшафтно-экологических систем староосвоенных территорий // Вектор развития современной науки: сборник материалов X Международной научно-практической конференции. М.: Изд-во «Олимп»,2016. С. 417–426.
  2. Зарубин О. А. Пространственные аспекты ландшафтно-экологической организации территории // Научный альманах. 2016. № 4–4 (18). С. 54–57.
  3. Зарубин О. А. К вопросу об использовании синтетической и аналитической ландшафтных карт в изучении ландшафтно-экологических систем // XLIV Огарёвские чтения: материалы науч. конф.: в 3 ч. Ч 2: Естественные науки. Саранск.: Мордов гос. ун-т, 2016. С. 228–233.
  4. Brochure LandSat / Официальный сайт NASA. URL: http: http://landsat.gsfc.nasa.gov/wp-content/uploads/2012/12/ 20101119_LDCMbrochure. pdf (дата обращения: 07.08.2016).
  5. James W. Quinn. Combinations of Landsat ТМ / ЕТМ+ Bands. URL: http://web.pdx.edu/~emch/ipl/bandcombinations.html (дата обращения: 09.08.2016).
  6. Ямашкин А. А., Ямашкин С. А. ГИС-моделирование ландшафтного разнообразия // Геодезия и картография. 2013. № 11. С. 40–46.
  7. Ямашкин А. А., Ямашкин С. А., Кликунов А. А. Применение ГИС в анализе морфологической структуры ландшафтов // Вестн. Удм. ун-та. Сер. Биология. Науки о Земле. 2013. № 3. С. 34–41.
  8. Ямашкин А. А., Ямашкин С.А. Применение алгоритма выделения краев к решению задачи моделирования границ ландшафтов // Вестн. ВГУ. Сер. География, геоэкология. 2013. № 3. С. 68–78
  9. Ямашкин А. А. Ямашкин С. А. Использование нейронных сетей прямого распространения для ландшафтного картографирования на базе космических снимков // Геодезия и картография. 2014. № 11. С. 52–58.
  10. Питенко А. А. Нейросетевой анализ в геоинформационных системах : автореф. дис. … канд. техн. наук / А. А. Питенко; Институт вычислительного моделирования СО РАН. Красноярск, 2000. 97 с.


Все статьи автора «Зарубин Олег Александрович»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: