На современном этапе развития науки и техники ключевым источником информации, наряду с полевыми и стационарными исследованиями, являются данные дистанционного зондирования Земли (ДЗЗ). Синтетическая природа, заложенная в космических снимках, позволяет использовать их для решения практико-ориентированных задач в строительстве, сельском хозяйстве, лесном хозяйстве, территориальном планировании и т. д., направленных на анализ ландшафтно-экологических систем с целью оптимальной пространственной организации территории [1-3].
Материалы и методика исследований
Космический снимок представляет собой зарегистрированное определенным видом сенсоров электромагнитное излучение. В качестве территориального носителя информации выступает пиксель – неделимый наименьший элемент двумерного изображения, характеризующийся яркостью – способностью участка земной поверхности отражать или поглощать свет определенной длины волны.
Наиболее перспективным для решения географических, экологических, технических задач являются многозональные космические снимки высокого разрешения, в пиксельной совокупности которых содержатся отражательные свойства природных и антропогенных объектов.
На сегодняшний день существует целый ряд сервисов (спутников и их сенсоров), представляющих космические снимки с разным разрешением, периодичностью, количеством спектральных каналов. Среди наиболее успешных проектов отмечаем данные ДЗЗ, получаемые со спутников SPOT, IKONOS, QuickBird, Landsat, TERRA (платформа ASTER) и другие.
В качестве ресурса данных ДЗЗ в исследовании нами был выбран комплекс Landsat – старейший проект по получению космофотоснимков. В настоящее время на орбите Земли действуют спутники Landsat-7 (сенсор ETM+) и Landsat-8 (сенсоры OLI и TIRS). Пространственное разрешение основных каналов соответствует 30 м длины стороны пикселя, что позволяет позиционировать их как снимки высокого разрешения. Сравнение спектральных диапазонов приведено в таблице 1.
Однако отдельно взятый канал представляет крайне ограниченную вариацию действий по интерпретации свойств ландшафтно-экологических систем. Специфика применения космофотоснимков заключается в возможности комбинирования каналов, помещая их в красную (R), зеленую (G) и синюю (B) позиции. Таким образом, каждый канал представляет интерес для решения тематических прикладных задач, но синтетическую информацию о ландшафтно-экологических системах можно получить только в рамках комбинирования каналов при комплексном дешифрировании.
Таблица 2 – Спектральные каналы сенсоров ETM+ спутника Landsat-7 и OLI/TIRS спутника Landsat-8 (по данным NASA и геологической службы США [4], методических разработок James W. Quinn [5])
Спектральные характеристики |
Применение в ландшафтно-экологических исследованиях некоторых комбинаций каналов |
|||||||
Каналы ETM+ (Landsat-7) |
Каналы OLI/TIRS (Landsat-8) |
ETM+ |
OLI |
Область применения |
||||
Название |
Длина волны, мкм |
Разрешение (размер на 1 пиксель), м |
Название |
Длина волны, мкм |
Разрешение (размер на 1 пиксель), м |
|||
- |
Канал 1 – Побережья и аэрозоли | 0,433–0,453 | 30 | 4-3-2 | 5-4-3 | Изучения состояния растительного покрова, почвенного покрова, с/х культур | ||
Канал 1 – Синий | 0,450–0,515 | 30 | Канал 2 – Синий | 0,450–0,515 | 30 | 3-2-1 | 4-3-2 | Комбинация «естественные цвета». Применяется для визуального дешифрирования природных и антропогенных объектов |
Канал 2 – Зеленый | 0,525–0,605 | 30 | Канал 3 – Зеленый | 0,525–0,600 | 30 | 7-4- 2 | 7-5-3 | Изучение состояния и динамики пирогенных ландшафтов |
Канал 3 – Красный | 0,630–0,690 | 30 | Канал 4 – Красный | 0,630–0,680 | 30 | 7-5-4 | 7-6-5 | Картографирование почвенного покрова |
Канал 4 – Ближний ИК | 0,775–0,900 | 30 | Канал 5 – Ближний ИК | 0,845–0,885 | 30 | 4-5-3 | 5-6-4 | Изучение влажностных характеристик почв и растительного покрова, детектирование водных объектов |
Канал 5 – Средний ИК 1 | 1,550–1,750 | 30 | Канал 6 – Ближний ИК | 1,560–1,660 | 30 | 5-4-3 | 6-5-4 | Картографирование лесных сообществ с возможностью детектирования породового состава |
Канал 7 – Средний ИК 2 | 2,090–2,350 | 30 | Канал 7 – Ближний ИК | 2,100–2,300 | 30 | 7-5-3 | 7-6-4 | Мониторинг лесных пожаров и подтопления территории |
Канал 8 – Панхроматический | 0,520–0,900 | 15 | Канал 8 – Панхроматический | 0,500–0,680 | 15 | |||
- |
Канал 9 – Перистые облака | 1,360–1,390 | 30 | |||||
Канал 6 – Дальний ИК | 10,00 – 12,50 | 60 | Канал 10 – Дальний ИК | 10,30–11,30 | 100 | |||
- |
Канал 11 – Дальний ИК | 11,50–12,50 | 100 |
Развитие программно-аппаратных комплексов и вычислительных алгоритмов сделало возможным развитие автоматизированного дешифрирования, основанного на применении компьютерных технологий.
Потребность в совершенствовании методов автоматизированной классификации данных ДЗЗ и развитие соответствующих методов, основанное на качественном изменении программных средств и вычислительных устройств, делают возможным применение сложных математических алгоритмов для решения географических задач. Так, в Мордовском университете на базе тестовых научно-исследовательских полигонов (НИП) апробированы методики вычисления и оценки ландшафтного разнообразия [6, 7], выделения границ ландшафтов [8] и другие.
Использование монохромных изображений или космических снимков в естественных цветах предоставляет ограниченное количество информации. Гораздо более ценным ресурсом является визуальный и автоматизированный анализ комбинаций спектральных каналов. На современном этапе для анализа и интерпретации радиометрически и геометрически скорректированных данных, представленных в картографической проекции, используется ряд программных комплексов: ERDAS IMAGINE, ScanEx Image Processor, ENVI, ER Mapper и другие. Некоторые возможности заложены в неспециализированных на дешифрировании ГИС и их модулях, например, в ArcView и ArcGis.
В рамках данного исследования в качестве программного продукта для анализа многоканальных снимков нами выбран ScanEx Image Processor, разработанный группой компаний «СКАНЭКС».
Ключевым инструментом любого программного обеспечения для автоматизированной обработки космических снимков являются алгоритмы компьютерного дешифрирования, основанные на спектральных признаках, характеризующих пиксели. Конечная задача сводится к их классификации в определенное количество групп. В комплексе ScanEx Image Processor представлены:
- Классификация без обучения (кластеризация с помощью метода ISODATA);
- Классификация с обучением. При данном типе пиксели снимка объединяются в группы на основе сравнения их яркостей с эталонными значениями. В ScanEx Image Processor представлен ряд инструментов: классификация с помощью метода деревьев, бинарная классификация, классификация с помощью нейронных сетей и другие.
Перспективным методом интеллектуальной интерпретации информации данных ДЗЗ являются нейронные сети [9, 10 и др.], что связано с возможностью их обучения, выбора топологии построения и минимизацией влияния «шума» в структуре многозонального снимка.
В основе работы нейронной сети, представленной системой взаимосвязанных простых процессоров, заложен принцип функционирования человеческой нервной системы. Нейроны нейронной сети сгруппированы в слои так, что выходной сигнал предыдущего слоя подается на входы всех нейронов последующего.
Для классификации данных ДЗЗ в программе ScanEx Image Processor с применением нейросетевого метода необходимо решить ряд взаимосвязанных задач.
1. Определение входных данных. В зависимости от решаемой проблемно-ориентированной задачи исходные данные могут быть представлены многозональными, гиперспектральными космическими снимками различного пространственного и временного разрешения. Для целей ландшафтного картографирования необходимо определить канал многозонального снимка для каждого входного нейрона в позициях R, G и B. При этом исключительную важность представляет комбинация каналов, позволяющая наиболее четко выделять те или иные компоненты ландшафтно-экологических систем.
2. Определение выходных данных. Количество выходных узлов нейронной сети зависит от предполагаемого результата классификации, т.е. количества структурных подразделений ландшафтов картографируемой территории.
3. Задание источника меток. Источник меток определяет эталоны для обучения нейронной сети. Программный комплекс позволяет использовать в качестве них растровые или векторные слои (слой с атрибутами).
4. Выбор параметров обучения. В ScanEx Image Processor основными параметрами являются: максимальная ошибка (задает среднеквадратическую ошибку, при достижении которой сеть считается обученной), максимальное число эпох (циклов использования всех входных нейронов), эпсилон (скорость обучения), ошибка выборки (параметр задает последовательный ряд пикселей, при которых выполняется перекрестная проверка качества обучения сети).
5. Выбор архитектуры нейронной сети. В вопросе выбора архитектуры нейронной сети важно выделить два направления. Во-первых, определение связей между слоями нейронов, которые могут быть прямыми и обратными. Нейронные сети прямого распределения, являющиеся наиболее перспективными для решения задач картографирования ландшафтно-экологических систем [9], носят однонаправленный характер, при этом их точность зависит от числа нейронов.
Второе направление, решаемое в задаче определения архитектуры сети, связано с определением количества так называемых «скрытых» слоев и числа их нейронов. В используемом программном обеспечении возможен сценарий с применением от 0 до 2 скрытых слоев, однако при проведении аналогичных экспериментов другими авторами [9] доказана целесообразность использования одного скрытого слоя.
Подбор числа нейронов в «скрытом слое» может быть осуществлен расчетным путем, однако формализованный подход необходимо проверять эмпирически. Основным методом определения числа нейронов является геометрическое правило пирамиды [9], вычисляемое по формуле:
где k – число нейронов в «скрытом слое»;
n – число нейронов во входном слое;
m – число нейронов в выходном слое.
6. Обучение нейронной сети и классификация данных ДЗЗ. Обучение сети происходит с помощью введения в программу исходных растров (входных каналов), источника меток, топологии нейронной сети и параметров обучения. Оптимальным является применение «обучения с учителем», при котором типам ландшафтно-экологических систем задаются участки космического снимка со сходными спектральными характеристиками. Результатом процесса обучения является обученная нейронная сеть, которая сохраняется в файле и используется для последующей классификации космического снимка.
Для целей отработки картографирования ландшафтно-экологических систем с применением нейронных сетей прямого распределения нами выбран научно-исследовательский полигон (НИП) «Новое Мамангино» (рисунок 1), получивший название по одноименному населенному пункту на его территории. Полигон расположен в западной части Мордовии, в Ковылкинском и Краснослободском районах. Наиболее крупные населенные пункты – с. Новое Мамангино, с. Мамолаево, с. Самозлейка, с. Старая Рябка.
Рисунок 1. НИП «Новое Мамангино» на космическом снимке Landsat-8
Ландшафтно-экологические системы полигона детально изучены учеными Мордовского университета, сотрудниками профильных министерств и ведомств в рамках проведения геоэкологического анализа территории для целей строительства Мордовской ГРЭС. Приведем основные положения.
Геологическая среда тестового НИП формируется каменноугольными, юрскими, меловыми и четвертичными отложениями, перекрываемыми четвертичными породами мощностью до 25 м – моренными суглинками и водно-ледниковыми песками [11].
Долина р. Мокши – основного водотока полигона – имеет ширину около 20 км и характеризуется резко выраженным асимметричным строением с левым крутым коренным берегом и пологий с тремя надпойменными террасами правый. Ширина поймы от 3 до 5 км. По характеру морфологического строения она подразделяется на прирусловую, центральную и притеррасовую.
К востоку от долины Мокши простирается водно-ледниковая равнина, абсолютные отметки которой доходят до 200 м. Ее краевая часть сильно рассе-чена линейно вытянутыми эрозионными формами рельефа. По левому берегу Мокши протягивается левый коренной борт долины высотой 80–90 м, характеризующийся значительной крутизной и пересеченным рельефом.
В почвенном покрове территории полигона преобладают дерново-подзолистые, серые лесные, аллювиально-дерновые, аллювиально-болотные и торфяно-болотные почвы.
Полигон расположен на границе лесостепных комплексов, широколист-венных и смешанных лесов. Сосняки – наиболее распространенная формация – доминируют по надпойменным террасам. Широколиственные леса, представленные дубом, липой, кленом остролистным, ясенем и вязом, распространены преимущественно на аллювиально-водно-ледниковой и вторичной моренной равнине. Значительное распространение имеют вторичные и производные мелколиственные леса [11].
В морфологической структуре ландшафтов А. А. Ямашкин [11] выделил следующие геокомплексы (рисунок 2): местность водно-ледниковой (зандровой) равнины (В); местность аллювиально-водно-ледниковой равнины (Г цифрами обозначены урочища); местность надпойменных террас (Д, цифрами обозначены урочища); природные территориальные комплексы овражно-лощинно-балочной сети (Е, цифрами обозначены урочища); природные территориальные комплексы котловин, западин, понижений (Ж, цифрами обозначены урочища); местность поймы (З, цифрами обозначены урочища).
Результаты и их обсуждение
Первостепенной задачей для картографирования территории тестового полигона является определение входных и выходных нейронов – каналов съемки. Очевидно, что перспективными для автоматизированного дешифрирования являются комбинации каналов, при которых оптимальны яркостные характеристики физиономичных признаков – растительности, открытых участков почв или водных поверхностей. Этим критериям подходит комбинация каналов Landsat-8 6-5-4. Однако в ходе аналогичных исследований тестового НИП «Смольный» учеными Мордовского университета [9] были апробированы каналы 2, 3 и 4-й спутника Landsat-7, которым соответствует комбинация 3-4-5 Landsat-8. Целесообразным видится проведение экспериментов с целью выявления оптимальной комбинации.
Выходные нейроны представлены классами земной поверхности. Зададим слой из 7 нейронов: хвойная растительность, широколиственная растительность, мелколиственная растительность, луговая растительность, водные поверхности, с/х модификации, селитебные ландшафты.
Рисунок 2. Ландшафтная карта НИП «Новое Мамангино» [11]
Начальное количество нейронов в «скрытом слое» было определено в рамках геометрического правила пирамиды, т. е. равно 6. Для целей уточнения результатов и тестирования метода проведены эксперименты с 4, 5, 7, 8 и 15 нейронами. Результаты показаны на рисунках 3 и 4.
При количестве нейронов в «скрытом слое» равном трем результат классификации имеет большие погрешности при сопоставлении с данными полевых исследований и космическими снимками в естественных цветах более высокого разрешения. Тонкий слой при входных нейронах, представленный каналами 3-4-5, позволяет уверенно лишь отделять луговые комплексы от лесной растительности, при этом хвойные, мелколиственные и смешанные формации не выделяются. Не выделены водные комплексы и селитебные ландшафты. Велика доля не классифицированных пикселей, что свидетельствует о недообучении нейронной сети. При синтезе входных каналов 6-5-4 результат значительно лучше: лесная растительность дифференцирована по породовому составу, выделены водные объекты, сеть имеет гораздо меньше признаков недообучения.
Резкое увеличение количества нейронов в «скрытом слое» до 15 для первого варианта синтеза каналов ведет к переобучению сети, что сказывается на выделении селитебных ландшафтов, в класс которых ошибочно попадают некоторые с/х угодья, сходные по спектральным характеристикам с населенными пунктами.
Рисунок 3. Результат классификации территории тестового НИП «Новое Мамангино» с помощью нейронной сети прямого распределения (каналы 3-4-5)
Рисунок 4. Результат классификации территории тестового НИП «Новое Мамангино» с помощью нейронной сети прямого распределения (каналы 6-5-4)
Признаки переобучения характерны и для синтеза 6-5-4. Несмотря на то, что селитебные территории интерпретированы наиболее строго, в класс селитьбы классифицированы краевые части с/х ландшафтов и геокомплексов с луговой растительностью.
Для второй комбинации входных каналов наилучшие показатели классификации показала нейронная сеть прямого распределения с числом нейронов, рассчитанных на основе геометрического правила пирамиды. При 6 нейронах в «скрытом слое» наиболее точно из всех вариантов эксперимента выделены урочища, в растительном покрове которого преобладает хвойная растительность. Строго классифицировались геокомплексы с доминантными кустарниковыми фитоценозами. Однако не выделенными остались селитебные ландшафты сельских населенных пунктов тестового полигона. Для первой комбинации каналов наиболее оптимальной является величина «скрытого слоя», увеличенная на один нейрон. Но ошибки по всем классифицируемым классам больше, чем у второй комбинации.
Выводы
На основании проведенных экспериментов можно сделать ряд выводов.
Во-первых, классификация космического снимка зависит от характера входных каналов. В зависимости от характера подстилающей поверхности территории необходимо использовать ту комбинацию каналов, которая наиболее подробно отражает свойства физиономичных дешифровочных признаков. Из двух сочетаний каналов, ориентированных на изучение состояния растительного покрова, обобщенный лучший результат показала комбинация 6-5-4.
Во-вторых, успешность классификации зависит от архитектуры нейронной сети, т.е. от количества нейронов в «скрытом слое». Расчетная модель подбора их количества (использование геометрического правила пирамиды) не всегда дает наилучший результат, однако количество нейронов, подобранное таким путем может служить ориентиром для эмпирического подбора, т. к. размер слоя, сильно отличающийся от формализованного, дает значительные ошибки классификации или переобученность сети.
В-третьих, различные компоненты ландшафтно-экологических систем наиболее строго интерпретируются выходными нейронами при неодинаковом размере «скрытого слоя». Водные комплексы уверенно дешифрируются при значительном увеличении «скрытого слоя», в то время как основная часть объектов – при количестве нейронов, подобранном с помощью геометрического правила пирамиды, или близком к нему.
В-четвертых, применение нейронной сети прямого распределения позволяет детектировать сложные границы урочищ в морфологической структуре ландшафтов. Так, например, однозначно по космическому снимку выделяются крутые склоны, сложенные песками в составе местности надпойменных террас, балки сырые и балки заболоченные в природных территориальных комплексах овражно-лощинно-балочной сети; котловины (древне-озерные), сложенные делювиальными, древне-озерными и торфяными отложениями и другие. По характеру увлажнения и растительным формациям уверенно детектируется граница между местностью пойм и местностью надпойменной террасы.
Таким образом, использование нейронных сетей прямого распределения для дешифрирования и интерпретации данных ДЗЗ сопряжено с рядом задач по планированию топологии сети, определению состава ее слоев. Проведенные эксперименты показали необходимость рекогносцировки формализовано рассчитанной архитектуры для целей более четкого выделения классов поверхности – выходных нейронов.
Библиографический список
- Зарубин О. А. Теоретико-методологические особенности анализа ландшафтно-экологических систем староосвоенных территорий // Вектор развития современной науки: сборник материалов X Международной научно-практической конференции. М.: Изд-во «Олимп»,2016. С. 417–426.
- Зарубин О. А. Пространственные аспекты ландшафтно-экологической организации территории // Научный альманах. 2016. № 4–4 (18). С. 54–57.
- Зарубин О. А. К вопросу об использовании синтетической и аналитической ландшафтных карт в изучении ландшафтно-экологических систем // XLIV Огарёвские чтения: материалы науч. конф.: в 3 ч. Ч 2: Естественные науки. Саранск.: Мордов гос. ун-т, 2016. С. 228–233.
- Brochure LandSat / Официальный сайт NASA. URL: http: http://landsat.gsfc.nasa.gov/wp-content/uploads/2012/12/ 20101119_LDCMbrochure. pdf (дата обращения: 07.08.2016).
- James W. Quinn. Combinations of Landsat ТМ / ЕТМ+ Bands. URL: http://web.pdx.edu/~emch/ipl/bandcombinations.html (дата обращения: 09.08.2016).
- Ямашкин А. А., Ямашкин С. А. ГИС-моделирование ландшафтного разнообразия // Геодезия и картография. 2013. № 11. С. 40–46.
- Ямашкин А. А., Ямашкин С. А., Кликунов А. А. Применение ГИС в анализе морфологической структуры ландшафтов // Вестн. Удм. ун-та. Сер. Биология. Науки о Земле. 2013. № 3. С. 34–41.
- Ямашкин А. А., Ямашкин С.А. Применение алгоритма выделения краев к решению задачи моделирования границ ландшафтов // Вестн. ВГУ. Сер. География, геоэкология. 2013. № 3. С. 68–78
- Ямашкин А. А. Ямашкин С. А. Использование нейронных сетей прямого распространения для ландшафтного картографирования на базе космических снимков // Геодезия и картография. 2014. № 11. С. 52–58.
- Питенко А. А. Нейросетевой анализ в геоинформационных системах : автореф. дис. … канд. техн. наук / А. А. Питенко; Институт вычислительного моделирования СО РАН. Красноярск, 2000. 97 с.