<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современные научные исследования и инновации» &#187; архитектура нейронной сети</title>
	<atom:link href="http://web.snauka.ru/issues/tag/arhitektura-neyronnoy-seti/feed" rel="self" type="application/rss+xml" />
	<link>https://web.snauka.ru</link>
	<description></description>
	<lastBuildDate>Sat, 18 Apr 2026 09:41:14 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Применение нейронных сетей для целей анализа данных дистанционного зондирования Земли</title>
		<link>https://web.snauka.ru/issues/2016/08/70887</link>
		<comments>https://web.snauka.ru/issues/2016/08/70887#comments</comments>
		<pubDate>Wed, 31 Aug 2016 12:25:42 +0000</pubDate>
		<dc:creator>Зарубин Олег Александрович</dc:creator>
				<category><![CDATA[11.00.00 ГЕОГРАФИЧЕСКИЕ НАУКИ]]></category>
		<category><![CDATA[architecture of the neural network]]></category>
		<category><![CDATA[automated interpretation multispectral satellite images]]></category>
		<category><![CDATA[data of remote sensing]]></category>
		<category><![CDATA[landscape and ecological system]]></category>
		<category><![CDATA[learning]]></category>
		<category><![CDATA[neural networks]]></category>
		<category><![CDATA[pixel]]></category>
		<category><![CDATA[автоматизированное дешифрирование]]></category>
		<category><![CDATA[архитектура нейронной сети]]></category>
		<category><![CDATA[данные дистанционного зондирования Земли]]></category>
		<category><![CDATA[ландшафтно-экологическая система]]></category>
		<category><![CDATA[многозональные космические снимки]]></category>
		<category><![CDATA[нейронные сети]]></category>
		<category><![CDATA[обучение]]></category>
		<category><![CDATA[пиксель]]></category>

		<guid isPermaLink="false">https://web.snauka.ru/issues/2016/08/70887</guid>
		<description><![CDATA[На современном этапе развития науки и техники ключевым источником информации, наряду с полевыми и стационарными исследованиями, являются данные дистанционного зондирования Земли (ДЗЗ). Синтетическая природа, заложенная в космических снимках, позволяет использовать их для решения практико-ориентированных задач в строительстве, сельском хозяйстве, лесном хозяйстве, территориальном планировании и т. д., направленных на анализ ландшафтно-экологических систем с целью оптимальной пространственной [...]]]></description>
			<content:encoded><![CDATA[<p>На современном этапе развития науки и техники ключевым источником информации, наряду с полевыми и стационарными исследованиями, являются <strong><em>данные дистанционного зондирования Земли</em></strong> (ДЗЗ). Синтетическая природа, заложенная в космических снимках, позволяет использовать их для решения практико-ориентированных задач в строительстве, сельском хозяйстве, лесном хозяйстве, территориальном планировании и т. д., направленных на анализ ландшафтно-экологических систем с целью оптимальной пространственной организации территории [1-3].</p>
<p><strong>Материалы и методика исследований</strong><strong> </strong></p>
<p>Космический снимок представляет собой зарегистрированное определенным видом сенсоров электромагнитное излучение. В качестве территориального носителя информации выступает <strong><em>пиксель</em></strong> – неделимый наименьший элемент двумерного изображения, характеризующийся яркостью – способностью участка земной поверхности отражать или поглощать свет определенной длины волны.</p>
<p>Наиболее перспективным для решения географических, экологических, технических задач являются <strong><em>многозональные космические снимки</em></strong> высокого разрешения, в пиксельной совокупности которых содержатся отражательные свойства природных и антропогенных объектов.</p>
<p>На сегодняшний день существует целый ряд сервисов (спутников и их сенсоров), представляющих космические снимки с разным разрешением, периодичностью, количеством спектральных каналов. Среди наиболее успешных проектов отмечаем данные ДЗЗ, получаемые со спутников SPOT, IKONOS, QuickBird, Landsat, TERRA (платформа ASTER) и другие.</p>
<p>В качестве ресурса данных ДЗЗ в исследовании нами был выбран комплекс Landsat – старейший проект по получению космофотоснимков. В настоящее время на орбите Земли действуют спутники Landsat-7 (сенсор ETM+) и Landsat-8 (сенсоры OLI и TIRS). Пространственное разрешение основных каналов соответствует 30 м длины стороны пикселя, что позволяет позиционировать их как снимки высокого разрешения. Сравнение спектральных диапазонов приведено в таблице 1.</p>
<p>Однако отдельно взятый канал представляет крайне ограниченную вариацию действий по интерпретации свойств ландшафтно-экологических систем. Специфика применения космофотоснимков заключается в возможности комбинирования каналов, помещая их в красную (R), зеленую (G) и синюю (B) позиции. Таким образом, каждый канал представляет интерес для решения тематических прикладных задач, но синтетическую информацию о ландшафтно-экологических системах можно получить только в рамках комбинирования каналов при комплексном дешифрировании.</p>
<p>Таблица 2 – Спектральные каналы сенсоров ETM+ спутника Landsat-7 и OLI/TIRS спутника Landsat-8 (по данным NASA и геологической службы США [4], методических разработок James W. Quinn [5])</p>
<div align="center">
<table width="975" border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td colspan="6" valign="top" width="592">
<p align="center">Спектральные характеристики</p>
</td>
<td colspan="3" valign="top" width="384">
<p align="center">Применение в ландшафтно-экологических исследованиях некоторых комбинаций каналов</p>
</td>
</tr>
<tr>
<td colspan="3" valign="top" width="285">
<p align="center">Каналы ETM+ (Landsat-7)</p>
</td>
<td colspan="3" valign="top" width="306">
<p align="center">Каналы OLI/TIRS  (Landsat-8)</p>
</td>
<td rowspan="2" valign="top" width="55">
<p align="center">ETM+</p>
</td>
<td rowspan="2" valign="top" width="58">
<p align="center">OLI</p>
</td>
<td rowspan="2" valign="top" width="271">
<p align="center">Область применения</p>
</td>
</tr>
<tr>
<td valign="top" width="135">
<p align="center">Название</p>
</td>
<td valign="top" width="63">
<p align="center">Длина волны, мкм</p>
</td>
<td valign="top" width="87">
<p align="center">Разрешение (размер на 1 пиксель), м</p>
</td>
<td valign="top" width="150">
<p align="center">Название</p>
</td>
<td valign="top" width="58">
<p align="center">Длина волны, мкм</p>
</td>
<td valign="top" width="97">
<p align="center">Разрешение (размер на 1 пиксель), м</p>
</td>
</tr>
<tr>
<td colspan="3" width="285">
<p align="center">-</p>
</td>
<td valign="top" width="150">Канал 1 – Побережья и аэрозоли</td>
<td valign="top" width="58">0,433–0,453</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">4-3-2</td>
<td valign="top" width="58">5-4-3</td>
<td valign="top" width="271">Изучения состояния растительного покрова, почвенного покрова, с/х культур</td>
</tr>
<tr>
<td valign="top" width="135">Канал 1 – Синий</td>
<td valign="top" width="63">0,450–0,515</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 2 – Синий</td>
<td valign="top" width="58">0,450–0,515</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">3-2-1</td>
<td valign="top" width="58">4-3-2</td>
<td valign="top" width="271">Комбинация «естественные цвета». Применяется для визуального дешифрирования природных и антропогенных объектов</td>
</tr>
<tr>
<td valign="top" width="135">Канал 2 – Зеленый</td>
<td valign="top" width="63">0,525–0,605</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 3 – Зеленый</td>
<td valign="top" width="58">0,525–0,600</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">7-4- 2</td>
<td valign="top" width="58">7-5-3</td>
<td valign="top" width="271">Изучение состояния и динамики пирогенных ландшафтов</td>
</tr>
<tr>
<td valign="top" width="135">Канал 3 – Красный</td>
<td valign="top" width="63">0,630–0,690</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 4 – Красный</td>
<td valign="top" width="58">0,630–0,680</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">7-5-4</td>
<td valign="top" width="58">7-6-5</td>
<td valign="top" width="271">Картографирование почвенного покрова</td>
</tr>
<tr>
<td valign="top" width="135">Канал 4 – Ближний ИК</td>
<td valign="top" width="63">0,775–0,900</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 5 – Ближний ИК</td>
<td valign="top" width="58">0,845–0,885</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">4-5-3</td>
<td valign="top" width="58">5-6-4</td>
<td valign="top" width="271">Изучение влажностных характеристик  почв и растительного покрова, детектирование водных объектов</td>
</tr>
<tr>
<td valign="top" width="135">Канал 5 – Средний ИК 1</td>
<td valign="top" width="63">1,550–1,750</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 6 – Ближний ИК</td>
<td valign="top" width="58">1,560–1,660</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">5-4-3</td>
<td valign="top" width="58">6-5-4</td>
<td valign="top" width="271">Картографирование лесных сообществ с возможностью детектирования породового состава</td>
</tr>
<tr>
<td valign="top" width="135">Канал 7 – Средний ИК 2</td>
<td valign="top" width="63">2,090–2,350</td>
<td valign="top" width="87">30</td>
<td valign="top" width="150">Канал 7 – Ближний ИК</td>
<td valign="top" width="58">2,100–2,300</td>
<td valign="top" width="97">30</td>
<td valign="top" width="55">7-5-3</td>
<td valign="top" width="58">7-6-4</td>
<td valign="top" width="271">Мониторинг лесных пожаров и подтопления территории</td>
</tr>
<tr>
<td valign="top" width="135">Канал 8 &#8211; Панхроматический</td>
<td valign="top" width="63">0,520–0,900</td>
<td valign="top" width="87">15</td>
<td valign="top" width="150">Канал 8 – Панхроматический</td>
<td valign="top" width="58">0,500–0,680</td>
<td valign="top" width="97">15</td>
<td rowspan="4" colspan="3" valign="top" width="384"></td>
</tr>
<tr>
<td colspan="3" valign="top" width="286">
<p align="center">-</p>
</td>
<td valign="top" width="150">Канал 9 – Перистые облака</td>
<td valign="top" width="58">1,360–1,390</td>
<td valign="top" width="97">30</td>
</tr>
<tr>
<td valign="top" width="135">Канал 6 – Дальний ИК</td>
<td valign="top" width="63">10,00 – 12,50</td>
<td valign="top" width="87">60</td>
<td valign="top" width="150">Канал 10 – Дальний ИК</td>
<td valign="top" width="58">10,30–11,30</td>
<td valign="top" width="97">100</td>
</tr>
<tr>
<td colspan="3" valign="top" width="286">
<p align="center">-</p>
</td>
<td valign="top" width="150">Канал 11 – Дальний ИК</td>
<td valign="top" width="58">11,50–12,50</td>
<td valign="top" width="97">100</td>
</tr>
</tbody>
</table>
</div>
<div style="text-align: left;" align="center">
<p style="text-align: left;">Развитие программно-аппаратных комплексов и вычислительных алгоритмов сделало возможным развитие <strong><em>автоматизированного дешифрирования</em></strong>, основанного на применении компьютерных технологий.</p>
<p style="text-align: left;">Потребность в совершенствовании методов автоматизированной классификации данных ДЗЗ и развитие соответствующих методов, основанное на качественном изменении программных средств и вычислительных устройств, делают возможным применение сложных математических алгоритмов для решения географических задач. Так, в Мордовском университете на базе тестовых научно-исследовательских полигонов (НИП) апробированы методики вычисления и оценки ландшафтного разнообразия [6, 7], выделения границ ландшафтов [8] и другие.</p>
<p style="text-align: left;">Использование монохромных изображений или космических снимков в естественных цветах предоставляет ограниченное количество информации. Гораздо более ценным ресурсом является визуальный и автоматизированный анализ комбинаций спектральных каналов. На современном этапе для анализа и интерпретации радиометрически и геометрически скорректированных данных, представленных в картографической проекции, используется ряд программных комплексов: ERDAS IMAGINE, ScanEx Image Processor, ENVI, ER Mapper и другие. Некоторые возможности заложены в неспециализированных на дешифрировании ГИС и их модулях, например, в ArcView и ArcGis.</p>
<p style="text-align: left;">В рамках данного исследования в качестве программного продукта для анализа многоканальных снимков нами выбран ScanEx Image Processor, разработанный группой компаний «СКАНЭКС».</p>
<p style="text-align: left;">Ключевым инструментом любого программного обеспечения для автоматизированной обработки космических снимков являются алгоритмы компьютерного дешифрирования, основанные на спектральных признаках, характеризующих пиксели. Конечная задача сводится к их классификации в определенное количество групп. В комплексе ScanEx Image Processor представлены:</p>
<p style="text-align: left;"><strong><em>- Классификация без обучения</em></strong> (кластеризация с помощью метода ISODATA);</p>
<p style="text-align: left;"><strong><em>- Классификация с обучением.</em></strong><strong> </strong>При данном типе пиксели снимка объединяются в группы на основе сравнения их яркостей с эталонными значениями. В ScanEx Image Processor представлен ряд инструментов: классификация с помощью метода деревьев, бинарная классификация, классификация с помощью нейронных сетей и другие.</p>
<p style="text-align: left;">Перспективным методом интеллектуальной интерпретации информации данных ДЗЗ являются нейронные сети [9, 10 и др.], что связано с возможностью их обучения, выбора топологии построения и минимизацией влияния «шума» в структуре многозонального снимка.</p>
<p style="text-align: left;">В основе работы нейронной сети, представленной системой взаимосвязанных простых процессоров, заложен принцип функционирования человеческой нервной системы. Нейроны нейронной сети сгруппированы в слои так, что выходной сигнал предыдущего слоя подается на входы всех нейронов последующего.</p>
<p style="text-align: left;">Для классификации данных ДЗЗ в программе ScanEx Image Processor с применением нейросетевого метода необходимо решить ряд взаимосвязанных задач.</p>
<p style="text-align: left;"><strong><em>1. Определение входных данных</em></strong><strong>.<em> </em></strong>В зависимости от решаемой проблемно-ориентированной задачи исходные данные могут быть представлены многозональными, гиперспектральными космическими снимками различного пространственного и временного разрешения. Для целей ландшафтного картографирования необходимо определить канал многозонального снимка для каждого входного нейрона в позициях R, G и B. При этом исключительную важность представляет комбинация каналов, позволяющая наиболее четко выделять те или иные компоненты ландшафтно-экологических систем.<strong><em></em></strong></p>
<p style="text-align: left;"><strong><em>2. Определение выходных данных. </em></strong>Количество выходных узлов нейронной сети зависит от предполагаемого результата классификации, т.е. количества структурных подразделений ландшафтов картографируемой территории.</p>
<p style="text-align: left;"><strong><em>3. Задание источника меток. </em></strong>Источник меток определяет эталоны для обучения нейронной сети. Программный комплекс позволяет использовать в качестве них растровые или векторные слои (слой с атрибутами).<strong><em></em></strong></p>
<p style="text-align: left;"><strong><em>4. Выбор параметров обучения</em></strong><em>.<strong> </strong></em>В ScanEx Image Processor основными параметрами являются: максимальная ошибка (задает среднеквадратическую ошибку, при достижении которой сеть считается обученной), максимальное число эпох (циклов использования всех входных нейронов), эпсилон (скорость обучения), ошибка выборки (параметр задает последовательный ряд пикселей, при которых выполняется перекрестная проверка качества обучения сети).<strong><em></em></strong></p>
<p style="text-align: left;"><strong><em>5. Выбор архитектуры нейронной сети.</em></strong><em> </em>В вопросе выбора архитектуры нейронной сети важно выделить два направления. Во-первых, определение связей между слоями нейронов, которые могут быть прямыми и обратными. Нейронные сети прямого распределения, являющиеся наиболее перспективными для решения задач картографирования ландшафтно-экологических систем [9], носят однонаправленный характер, при этом их точность зависит от числа нейронов.</p>
<p style="text-align: left;">Второе направление, решаемое в задаче определения архитектуры сети, связано с определением количества так называемых «скрытых» слоев и числа их нейронов. В используемом программном обеспечении возможен сценарий с применением от 0 до 2 скрытых слоев, однако при проведении аналогичных экспериментов другими авторами [9] доказана целесообразность использования одного скрытого слоя.</p>
<p style="text-align: left;">Подбор числа нейронов в «скрытом слое» может быть осуществлен расчетным путем, однако формализованный подход необходимо проверять эмпирически. Основным методом определения числа нейронов является <strong><em>геометрическое правило пирамиды</em></strong><em> </em>[9]<em>, </em>вычисляемое по формуле:</p>
<p style="text-align: center;" align="center"><img class="aligncenter" title="form1" src="https://web.snauka.ru/wp-content/uploads/2016/09/form1.png" alt="" width="97" height="41" /></p>
<p style="text-align: left;" align="center">где  <em>k</em> – число нейронов в «скрытом слое»;</p>
<p style="text-align: left;"><em>n</em> – число нейронов во входном слое;</p>
<p style="text-align: left;"><em>m</em> – число нейронов в выходном слое.<em></em></p>
<p style="text-align: left;"><strong><em>6.</em></strong><strong> <em>Обучение нейронной сети и классификация данных ДЗЗ. </em></strong>Обучение сети происходит с помощью введения в программу исходных растров (входных каналов), источника меток, топологии нейронной сети и параметров обучения. Оптимальным является применение «обучения с учителем», при котором типам ландшафтно-экологических систем задаются участки космического снимка со сходными спектральными характеристиками. Результатом процесса обучения является обученная нейронная сеть, которая сохраняется в файле и используется для последующей классификации космического снимка. <strong><em></em></strong></p>
<p style="text-align: left;">Для целей отработки картографирования ландшафтно-экологических систем с применением нейронных сетей прямого распределения нами выбран <strong><em>научно-исследовательский полигон (НИП) «Новое Мамангино»</em></strong> (рисунок 1), получивший название по одноименному населенному пункту на его территории. Полигон расположен в западной части Мордовии, в Ковылкинском и Краснослободском районах. Наиболее крупные населенные пункты – с. Новое Мамангино, с. Мамолаево, с. Самозлейка, с. Старая Рябка.</p>
<p><a href="https://web.snauka.ru/issues/2016/08/70887/risunok1-47" rel="attachment wp-att-70973"><img class="aligncenter size-full wp-image-70973" src="https://web.snauka.ru/wp-content/uploads/2016/08/Risunok1.png" alt="" width="664" height="392" /></a></p>
<p align="center">Рисунок 1. НИП «Новое Мамангино» <span style="text-align: left;">на космическом снимке Landsat-8</span></p>
<p style="text-align: left;">Ландшафтно-экологические системы полигона детально изучены учеными Мордовского университета, сотрудниками профильных министерств и ведомств в рамках проведения геоэкологического анализа территории для целей строительства Мордовской ГРЭС. Приведем основные положения.</p>
<p style="text-align: left;">Геологическая среда тестового НИП формируется каменноугольными, юрскими, меловыми и четвертичными отложениями, перекрываемыми четвертичными породами мощностью до 25 м – моренными суглинками и водно-ледниковыми песками [11].</p>
<p style="text-align: left;">Долина р. Мокши – основного водотока полигона – имеет ширину около 20 км и характеризуется резко выраженным асимметричным строением с левым крутым коренным берегом и пологий с тремя надпойменными террасами правый. Ширина поймы от 3 до 5 км. По характеру морфологического строения она подразделяется на прирусловую, центральную и притеррасовую.</p>
<p style="text-align: left;">К востоку от долины Мокши простирается водно-ледниковая равнина, абсолютные отметки которой доходят до 200 м. Ее краевая часть сильно рассе-чена линейно вытянутыми эрозионными формами рельефа. По левому берегу Мокши протягивается левый коренной борт долины высотой 80–90 м, характеризующийся значительной крутизной и пересеченным рельефом.</p>
<p style="text-align: left;">В почвенном покрове территории полигона преобладают дерново-подзолистые, серые лесные, аллювиально-дерновые, аллювиально-болотные и торфяно-болотные почвы.</p>
<p style="text-align: left;">Полигон расположен на границе лесостепных комплексов, широколист-венных и смешанных лесов. Сосняки – наиболее распространенная формация – доминируют по надпойменным террасам. Широколиственные леса, представленные дубом, липой, кленом остролистным, ясенем и вязом, распространены преимущественно на аллювиально-водно-ледниковой и вторичной моренной равнине. Значительное распространение имеют вторичные и производные мелколиственные леса [11].</p>
<p style="text-align: left;">В морфологической структуре ландшафтов А. А. Ямашкин [11] выделил следующие геокомплексы (рисунок 2): местность водно-ледниковой (зандровой) равнины (В); местность аллювиально-водно-ледниковой равнины (Г цифрами обозначены урочища); местность надпойменных террас (Д, цифрами обозначены урочища); природные территориальные комплексы овражно-лощинно-балочной сети (Е, цифрами обозначены урочища); природные территориальные комплексы котловин, западин, понижений (Ж, цифрами обозначены урочища); местность поймы (З, цифрами обозначены урочища).</p>
<p style="text-align: left;"><strong>Результаты и их обсуждение</strong></p>
<p style="text-align: left;">Первостепенной задачей для картографирования территории тестового полигона является определение входных и выходных нейронов – каналов съемки. Очевидно, что перспективными для автоматизированного дешифрирования являются комбинации каналов, при которых оптимальны яркостные характеристики физиономичных признаков – растительности, открытых участков почв или водных поверхностей. Этим критериям подходит комбинация каналов Landsat-8 6-5-4. Однако в ходе аналогичных исследований тестового НИП «Смольный» учеными Мордовского университета [9] были апробированы каналы 2, 3 и 4-й спутника Landsat-7, которым соответствует комбинация 3-4-5 Landsat-8. Целесообразным видится проведение экспериментов с целью выявления оптимальной комбинации.</p>
<p style="text-align: left;">Выходные нейроны представлены классами земной поверхности. Зададим слой из 7 нейронов: хвойная растительность, широколиственная растительность, мелколиственная растительность, луговая растительность, водные поверхности, с/х модификации, селитебные ландшафты.</p>
<p style="text-align: center;"><a href="https://web.snauka.ru/issues/2016/08/70887/risunok3-13" rel="attachment wp-att-70974"><img class="aligncenter size-full wp-image-70974" src="https://web.snauka.ru/wp-content/uploads/2016/08/Risunok3.png" alt="" width="544" height="725" /></a>Рисунок 2. Ландшафтная карта НИП «Новое Мамангино» [11]<span style="text-align: left;"> </span></p>
<p style="text-align: left;">Начальное количество нейронов в «скрытом слое» было определено в рамках геометрического правила пирамиды, т. е. равно 6. Для целей уточнения результатов и тестирования метода проведены эксперименты с 4, 5, 7, 8 и 15 нейронами. Результаты показаны на рисунках 3 и 4.</p>
<p style="text-align: left;">При количестве нейронов в «скрытом слое» равном трем результат классификации имеет большие погрешности при сопоставлении с данными полевых исследований и космическими снимками в естественных цветах более высокого разрешения. Тонкий слой при входных нейронах, представленный каналами 3-4-5, позволяет уверенно лишь отделять луговые комплексы от лесной растительности, при этом хвойные, мелколиственные и смешанные формации не выделяются. Не выделены водные комплексы и селитебные ландшафты. Велика доля не классифицированных пикселей, что свидетельствует о недообучении нейронной сети. При синтезе входных каналов 6-5-4 результат значительно лучше: лесная растительность дифференцирована по породовому составу, выделены водные объекты, сеть имеет гораздо меньше признаков недообучения.</p>
<p>Резкое увеличение количества нейронов в «скрытом слое» до 15 для первого варианта синтеза каналов ведет к переобучению сети, что сказывается на выделении селитебных ландшафтов, в класс которых ошибочно попадают некоторые с/х угодья, сходные по спектральным характеристикам с населенными пунктами.</p>
<p style="text-align: center;"><a href="https://web.snauka.ru/wp-content/uploads/2016/08/Novyiy-tochechnyiy-risunok1.bmp"><img class="aligncenter size-full wp-image-70975" src="https://web.snauka.ru/wp-content/uploads/2016/08/Novyiy-tochechnyiy-risunok1.bmp" alt="" width="1178" height="1648" /></a></p>
<p align="center">Рисунок 3. Результат классификации территории тестового НИП  «Новое Мамангино» с помощью нейронной сети прямого распределения (каналы 3-4-5)</p>
<p style="text-align: center;" align="center"><a href="https://web.snauka.ru/wp-content/uploads/2016/08/Novyiy-tochechnyiy-risunok2.bmp"><img class="aligncenter size-full wp-image-70976" src="https://web.snauka.ru/wp-content/uploads/2016/08/Novyiy-tochechnyiy-risunok2.bmp" alt="" width="1030" height="1442" /></a>Рисунок 4. Результат классификации территории тестового НИП «Новое  Мамангино» с помощью нейронной сети прямого распределения (каналы 6-5-4)</p>
<p>Признаки переобучения характерны и для синтеза 6-5-4. Несмотря на то, что селитебные территории интерпретированы наиболее строго, в класс селитьбы классифицированы краевые части с/х ландшафтов и геокомплексов с луговой растительностью.</p>
<p>Для второй комбинации входных каналов наилучшие показатели классификации показала нейронная сеть прямого распределения с числом нейронов, рассчитанных на основе геометрического правила пирамиды. При 6 нейронах в «скрытом слое» наиболее точно из всех вариантов эксперимента выделены урочища, в растительном покрове которого преобладает хвойная растительность. Строго классифицировались геокомплексы с доминантными кустарниковыми фитоценозами. Однако не выделенными остались селитебные ландшафты сельских населенных пунктов тестового полигона. Для первой комбинации каналов наиболее оптимальной является величина «скрытого слоя», увеличенная на один нейрон. Но ошибки по всем классифицируемым классам больше, чем у второй комбинации.</p>
<p><strong>Выводы</strong></p>
<p>На основании проведенных экспериментов можно сделать ряд <strong><em>выводов</em></strong>.</p>
<p><em>Во-первых</em>, классификация космического снимка зависит от характера входных каналов. В зависимости от характера подстилающей поверхности территории необходимо использовать ту комбинацию каналов, которая наиболее подробно отражает свойства физиономичных дешифровочных признаков. Из двух сочетаний каналов, ориентированных на изучение состояния растительного покрова, обобщенный лучший результат показала комбинация 6-5-4.</p>
<p><em>Во-вторых</em>, успешность классификации зависит от архитектуры нейронной сети, т.е. от количества нейронов в «скрытом слое». Расчетная модель подбора их количества (использование геометрического правила пирамиды) не всегда дает наилучший результат, однако количество нейронов, подобранное таким путем может служить ориентиром для эмпирического подбора, т. к. размер слоя, сильно отличающийся от формализованного, дает значительные ошибки классификации или переобученность сети.</p>
<p><em>В-третьих</em>, различные компоненты ландшафтно-экологических систем наиболее строго интерпретируются выходными нейронами при неодинаковом размере «скрытого слоя». Водные комплексы уверенно дешифрируются при значительном увеличении «скрытого слоя», в то время как основная часть объектов – при количестве нейронов, подобранном с помощью геометрического правила пирамиды, или близком к нему.</p>
<p><em>В-четвертых</em>, применение нейронной сети прямого распределения позволяет детектировать сложные границы урочищ в морфологической структуре ландшафтов. Так, например, однозначно по космическому снимку выделяются крутые склоны, сложенные песками в составе местности надпойменных террас, балки сырые и балки заболоченные в природных территориальных комплексах овражно-лощинно-балочной сети; котловины (древне-озерные), сложенные делювиальными, древне-озерными и торфяными отложениями и другие. По характеру увлажнения и растительным формациям уверенно детектируется граница между местностью пойм и местностью надпойменной террасы.</p>
<p>Таким образом, использование нейронных сетей прямого распределения для дешифрирования и интерпретации данных ДЗЗ сопряжено с рядом задач по планированию топологии сети, определению состава ее слоев. Проведенные эксперименты показали необходимость рекогносцировки формализовано рассчитанной архитектуры для целей более четкого выделения классов поверхности – выходных нейронов.</p>
</div>
]]></content:encoded>
			<wfw:commentRss>https://web.snauka.ru/issues/2016/08/70887/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Разработка сверточной нейронной сети для распознавания изображений карточной масти</title>
		<link>https://web.snauka.ru/issues/2024/06/102200</link>
		<comments>https://web.snauka.ru/issues/2024/06/102200#comments</comments>
		<pubDate>Fri, 14 Jun 2024 05:36:28 +0000</pubDate>
		<dc:creator>Бадрисламов Денис Игоревич</dc:creator>
				<category><![CDATA[05.00.00 ТЕХНИЧЕСКИЕ НАУКИ]]></category>
		<category><![CDATA[архитектура нейронной сети]]></category>
		<category><![CDATA[гиперпараметры обучения]]></category>
		<category><![CDATA[дальнейшие исследования]]></category>
		<category><![CDATA[классификация карточной масти]]></category>
		<category><![CDATA[компьютерное зрение]]></category>
		<category><![CDATA[обработка изображений]]></category>
		<category><![CDATA[предобработка данных]]></category>
		<category><![CDATA[применение в азартных играх и анализе игры в карты]]></category>
		<category><![CDATA[распознавание образов]]></category>
		<category><![CDATA[сверточная нейронная сеть]]></category>
		<category><![CDATA[точность и эффективность модели]]></category>

		<guid isPermaLink="false">https://web.snauka.ru/issues/2024/06/102200</guid>
		<description><![CDATA[Научный руководитель: Вильданов Алмаз Нафкатович к.ф.-м.н., Уфимский университет науки и технологий, Нефтекамский филиал Современные технологии искусственного интеллекта (ИИ) и машинного обучения (МО) приобретают все большую популярность и находят применение в различных сферах деятельности. Одним из наиболее перспективных направлений является использование нейронных сетей для решения задач распознавания и классификации. В данной статье рассматриваются возможности и методы применения нейронных [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: center;"><em>Научный руководитель: </em><em>Вильданов Алмаз Нафкатович<br />
</em><span><em>к.ф.-м.н., </em></span><em>Уфимский университет науки и технологий, Нефтекамский филиал</em></p>
<p style="text-align: justify;"><span>Современные технологии искусственного интеллекта (ИИ) и машинного обучения (МО) приобретают все большую популярность и находят применение в различных сферах деятельности. Одним из наиболее перспективных направлений является использование нейронных сетей для решения задач распознавания и классификации. В данной статье рассматриваются возможности и методы применения нейронных сетей для распознавания изображений карточных мастей.<br />
</span></p>
<p style="text-align: justify;"><span>Для разработки и обучения нейронных сетей широко используется библиотека TensorFlow, предоставляемая Google. Она обеспечивает высокую производительность и гибкость при создании сложных моделей МО. TensorFlow поддерживает работу как на CPU, так и на GPU, что позволяет значительно ускорить процесс обучения нейронных сетей.<br />
</span></p>
<p style="text-align: justify;"><span>Google Colab предоставляет удобную среду для разработки и обучения моделей машинного обучения. Это облачный сервис, который позволяет использовать мощные вычислительные ресурсы Google без необходимости установки дополнительного программного обеспечения. Colab поддерживает работу с Jupyter Notebook и позволяет совместно работать над проектами в реальном времени​.<br />
</span></p>
<p style="background: white;"><span style="color: black;">Данная статья посвящена разработке и обучению сверточной нейронной сети (СНС) для эффективного распознавания изображений карточной масти. Распознавание масти игральных карт является важной задачей в различных областях, таких как автоматический анализ игры в карты, системы компьютерного зрения и приложения для азартных игр. В работе представлена архитектуры НС, специально разработанные для решения задачи классификации карточной масти. Сеть состоит из чередующихся сверточных и подвыборочных слоев, а также полносвязных слоев для итоговой классификации. Автор уделяет особое внимание выбору оптимальной архитектуры, гиперпараметров и методов предобработки изображений для повышения точности распознавания. Экспериментальная часть статьи описывает процесс обучения и тестирования предложенной СНС на наборе данных игральных карт. Приводятся результаты сравнительного анализа производительности модели в сравнении с другими методами классификации.<br />
</span></p>
<p style="text-align: justify;"><span>Первым шагом в создании системы распознавания является сбор и подготовка данных. Для обучения нейронной сети необходим большой объем данных, содержащий изображения карточных мастей. Эти данные проходят этапы предобработки, включая нормализацию и аугментацию, что улучшает качество модели и её способность к обобщению.<br />
</span></p>
<p style="text-align: justify;"><span><span>Формат данных выборки для обучения </span><span>train.csv</span><span> выглядит следующим образом: каждая строка представляет собой описание одного изображения; первый столбец содержит метки классов, к которым принадлежит изображение; оставшиеся столбцы содержат пиксельные значения изображения, например, в виде плоского вектора, где каждое значение соответствует яркости соответствующего пикселя на изображении [1].<br />
</span></span></p>
<p style="text-align: justify;"><span>У нас будут следующие классы изображений:<br />
</span></p>
<p style="text-align: justify;"><span>classes = ["червы","бубны","пики","трефы"]<br />
</span></p>
<p style="text-align: justify;"><span>Загрузим и посмотрим на датасет (рисунок 1):<br />
</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2024/06/061424_0515_1.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рисунок 1 – Датасет изображений карточных мастей<br />
</span></p>
<p style="text-align: justify;"><span>После подготовки данных, создаются и обучаются модели нейронных сетей. Используются различные архитектуры, такие как сверточные нейронные сети (CNN), которые особенно эффективны в задачах распознавания образов. Обучение модели проводится на обучающем наборе данных с последующей проверкой на валидационном наборе для оценки её производительности.<br />
</span></p>
<p style="text-align: justify;"><span>Работа нейронной сети рассматривается в трех моделях.<br />
</span></p>
<p style="text-align: justify;"><span>1.    Двухслойная нейронная сеть.<br />
</span></p>
<p style="text-align: justify;"><span><span>На первом шаге рассматривается сеть из двух нейронных слоев [2]. Для создания модели используется класс </span><span>Sequential</span><span>. На входном слое находятся 700 нейронов. Функция активации (запуска) </span><span>relu</span><span>, размер входных данных равен 400 (у нас картинки 20 на 20). На последнем слое должно быть 4 нейрона, так как это количество должно совпадать с количеством классификаций изображений [3] (у нас четыре изображения мастей). Модель нейронной сети строится с помощью класса </span><span>Sequential</span><span> [4].<br />
</span></span></p>
<p style="text-align: justify;"><span>N = 4<br />
</span></p>
<p style="text-align: justify;"><span>model = Sequential()<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Dense(700, input_dim=400, activation=&#8221;relu&#8221;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Dense( N, activation=&#8221;softmax&#8221;))<br />
</span></p>
<p>Приступаем к обучению модели с помощью метода <span>fit </span>модели (рисунок 2).</p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2024/06/061424_0515_2.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рисунок 2 – Ход обучения нейронной сети<br />
</span></p>
<p style="text-align: justify;"><span>Можно посмотреть, как нейронная сеть делает предсказание на тестовых данных. Для этого применяется метод predict:<br />
</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2024/06/061424_0515_3.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рисунок 3 – Валидация нейронной сети<br />
</span></p>
<p style="text-align: justify;"><span>2. Трехслойная нейронная сеть.<br />
</span></p>
<p style="text-align: justify;"><span><span>Усложним нейронную сеть, сделав 3 слоя. Рассматривается сеть из трех нейронных слоев:</span><span><br />
</span></span></p>
<p style="text-align: justify;"><span>model = Sequential()<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Dense(700, input_dim=400, activation=&#8221;relu&#8221;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Dense(80, activation=&#8221;relu&#8221;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Dense( N, activation=&#8221;softmax&#8221;))<br />
</span></p>
<p style="text-align: justify;"><span>Остальные шаги проделываются аналогично.<br />
</span></p>
<p style="text-align: justify;"><span>3. Сверточная нейронная сеть.<br />
</span></p>
<p style="text-align: justify;"><span>Полносвязная нейронная сеть недостаточно качественно выполняет работу с изображениями. Прогресс обучения двуслойной нейронной сети и трехслойной нейронной сети растет достаточно медленно, за счет увеличения количества слоев. Более качественный результат можно получить, построив сверточную нейронную сеть:<br />
</span></p>
<p style="text-align: justify;"><span>model = Sequential()<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Conv2D(32, (3, 3),<br />
</span></p>
<p style="text-align: justify; margin-left: 35pt;"><span>input_shape=(img_width, img_height, 1), activation=&#8217;relu&#8217;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(MaxPooling2D(pool_size=(2,2)))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Conv2D(64, (3, 3), activation=&#8217;relu&#8217;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(MaxPooling2D(pool_size=(2, 2)))<br />
</span></p>
<p style="text-align: justify;"><span>model.add(Flatten())<br />
</span></p>
<p style="text-align: justify;"><span>model.add( Dense( 200, activation = &#8216;relu&#8217;))<br />
</span></p>
<p style="text-align: justify;"><span>model.add( Dense( N, activation=&#8217;softmax&#8217;))<br />
</span></p>
<p style="text-align: justify;"><span>Обучение проводится аналогично. По итогам распознавания собственных изображений можно сделать следующий вывод (таблица 1):<br />
</span></p>
<p><span style="color: black;">Таблица 1 – Качество распознавания изображений нейронными сетями<br />
</span></p>
<div style="margin-left: 5pt;">
<table style="border-collapse: collapse;" border="0">
<colgroup>
<col style="width: 328px;" />
<col style="width: 412px;" /></colgroup>
<tbody valign="top">
<tr>
<td style="padding-left: 9px; padding-right: 9px; border: solid 1pt;">
<p style="text-align: center;"><span>Структура НС</span></p>
</td>
<td style="padding-left: 9px; padding-right: 9px; border-top: solid 1pt; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;" valign="middle">
<p style="text-align: center;"><span style="color: black;">Качество распознавания</span></p>
</td>
</tr>
<tr>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: justify;"><span style="times new roman; 10pt; background-color: white;">Полносвязная нейронная сеть из двух слоев </span></p>
</td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: center;"><span>99.69 %</span></p>
</td>
</tr>
<tr>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: justify;"><span style="times new roman; 10pt; background-color: white;">Полносвязная нейронная сеть из трех слоев </span></p>
</td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: center;"><span>99.75 %</span></p>
</td>
</tr>
<tr>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: justify;"><span style="times new roman; 10pt; background-color: white;">Сверточная нейронная сеть с двумя сверточными слоями</span></p>
</td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;">
<p style="text-align: center;"><span>99.94 %</span></p>
</td>
</tr>
</tbody>
</table>
</div>
<p style="text-align: justify;"><span>Подготовим также в Paint собственные изображения и загрузим их на гугл-диск (рисунок 4).<br />
</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2024/06/061424_0515_4.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span style="color: black;">Рисунок 4 – Собственные изображения для проверки<br />
</span></p>
<p style="text-align: center;"><span style="color: black;">работы нейронной сети<br />
</span></p>
<p style="text-align: justify;"><span>Обученная нейронная сеть используется для распознавания изображений на новых данных. Модель анализирует входное изображение и выдает прогнозируемую масть с определенной вероятностью. Точность распознавания оценивается на тестовом наборе данных, который не использовался в процессе обучения, что позволяет объективно оценить её эффективность.<br />
</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2024/06/061424_0515_5.png" alt="" /><span><br />
</span></p>
<p style="text-align: center;"><span>Рисунок 5 – Распознавание и предсказание нейронной сети<br />
</span></p>
<p style="text-align: justify;"><span>Сверточная нейронная сеть будет, как и ожидалось, будет давать наилучшее предсказание.<br />
</span></p>
<p style="text-align: justify;"><span>Заключение. Разработка и использование нейронных сетей для распознавания изображений карточных мастей демонстрирует высокую эффективность и перспективность данного подхода. Применение библиотек TensorFlow и сервисов, таких как Google Colab, значительно упрощает процесс создания и обучения моделей машинного обучения. Эти технологии открывают новые возможности для автоматизации процессов и повышения точности распознавания в различных приложениях.</span></p>
]]></content:encoded>
			<wfw:commentRss>https://web.snauka.ru/issues/2024/06/102200/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
