<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современные научные исследования и инновации» &#187; Абраев Айдар Фаритович</title>
	<atom:link href="http://web.snauka.ru/issues/author/author8432/feed" rel="self" type="application/rss+xml" />
	<link>https://web.snauka.ru</link>
	<description></description>
	<lastBuildDate>Fri, 17 Apr 2026 07:29:22 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Прогнозирование урожайности дикой черники с использованием методов машинного обучения</title>
		<link>https://web.snauka.ru/issues/2025/04/103223</link>
		<comments>https://web.snauka.ru/issues/2025/04/103223#comments</comments>
		<pubDate>Tue, 22 Apr 2025 09:24:42 +0000</pubDate>
		<dc:creator>Абраев Айдар Фаритович</dc:creator>
				<category><![CDATA[05.00.00 ТЕХНИЧЕСКИЕ НАУКИ]]></category>
		<category><![CDATA[Kaggle]]></category>
		<category><![CDATA[агроаналитика]]></category>
		<category><![CDATA[агротехнологии]]></category>
		<category><![CDATA[дикая черника]]></category>
		<category><![CDATA[климатические данные]]></category>
		<category><![CDATA[машинное обучение]]></category>
		<category><![CDATA[нормализация данных]]></category>
		<category><![CDATA[прогнозирование урожайности]]></category>
		<category><![CDATA[случайный лес]]></category>
		<category><![CDATA[экология]]></category>

		<guid isPermaLink="false">https://web.snauka.ru/issues/2025/04/103223</guid>
		<description><![CDATA[Введение Прогнозирование урожайности сельскохозяйственных культур является одной из ключевых задач агроаналитики. Особую актуальность приобретает оценка урожайности дикорастущих ягод, таких как черника, которая обладает высокой пищевой и лекарственной ценностью. В рамках соревнования на платформе Kaggle [1] участникам предлагалось спрогнозировать урожайность дикой черники по множеству природных и климатических факторов. Методология Обработка данных Были использованы данные из файлов [...]]]></description>
			<content:encoded><![CDATA[<p><span><strong>Введение</strong><br />
</span></p>
<p><span>Прогнозирование урожайности сельскохозяйственных культур является одной из ключевых задач агроаналитики. Особую актуальность приобретает оценка урожайности дикорастущих ягод, таких как черника, которая обладает высокой пищевой и лекарственной ценностью. В рамках соревнования на платформе Kaggle [1] участникам предлагалось спрогнозировать урожайность дикой черники по множеству природных и климатических факторов.<br />
</span></p>
<p><span><strong>Методология</strong><br />
</span></p>
<p><span><strong>Обработка данных</strong><br />
</span></p>
<p><span>Были использованы данные из файлов train.csv и test.csv, содержащих характеристики окружающей среды: температура, влажность, кислотность почвы и др. После исключения неинформативных столбцов и идентификаторов была проведена стандартизация признаков.<br />
</span></p>
<p><span>Таблица 1. Основные этапы обработки данных<br />
</span></p>
<div>
<table style="border-collapse: collapse;" border="0">
<colgroup>
<col style="width: 373px;" />
<col style="width: 373px;" /></colgroup>
<tbody valign="top">
<tr style="height: 41px;">
<td style="padding-left: 9px; padding-right: 9px; border-width: 1pt 0.5pt 1pt 1pt; border-style: solid; border-color: initial; text-align: center;"><strong>Этап обработки</strong></td>
<td style="padding-left: 9px; padding-right: 9px; border-top: 1pt solid; border-left: none; border-bottom: 1pt solid; border-right: 0.5pt solid; text-align: center;"><strong>Описание</strong></td>
</tr>
<tr style="height: 67px;">
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Импорт данных</span></td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Загрузка из файлов train.csv и test.csv</span></td>
</tr>
<tr style="height: 67px;">
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Определение признаков</span></td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Исключение столбца id, выбор числовых признаков</span></td>
</tr>
<tr style="height: 94px;">
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Масштабирование</span></td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Стандартизация признаков по среднему и стандартному отклонению</span></td>
</tr>
<tr style="height: 68px;">
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: solid 1pt; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Разделение выборки</span></td>
<td style="padding-left: 9px; padding-right: 9px; border-top: none; border-left: none; border-bottom: solid 1pt; border-right: solid 1pt;"><span>Обучающая и тестовая выборка разделены по принципу задания</span></td>
</tr>
</tbody>
</table>
</div>
<p><span>Визуализация данных<br />
</span></p>
<p><span>Для лучшего понимания распределения и взаимосвязей между признаками на этапе анализа данных были построены графики распределения, тепловые карты корреляции и диаграммы рассеяния. Это позволило выявить потенциальные зависимости между климатическими переменными и уровнем урожайности.<br />
</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2025/04/042225_0920_1.png" alt="" /><span><strong><br />
</strong></span></p>
<p style="text-align: center;"><span>Рисунок 1. Тепловая карта корреляции признаков<br />
</span></p>
<p><span>Такие визуализации не только помогают в интерпретации данных, но и позволяют лучше понять значимость отдельных признаков при построении модели.<br />
</span></p>
<p><span>Выбор модели и настройка гиперпараметров<br />
</span></p>
<p><span>На этапе выбора модели было протестировано несколько алгоритмов: линейная регрессия, градиентный бустинг и случайный лес. Последний показал наилучшие результаты при разумном времени обучения. Гиперпараметры модели (число деревьев, глубина, случайное состояние) подбирались эмпирически с использованием кросс-валидации, что позволило избежать переобучения и повысить стабильность модели.<br />
</span></p>
<p><span>Модель и обучение<br />
</span></p>
<p><span>В качестве модели использовался алгоритм Random Forest Regressor [2], реализованный в библиотеке scikit-learn. Параметры модели:<br />
- число деревьев: 490<br />
- максимальная глубина: 7<br />
- случайное зерно: 42<br />
- количество параллельных потоков: -1</span></p>
<p>После обучения модель была применена к тестовому набору для получения предсказаний урожайности, которые были сохранены в формате csv для последующей отправки на Kaggle.</p>
<p><span><strong>Результаты</strong><br />
</span></p>
<p><span>Модель показала устойчивость к переобучению и высокую точность предсказаний на основе валидированных метрик: средняя абсолютная ошибка (MAE) и коэффициент детерминации (R²). Хотя точные оценки производительности были недоступны из-за отсутствия меток в тестовой выборке, модель успешно прошла конкурсную валидацию Kaggle.<br />
</span></p>
<p><span><strong>Возможности и перспективы развития<br />
</strong></span></p>
<p><span>Разработанная модель может быть интегрирована в геоинформационные системы (ГИС) для визуального отображения прогнозов урожайности в различных регионах. Также модель может быть адаптирована для других культур, что позволит расширить область её применения. С дальнейшим накоплением данных возможно применение более сложных нейросетевых архитектур, таких как LSTM или трансформеры, для учёта временных изменений и предсказаний на будущие сезоны.<br />
</span></p>
<p><span><strong>Заключение</strong><br />
</span></p>
<p><span>Использование алгоритма случайного леса для задачи прогнозирования урожайности дикой черники показало свою практическую состоятельность. Предложенный подход может быть расширен на другие дикорастущие культуры, учитывая доступность климатических и почвенных данных. Конкурсы подобного рода способствуют развитию аналитических навыков у студентов и специалистов, а также способствуют интеграции науки и практики в области агропромышленного комплекса.</span></p>
]]></content:encoded>
			<wfw:commentRss>https://web.snauka.ru/issues/2025/04/103223/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
