«ПРОГНОЗИРОВАНИЕ ВЫЖИВАЕМОСТИ НА «ТИТАНИКЕ»: КАК ДЕРЕВО РЕШЕНИЙ РАСКРЫВАЕТ ЗАКОНОМЕРНОСТИ ИСТОРИЧЕСКОЙ ТРАГЕДИИ»

Сагдатов Тимур Альбертович
Нефтекамский филиал Уфимского университета науки и технологий
студент 4 курса, Факультет экономико-математический

Аннотация
Статья посвящена практическому применению дерева решений для решения задачи бинарной классификации — прогнозирования выживаемости пассажиров легендарного лайнера «Титаник». На конкретном примере пассажирки Хельги Хирвонен подробно разбирается процесс принятия решений моделью. Показано, как такие признаки, как пол, класс и возраст, последовательно используются для построения логического пути от исходных данных к итоговому прогнозу. Статья подчеркивает не только прогнозную силу, но и высокую интерпретируемость деревьев решений.

Ключевые слова: , , , , , , , ,


Рубрика: 01.00.00 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Сагдатов Т.А. «Прогнозирование выживаемости на «Титанике»: как дерево решений раскрывает закономерности исторической трагедии» // Современные научные исследования и инновации. 2025. № 11 [Электронный ресурс]. URL: https://web.snauka.ru/issues/2025/11/103919 (дата обращения: 14.02.2026).

Научный руководитель: Вильданов Алмаз Нафкатович
к.ф.-м.н., Уфимский университет науки и технологий, Нефтекамский филиал

 

1. Задача (Постановка проблемы)

Набор данных о пассажирах «Титаника» является классическим примером в машинном обучении для задач классификации. Цель — предсказать, выжил ли пассажир (бинарная целевая переменная: 1 — выжил, 0 — не выжил), на основе его характеристик. Проблема заключается в том, чтобы выявить сложные, нелинейные взаимосвязи между множеством признаков (пол, возраст, класс и т.д.) и фактом выживания. Деревья решений идеально подходят для этой задачи, так как они позволяют наглядно представить логику, по которой принималось решение, что особенно ценно для исторического анализа.

Конкретная задача: Используя предоставленную структуру дерева решений, определить вероятную судьбу пассажирки Хельги Хирвонен на основе ее данных.

2. Теория

Дерево решений — это алгоритм машинного обучения, который решает задачу классификации или регрессии путем построения древовидной модели правил.

  • Структура: Дерево состоит из узлов (где происходит проверка условия по какому-либо признаку) и листьев (конечный результат — прогнозируемый класс).
  • Принцип работы: Начиная с корневого узла, алгоритм задает вопрос о значении определенного признака (например, «Пол <= 0.5?»). В зависимости от ответа («Да» или «Нет»), процесс перемещается в соответствующую дочернюю ветвь. Этот процесс повторяется рекурсивно, пока не будет достигнут лист, который и дает итоговый прогноз.
  • Преимущества:
  • Высокая интерпретируемость: Легко понять и объяснить логику прогноза («пассажир выжил, потому что был женщиной и путешествовал в первом классе»).
  • Не требуют масштабирования признаков.
  • Могут работать как с числовыми, так и с категориальными данными.

В данном случае категориальные признаки (например, «Пол») уже закодированы числами (Женский = 0, Мужской = 1).

3. Решение (Практическая реализация)

Проведем пассажирку Хельгу Хирвонен по предоставленному дереву решений, используя ее данные:

  • Пол: Ж (что соответствует значению 0)
  • Класс пассажира: 3
  • Возраст: 22
  • Цена билета: 12.2875
  • Братья/сестры/супруги: 1

Шаг 1: Корневой узел

  • Правило: Пол ≤ 0.5? (Т.е. является ли пассажир женщиной?)
  • Данные: Пол = Ж (0). 0 ≤ 0.5 -> ДА.
  • Переходим по левой ветви.

Шаг 2

  • Правило: Класс ≤ 2.5? (Т.е. пассажир 1-го или 2-го класса?)
  • Данные: Класс = 3. 3 ≤ 2.5 -> НЕТ.
  • Переходим по правой ветви. Сразу попадаем в лист с прогнозом: Класс 1 (Выжил).

Ответ на вопрос задачи: Согласно дереву решений, пассажирка Хельга Хирвонен выжила.

Примечание: Остальные признаки (Возраст, Цена билета, Братья/сестры/супруги) в данном конкретном случае не потребовались для классификации этой пассажирки. Дерево приняло решение только на основе пола и класса.

4. Вывод

Данный пример блестяще иллюстрирует ключевые исторические и социологические закономерности катастрофы «Титаника», которые машина выявляет автоматически: приоритет при спасении отдавался женщинам и пассажирам высшего класса. Модель, основываясь всего на двух признаках, предсказала выживание Хельги Хирвонен, так как она была женщиной. Однако тот факт, что она путешествовала в третьем классе, сделал ее путь к спасению более сложным (она не прошла проверку на класс, что отбросило ее в альтернативную ветвь дерева), в отличие от женщин из первого и второго класса. Таким образом, дерево решений не только служит эффективным прогностическим инструментом, но и выступает в роли мощного средства для визуализации и анализа скрытых закономерностей в данных, делая машинное обучение понятным и интерпретируемым.


Библиографический список
  1. Дж. Вандер Плас. — «Python для сложных задач: наука о данных и машинное обучение». — СПб.: Питер, 2020.
  2. П. Тан, М. Стейнбах, В. Кумар. — «Введение в интеллектуальный анализ данных». — М.: Вильямс, 2017.
  3. Статистический анализ выживаемости пассажиров «Титаника» // Журнал "История и Математика". — 2015. — №. 4.


Все статьи автора «Сагдатов Тимур Альбертович»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте.