УДК 004.04

АЛГОРИТМ БАЗОВОГО АНАЛИЗА ДАННЫХ СОЦИОЛОГИЧЕСКОГО ОПРОСА В ПРОГРАММЕ MS EXCEL

Чуднова Ольга Владимировна
Сахалинский государственный университет
старший преподаватель кафедры социологии

Аннотация
Статья посвящена описанию процесса обработки первичной социологической информации, получаемой в ходе интервью, анкетирования и иных количественных методов с помощью прикладной компьютерной программы Microsoft Office Excel. Проведенный анализ позволяет утверждать, что высокая адаптивность и простота работы с данным программным обеспечением позволяет решать множество разнообразных задач, необходимых для социолога-практика.

Ключевые слова: Анализ и обработка данных, конкретные социологические исследования, работа с первичной информацией.


ALGORITHM OF OPINION POLL DATA BASIC ANALYSIS IN MS EXCEL PROGRAM

Chudnova Olga Vladimirovna
Sakhalin State University
Senior Lecturer, Sociology Department

Abstract
The article describes processing of primary sociological information obtained through interviews, questionnaires and other quantitative methods using Microsoft Office Excel application. Performed analysis allows to state that high adaptability and ease of use of this software enable to solve a wide variety of Sociological Practitioner’s tasks.

Keywords: Data analysis and processing, sociological case studies, working with primary information


Рубрика: 22.00.00 СОЦИОЛОГИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
Чуднова О.В. Алгоритм базового анализа данных социологического опроса в программе MS Excel // Современные научные исследования и инновации. 2015. № 4. Ч. 5 [Электронный ресурс]. URL: http://web.snauka.ru/issues/2015/04/45596 (дата обращения: 28.09.2017).

В ходе проведения массовых социологических опросов перед исследователями нередко возникает проблема, связанная с обработкой больших совокупностей полученных данных и их преобразованием из рукописного вида в электронный, машиночитаемый формат.

К сожалению, практически все специализированные программы для обработки социологической информации (SPSS, Statistica, Vortex, PolyAnalyst и др.) распространяются на коммерческой основе, предъявляют серьезные требования к техническим характеристикам персональных компьютеров и зачастую не имеют русифицированного файла помощи.

В связи с этим возрастает необходимость обращения к программному обеспечению, имеющемуся на большинстве современных ЭВМ и позволяющему решать различные задачи необходимые социологу-практику.  Одной из таковых программ является Microsoft Office Excel (Excel).

Обработка первичной социологической информации полученной в ходе опроса происходит в Excel в несколько этапов.На первом этапе необходимо пронумеровать все анкеты подлежащие анализу, для постоянного контроля ввода данных и возможности их своевременного корректирования. Далее необходимо «закрыть» все открытые вопросы анкеты, объединив ответы респондентов в группы [1, с. 434-437].Так, при ответе на открытый вопрос «Сколько лет Вы трудитесь в вузе?» человек может указать точный стаж, который социолог для удобства анализа отнесет в группы: «менее 5 лет», «5-10 лет», «11-16 лет», «17-22 года», «23 и более лет» (рис.1, вопрос 1).

Рис. 1 Фрагмент анкеты

Когда все открытые вопросы анкеты приведены в «закрытый» вид, следует присвоить числовой код каждому варианту ответа в каждом вопросе, то есть закодировать его. Если вопрос задан в виде таблицы (рис 1, вопрос 3), то при его анализе необходимо каждую строку ответа кодировать как отдельный вопрос. Ведь, по сути, каждый вопрос таблицы задается респонденту как отдельный: «Насколько Вы удовлетворены заработной платой?», «Насколько Вы удовлетворены графиком работы?» и т.д. Если же респондент пропустил вопрос или не смог ответить на него, то код отсутствию ответа не присваивается.

На втором этапе происходит формирование базы данных социологического опроса в Excel.

В первый столбец матрицы необходимо внести номера анкет, а в первую строку – краткие формулировки вопросов или их номера. Таким образом, каждой строке матрицы соответствует одна анкета, а каждому столбцу – один вопрос или подвопрос (рис. 2).

Рис. 2. Фрагмент базы данных социологического опроса в Excel

Поскольку во втором вопросе анкеты (рис.1) респондент может выбрать несколько вариантов, вопрос необходимо разбить на колонки по числу вариантов ответа (подвопросы).

При обработке вопроса заданного в виде таблицы, следует разбивать его на подвопросы по количеству строк.

Затем в матрицу вносятся данные всех анкет в соответствии с ранее произведенным кодированием.

Таким образом, согласно нашей матрице, респондент заполнивший анкету № 2, имеющий стаж работы более 23 лет, выбрал в качестве ответов на второй вопрос варианты №2, 4, 6 (возможность сделать хорошую карьеру, интерес к науке, свободный график работы и возможность совместительства). Он же удовлетворен заработной платой; скорее удовлетворен графиком работы; не удовлетворен разнообразием выполняемой деятельности; скорее не удовлетворен возможностями карьерного роста.

Для удобства формирования базы данных социологического опроса рекомендуется закреплять первую строку матрицы (вкладка «Вид» → «Закрепить области» → «Закрепить верхнюю строку») (рис. 3), что позволит всегда видеть заголовок таблицы.

Рис. 3 Матрица данных с закрепленным заголовком

Кроме того, если в анкете присутствует значительное количество вопросов, требующих разбивки в матрице данных, эти вопросы желательно выделять одним цветом (щелчок левой кнопкой мыши по столбцу выделяет его, далее во вкладке «Главная» выбираем «Заливка» и необходимый цвет).

На третьем этапе  исследователем должен быть осуществлен поиск и устранение ввода ошибочных значений. Реализуется такая процедура с помощью функции «Условное форматирование», она позволяет выделить цветом все ячейки, содержащие ошибку. Согласно нашей кодировке в вопросе № 1 в матрице данных могут присутствовать только значения 1-5. Все иные цифры являются ошибочными и должны быть исправлены. Для поиска иных значений в вопросе №1 выделим его щелчком мыши. Далее перейдем во вкладку «Главная» → «Условное форматирование» → «Создать правило». В открывшемся окне отметим «Форматировать только ячейки, которые содержат» в полях раздела «Форматировать только ячейки, для которых выполняется следующее условие», выберем «значение ячейки», «вне», «1», «5». Затем выберем требуемый формат, например фон. При нажатии кнопки «OK», Excel выделит зеленым ошибочные значения. (Рис. 4).

 Рис. 4. Поиск ошибок ввода данных

На четвертом этапе происходит непосредственная обработка социологической информации. Для подсчета процентного распределения ответов на вопросы, предполагающие только один ответ, необходимо пользоваться функцией «СЧЕТЕСЛИ». Для этого под таблицей, в столбце «№ анкеты» прописываем номера вариантов ответа на вопросы. Во втором столбце прописываем формулу (рис. 5). В нашем примере формула подсчета первого варианта ответа на вопрос о стаже работы будет иметь следующий вид:

=СЧЁТЕСЛИ(B2:B11;1)/10, где

B2:B11- столбец, в котором находятся интересующие нас ответы;

1 – номер варианта ответа, процент которого необходимо посчитать;

10 – общее количество анкет.

Для подсчета второго варианта, формула приобретет значение: =СЧЁТЕСЛИ(B2:B11;2)/10. Полученное число необходимо перевести в процентный формат: вкладка «Главная» → «Процентный формат».

Когда все варианты ответа в первом столбце просчитаны, формулу можно растянуть вправо для подсчета процентов по всем вопросам, предполагающим один ответ.

Рис. 5 Подсчет процентного распределения ответов на вопросы, предполагающие один вариант

Если вопрос предполагает множественный ответ, то расчет процентного соотношения ответов рассчитывается следующим образом: сначала необходимо узнать, сколько всего ответов дали респонденты при ответе на вопрос. Для этого воспользуемся счетом заполненных ячеек, с помощью формулы: =СЧЁТЗ(C2:J11), где C2:J11- диапазон столбцов, в которых находятся интересующие нас ответы.

Далее применим формулу использованную ранее. Для подсчета процентного распределения первого варианта ответа во втором вопросе анкеты, формула будет иметь вид:

=СЧЁТЕСЛИ(C2:C11;1)/27, где

C2:C11 – диапазон столбцов, в которых находятся интересующие нас ответы;

1- номер варианта ответа, процент которого необходимо посчитать;

27 – сумма всех ответов на вопрос № 2. (Рис.6)

Рис. 6 Подсчет процентного распределения ответов на вопрос, предполагающий множественный ответ.

Если в ходе исследования социологу необходимо определить связь между признаками, например, выяснить, сколько респондентов со стажем работы от 5 до 10 лет полностью удовлетворены заработной платой (столбец В3-1), необходимо пользоваться формулой вида:

=СЧЁТЕСЛИМН(B2:B11;2;K2:K11;1)/СЧЁТЕСЛИ(B2:B11;2), где

B2:B11 – диапазон столбцов, в которых находятся ответы о стаже работы;

2 – код ответа, обозначающий стаж работы от 5 до 10 лет;

K2:K11- диапазон столбцов, в которых находятся ответы об удовлетворенностью заработной платой;

1 – код ответа, обозначающий полную удовлетворенность заработной платой.

Таким образом, с помощью программы MS Excel, социолог может в сжатые сроки базовый анализ данных, интерпретировать значительные числовые массивы, полученные в ходе эмпирических исследований. Высокая адаптивность и простота работы, легкость экспорта данных, как между пользователями, так и между другими программными продуктами, позволяет реализовать на практике любой метод количественных исследований и решить большую часть задач, встречающихся в работе социолога.


Библиографический список
  1. Рабочая книга социолога / под ред. Г.В. Осипова. Изд. 4-е, стереотипное. – М.: КомКнига, 2006. – 480 с.


Все статьи автора «Чуднова Ольга Владимировна»


© Если вы обнаружили нарушение авторских или смежных прав, пожалуйста, незамедлительно сообщите нам об этом по электронной почте или через форму обратной связи.

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться: