ЧЕРЕПАНОВ Е.В. СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ: ОБЗОР ДЛЯ СОЦИОЛОГОВ И ЭКОНОМИСТОВ

Ключевые слова: анализ данных, анализ эмпирических таблиц, непараметрические и робастные методы, оценка частот встречаемости, прикладная статистика, прогнозирование, случайность и неопределенность, случайные и квотные выборки, социально-экономические исследования

ЧЕРЕПАНОВ Е.В. СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ: ОБЗОР ДЛЯ СОЦИОЛОГОВ И ЭКОНОМИСТОВ

Рубрика: 08.00.00 ЭКОНОМИЧЕСКИЕ НАУКИ, 22.00.00 СОЦИОЛОГИЧЕСКИЕ НАУКИ

Библиографическая ссылка на статью:
// Современные научные исследования и инновации. 2012. № 2 [Электронный ресурс]. URL: https://web.snauka.ru/issues/2012/02/9786 (дата обращения: 05.06.2025).

08.00.13 «Математические и инструментальные методы в экономике»

22.00.01 «Теория, методология и история социологии»

СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ

ИССЛЕДОВАНИЯХ: ОБЗОР ДЛЯ СОЦИОЛОГОВ И ЭКОНОМИСТОВ

Е.В. Черепанов, к.т.н.

С конца 60-х гг. прошлого века до наших дней наблюдается широкое использование вероятностно-статистического формализма в задачах социально-экономического и социологического характера. При этом, в силу весьма низкой математической подготовки специалистов в этих областях, вопросы границ применимости и корректности использования стохастического формализма, как правило, остаются вне поля зрения исследователей. Впрочем, это касается почти всех областей прикладной науки, выходящих за границы физики и сопряженных с ней областей.

Например, авторы работы [1], проанализировав 200 диссертаций в области биологии и медицины, показали, что в абсолютном большинстве из них вероятностно-статистические методы применялись некорректно. Не лучшим образом дело обстоит и в научных изысканиях социально-экономического характера. Цель данной статьи автор видит в том, чтобы, не используя математический аппарат, ввести интересующихся этой проблематикой социологов и экономистов в круг проблем, связанных с использованием вероятностных методов в прикладных работах.

Следует отметить, что многие из ссылок, указанных в библиографии к этой статье, относятся к прошлому веку. Причин тому две. Во-первых, аппарат прикладной статистики особенно бурно развивался именно в 70-80-е гг. ХХ в. [2] и, во-вторых, современные статьи и книги по данной тематике, в том числе – учебники для студентов ВУЗов, в большинстве своем значительно уступают по качеству изложения работам прошлого века. По сути, многие из них – просто ухудшенное и фрагментирование изложение «старых» работ по прикладной статистике и анализу данных.

Введение

Еще в 1866 г. основоположник современной микроэкономики У. Джевонс акцентировал внимание на том, что, что социально-экономические законы «…носят настолько сложный характер, что проявляются только для совокупностей и должны изучаться методом средних» [3]. В «переводе» на современный язык эта мысль звучит так: «Социально-экономические законы носят вероятностный характер и должны изучаться статистическими методами». Этим, главным образом, и можно объяснить доминирование стохастических методов и моделей в социологических [4-7], эконометрических [8-11] и социально-экономических [12-16] исследованиях.

Одно из основных направлений использования стохастической математики в прикладных социально-экономических работах основано на применении выборочного метода [17-19]. Выборочные методики обследований населения активно используются с начала 30-х гг., когда встала необходимость изучения общественного мнения и потребительских рынков, до наших дней. Все выборочные методики базируются на законе больших чисел, который (в форме теоремы Я. Бернулли [20]) утверждает, что асимптотически выборочные частоты сходятся к истинным значениям соответствующих вероятностей. И это предполагает наличие большой серии независимых и однородных наблюдений.

Но всякий социум является структурированным (причем, по различным номинальным шкалам) множеством. В такой ситуации в любом эмпирическом исследовании решить проблему неоднородности населения (избирателей, потребителей) можно только на основе одного из двух подходов:

создав квотную выборку, репрезентативно отражающую многомерную структуру изучаемой генеральной совокупности;
при компьютерной обработке данных корректно учесть различия между структурами генеральной совокупности и выборки.

Собственно, в условиях отсутствия вычислительной техники, у пионеров выборочных исследований и выбора не было: раз рассчитывать условные вероятности не на чем, будем строить квотные выборки. Так квотная методология выборочных исследований просуществовала в почти неизменном виде до наших дней. В 70-е гг. появились компьютеры, но их применение для обработки выборочных данных свелось к использованию методов классической статистики, заимствованных из физики. А в части неоднородности данных «молча» предполагалось, что связанные с ней проблемы решены на этапе формирования квотной выборки. В этой связи вспоминается Н. Винер, который отмечал: «Успехи математической физики вызвали у социологов и экономистов чувство ревности к силе ее методов. Чувство, которое едва ли сопровождалось отчетливым пониманием интеллектуальных истоков этой силы» [21].

Причем квотная методология практически может учесть не более 3-4 априорных классификаций. И квотный подход в принципе не может дать оценок частот встречаемости качественных признаков по социально–демографическим категориям населения (покупателей, электората), а создание квотной выборки (даже по 3 – 4 социально–демографическим категориям) для населения, проживающего на большой территории, дело трудоемкое и дорогостоящее [22].

Второй подход, насколько известно автору, ни за рубежом, ни в России не нашел заметного развития. Подчеркнем, что этот подход не имеет ничего общего с «провешиванием» наблюдений, используемым для «ремонта» квотных выборок. Разработка методов стохастического описания и статистического анализа случайных выборок из совокупностей социально–экономического характера, структурированным по различным номинальным шкалам, сегодня является методически и практически важнейшей задачей.

В работе [23] автором была решена проблема статистического оценивания частот встречаемости качественных (нечисловых) признаков, подчиненных многомерному гипергеометрическому распределению, на базе использования случайных выборочных ансамблей из многомерно структурированных (неоднородных) множеств.

Сегодня среди направлений использования вероятностно-статистических методов в социально–экономических и социологических исследованиях можно (весьма условно) выделить следующие основные направления работ:

теория и методы измерений, шкалирование [24,25];
нечисловая статистика, порядковые и ранговые методы [26-30];
методы оценки параметров изучаемых совокупностей, в том числе – частот встречаемости качественных (дихотомических) признаков [31-35];
робастные [36-40] и непараметрические [41-45] статистические методы;
методы таксономии и систематизации многомерных наблюдений [46-48];
разработка теории нечеткой меры и нечетких множеств [49-51];
разработка проблемы неопределенности и теории возможностей [52-54];
методы выявления и анализа эмпирических взаимозависимостей между количественными и/или качественными признаками наблюдений [55-58];
методы снижения размерности пространства признаков [59-61];
процедуры социального и экономического прогнозирования [62-65];
разработка и внедрение конкретных математических моделей, в том числе иерархических [66-68], для социально-экономических процессов и систем.

1. Дихотомизация описания социальных процессов как сновной принцип работы с нечисловыми данными

В прикладной статистике данные подразделяют на количественные и качественные. Количественные данные обычно представляют собой массивы действительных чисел. Качественные данные, как правило, характеризуют трудно формализуемые свойства наблюдений и (в традиционном понимании) в числах не выражаются. Для измерения [24,25;69, гл.1] признаков применяются различные шкалы. Каждый из используемых типов шкал определяет группу допустимых преобразований этой шкалы. Основное требование теории измерений, гласит [69, п.1.2]: выводы, полученные на основе данных, измеренных в некоторой шкале, не должны измениться при допустимом преобразовании этой шкалы.

Показатели (признаки) измеряются в сильных и слабых шкалах [24,25]. К сильным шкалам, в которых измеряются количественные признаки, относятся [69, гл.1] абсолютные и интервальные шкалы, шкалы разностей и отношений. Измерение в сильных шкалах по существу представляет собой сопоставление результата измерения с некоторым эталоном.

Современная математика родилась в трактате Рене Декарта «Геометрия» (изданном в 1637 г. в Париже). В нем Р. Декарт изложил переосмысленные им базовые принципы античной математики. Не вдаваясь в тонкости вопроса, отметим, что для натуралистически мыслящих древнегреческих философов понятие числа «нуль» было нонсенсом. Естественно, в «Началах» Евклида о математической точке, линиях на плоскости и двумерных поверхностях нулевой толщины не могло быть и речи. Понятие числа «нуль» пришло в Европу из мавританских университетов от арабов в XII в. Использовав его в своем переосмыслении «Начал», Р. Декарт описал свое видение евклидовой геометрии, радикально отличающееся от понимания «геометрии» самим Евклидом [70].

Новое понимание геометрии позволило Р. Декарту избавиться от массы «ненужных» ему определений и понятий, необходимых античным философам для построения теории геометрических фигур в традиции натуралистической философии. Кроме «неевклидовой модели» евклидовой геометрии, Р. Декарт ввел понятия переменной величины и функции. Именно его работы позже позволили создать математику бесконечно малых величин, а затем и интегральное исчисление. Этот рывок в развитии математики, вызвавший революцию в физике и технике, а затем, в конечном итоге, породивший технократическую цивилизацию Европы, был принципиально невозможен в рамках античных геометрических представлений о «толстых» линиях. Отметим, к слову, что традиционное понимание (с современных позиций) свойств самого натурального ряда чисел также выглядит не бесспорным (см., например, [71]).

Переосмысливание основ математики Р. Декартом привело к принципиально новому пониманию самой категории «число». В античной традиции любое «число» – это количество естественных «единиц», изначально возникших при создании Мироздания. После Декарта, как впервые отметил И. Ньютон, «под числом мы понимаем не столько множество единиц, сколько отношение некоторой величины к другой величине того же рода, принятой нами за единицу» («Всеобщая арифметика или книга об арифметических синтезе и анализе»). Подробнее с древнегреческим пониманием «числа» и его связью с античной категорией «гармония» [72] можно ознакомиться по работам русского философа А.Ф. Лосева («Бытие. Имя. Космос», «Миф. Число. Сущность» и др.)

Огромный интерес представляют работы гениального русского физика-теоретика, ученика акад. А.Д. Сахарова, д.ф.-м.н. А.Т. Матвеенкова, который, используя частичный возврат к античным математическим представлениям, блестяще решил ряд современных задач квантовой механики и электродинамики (представление о чем дает работа [70]). К сожалению, по неясным соображениям А.Т. Матвеенков публикуется крайне редко.

К числу основных слабых шкал, служащим для измерения качественных признаков, относятся ранговые, порядковые и шкалы наименований (или номинальные шкалы). Предельным случаем номинальной шкалы является дихотомическая шкала, которая задается бинарным отношением на множествах [73-75] и служит для измерения булевых признаков.

В социальных исследованиях возможны обобщения понятия «измерение». Интересный взгляд был высказан Ю.Н. Толстовой и Е.В. Масленниковым [76], который состоит в том, что в широком (практически – в философском) смысле само понятие «социологическое исследование» можно понимать как «измерение» состояния изучаемого социума.

Статистический анализ качественных признаков неразрывно связан с обработкой разнотипных переменных. Методы решения этой проблемы могут быть связаны с двумя альтернативными подходами. Во-первых, процедуры «оцифровки» слабых переменных [77,78]. Но объективно усилить шкалу измерения трудно, а тип «оцифровки» существенно предопределяет итоговые результаты всего исследования. И любое усиление шкалы измерения является прямым «домысливанием за Природу» каких-то свойств изучаемой системы.

Во-вторых, подход, основанный на «дихотомизации», т.е. на ослаблении всех переменных до булевого уровня с соответствующим увеличением размерности пространства признаков. Идея подхода, который базируется на анализе статистик бинарного отношения на множествах [74,75], состоит в том, что сложный объект можно с примерно равной информативностью описать или небольшим числом сильных переменных, или большим числом слабых.

Эта мысль близка взглядам Огюста Курно, которые он полтора века назад изложил в трактате [79]. По Курно, любое сложное свойство объекта может быть представлено как суперпозиция его более простых свойств. Каждое из этих «более простых» свойств является комбинацией «еще более простых» и т.д. Таким образом, имеется возможность декомпозиции свойств объекта до некоторого «элементарного» уровня. В итоге мы получаем набор булевых переменных, описывающих изучаемую систему.

При составлении опросной анкеты любой социолог и маркетолог следует пути, указанному Огюстом Курно, реализуя дихотомизацию описания исследуемого социума. Изучение аспектов проблем доводится до того «элементарного» уровня описания, который считается достаточным для практических выводов. Таким образом, можно утверждать, что принцип дихотомизации переменных является основным методом формализации описания признаков в любом эмпирическом экономическом и социологическом исследовании, основанном на использовании слабых и разнотипных шкал.

2. Статистическое оценивание частот встречаемости дихотомических признаков по квотным и случайным выборочным ансамблям

В прикладных работах социально-экономического и маркетингового характера доминирует применение выборочного метода [17-18,23]. Отметим, что идея выборочного обследования, насколько известно автору, была впервые рассмотрена (на философском уровне) полтора века назад Ог. Курно [79, гл.9].

Поскольку до настоящего времени наблюдается тотальное использование квотных методик в социальных и маркетинговых исследованиях, остановимся на специфике их применения. Этот вопрос достаточно важен, поскольку по самому своему построению квотная выборка не является в строгом понимании полностью случайной. В этой связи вопрос о корректности использования квотных статистических оценок, основанных на асимптотических свойствах выборочных статистик (закон больших чисел), далеко не очевиден. Автором этот вопрос рассматривался в статьях [18,19] и монографиях [15,16,35,80].

Интересно и то, что автор не нашел ни в отечественной, ни в зарубежной литературе строгое математическое обоснование применению статистических выводов на квотных выборках. Лишь в монографии У. Кокрена [17] содержится (достаточно очевидное) утверждение о том, что выборочный метод (из однородных совокупностей) подчинен одномерному гипергеометрическому распределению (ГГР) [81,п.6.1.6]. Для начального пояснения понятий точности выборочного оценивания и нужного (при заданной гарантированной погрешности) объема выборки рассмотрим вначале простейший случай однородных данных, подчиненных одномерному ГГР.

«Прямые» оценки частот встречаемости булевых признаков по выборке имеют вид p = m / n, где n – мощность выборки, а m – количество наблюдений в выборке, обладающих данным дихотомическим признаком. Частота p имеет (приближенно) дисперсию вида Dp ≈ p (1- p) ( 1/n – 1/N ), где N – мощность генеральной совокупности. Для гарантированной погрешности оценки частоты встречаемости p по непараметрическому правилу «трех сигм» находим Δ ≤ 3 / (2 √ n ). Здесь учтено, что максимум дисперсии Dp достигается при значении p = 0,5. Используя это соотношение, вычисляются значения гарантированных погрешностей для оценок частот p встречаемости дихотомических признаков, подчиненных ГГР, в зависимости от n.

Интересны и «обратные» оценки: каковы должны быть объемы выборки для заданных уровней гарантированной погрешности. Из неравенства для Δ (см. выше) получаем приближение n ≤ 9 / (4 δ δ). Соответствующие данные приведены в таблице 1.

Таблица 1

Необходимые объемы выборки для заданных уровней гарантированной погрешности «прямых» оценок частот встречаемости дихотомических признаков

δ	0.005	0.01	0.02	0.03	0.04	0.05	0.10	0.15	0.20
n	90 000	22 500	5 600	2 500	1 400	600	225	100	56

Заметим, что для (традиционных в социологии и маркетинге) объемов выборки порядка 1.5 – 2.0 тыс. респондентов гарантированная погрешность частоты равна примерно 3.5%, как обычно и указывается в публикациях. Но для точности оценок в 2% нужно уже порядка 5.5 тыс. наблюдений, а гарантия погрешности в 1% потребует опроса 22.5 тыс. респондентов.

Важно, что если нас интересуют статистические выводы по некоторой немногочисленной категории населения, то численность этой категории в репрезентативной выборке должна составлять (при разумной точности в 5%) не менее 600 (!) человек. Это значит, например, что для категории, которая составляет менее 5% населения (скажем, «научные работники в Туве» или «евреи в Хакасии») нам потребуется квотная выборка более 12 тыс. человек. Методом квотного опроса это нереализуемо. И не поможет использование даже самых лучших пакетов прикладных статистических программ [82].

Причем, по самому их построению квотные выборки, строго говоря, не являются случайными. Поясним: случайный отбор – это метод формирования выборки, при котором каждый элемент генеральной совокупности с равной (теоретически) вероятностью может попасть в выборочный ансамбль. Что не наблюдается (даже приближенно) при формировании квотной выборки.

Следовательно, корректность полученных на них статистических выводов требует серьезного обоснования. Автор в статьях [18,19] нашел распределение квотного отбора и показал, что это распределение в принципе несводимо в ГГР. Следует ли отсюда, что квотный опрос со стохастической точки зрения некорректен для оценки частоты встречаемости признака в генеральной совокупности? Нет, не следует. В статьях [18,19] строго доказано, что квотная выборочная частота появления данного дихотомического признака является состоятельной и несмещенной оценкой его истинной частоты встречаемости. И здесь же показано, что погрешность квотного оценивания имеет величину, которая совпадает с гарантированной погрешностью случайного формирования одномерной и однородной выборки, подчиненной ГГР (см. несколько выше)

Резюмируя сказанное, отметим, что использование квотного отбора правомерно с формальных теоретико - вероятностных позиций. Однако применение квотного выборочного метода сопряжено с

низкой точностью получаемых результатов для населения в целом;
невозможностью получить оценки частот встречаемости качественных признаков по социально–демографическим категориям населения;
высокой трудоемкостью формирования выборочного ансамбля;
низкой оперативностью и высокой стоимостью получения данных.

В статьях [23,82,83] и монографиях [35,80] предложено и строго обосновано математическое описание полностью случайного формирования выборочного ансамбля из элементов структурированной (по большому числу номинальных шкал) генеральной совокупности на основе многомерных обобщений ГГР.

При небольших, относительно мощности генеральной совокупности, объемах выборочных ансамблей многомерное ГГР практически без потери точности может быть заменено полиномиальным распределением (ПР). Замена правомерна [81, с.104] при n < 0.1 N, что фактически всегда выполняется в социологических, электоральных и маркетинговых исследованиях.

В работах [23,80,82-84] дано обоснование случайного формирования выборки на основе использования многомерных обобщений ПР. Здесь же приведены методы получения оценок частот встречаемости дихотомических признаков на основе разработанных многомерных обобщений ГГР и ПР. Причем, и для всего населения (покупателей, электората) заданного региона, и для его социально-демографических категорий, данные по которым (например, по переписи населения РФ) есть в Росстате и указанны в «паспорте» анкеты.

Применение указанной методологии в приложениях:

в разы повышает точность оценки частот встречаемости качественных признаков по населению изучаемого региона в целом;
дает возможность получить оценки частот встречаемости признаков по априорным социально–демографическим категориям населения;
повышает оперативность «полевых» работ и снижается их себестоимость.

Достаточные представления о прикладных возможностях методики стохастического анализа случайных выборочных ансамблей из неоднородных совокупностей можно составить, например, по статьям [85,86].

3. Специфика использования стохастического формализма в маркетинговых и социально-экономических исследованиях

А.Н. Колмогоров подчеркивал, что история теории вероятностей «начинается с закона больших чисел Я. Бернулли и найденного вскоре после этого Муавром нормального приближения к биномиальному распределению» (из предисловия к юбилейному изданию трактата Я. Бернулли [20]). Откуда следует, что для корректного использования любой выборочной методологии необходимо наличие большой серии однородных и независимых испытаний. Но в прикладных работах исследователь часто располагает лишь малой выборкой существенно неоднородных наблюдений, эмпирическое распределение которых плохо описывается гауссовой кривой. В этих (весьма типичных) ситуациях использование аппарата классической математической статистики не только не приносит пользы, но приносит вред, создавая у математически неискушенного исследователя иллюзию объективности и точности полученных им результатов.

С начала 70-х гг. осознание этого факта заставило понимать под методами прикладной статистики [10,28,46,47,69,87] математический инструментарий, отличный от методов математической статистики [31,88,89]. Однако, можно констатировать, что классические методы математической статистики до наших дней широко используются (на малых объемах весьма неоднородных данных) в прикладных исследованиях, в том числе – в социально-экономических областях знания. Эта ситуация заставила классика статистики ХХ в. Джона Уилдера Тьюки [90] с сарказмом отметить, что «слишком часто статистическую теорию ошибочно называют «математической статистикой», относительно которой многие практики придерживаются той опасной позиции, что работа может быть хорошей «математической статистикой», не будучи ни хорошей математикой, ни хорошей статистикой».

Осознание принципиальных различий между математической и прикладной статистикой в 70-80 гг. стало настолько велико, что появилось мнение о том, что естественнонаучной традиции более соответствует не теоретико-множественное описание вероятности по А.Н. Колмогорову [91,92], а статистическое описание по Мизесу [93] – Смирнову [94] – Виллю – Постникову [95-97]. Наиболее последовательно эти взгляды отстаивали известные математики В.Н. Тутубалин [98,99] и Ю.И. Алимов [100-102].

При статистической обработке данных, не относящихся к физическим измерениям, возникает целый ряд принципиальных трудностей [103,104]: малые объемы выборочной информации, значительная неоднородность наблюдений, существенные отклонения эмпирических распределений от модельного (обычно, гауссового), наличие ошибок и неточностей в таблицах данных, принципиально плохая формализуемость изучаемых категорий.

В этой связи в 40-60-е годы ХХ в. возник острый интерес к «свободным от распределения» методам статистического анализа Прежде всего, к процедурам выборочного оценивания, свободным от распределения [105,106]. Под свободой от распределения понимается корректность статистической процедуры для любого (в разумных пределах понимания) эмпирического распределения. При этом на метод накладывается условие: процедура оценивания должна быть стабильной (устойчивой) к вариациям состава выборочного ансамбля.

Из свободных от распределения методов наиболее развит аппарат непараметрической статистики [41-45]. «Свободный от распределения» - понятие более сильное, чем «непараметрический», хотя на практике эти термины часто используются как синонимы. Непараметрические процедуры не требуют априорных знаний об изучаемом эмпирическом распределении, но накладывают на него лишь некоторые общие ограничения (типа существования производных до некоторого порядка включительно, отсутствия несчетного числа разрывов функции плотности вероятностей и т.п.). Превосходным вводным курсом в непараметрическую статистику может служить монография Я. Гаека [41], но она, к сожалению, никогда не издавалась на русском языке.

Допустимо считать, что смысл непараметрической статистики состоит в том, что, за счет «огрубления» описания, достигается повышение стабильности (надежности) получаемых результатов выборочного оценивания.

Наиболее типичная задача прикладной статистики состоит в оценивании интегрального функционала, зависящего от (аналитически неизвестной) функции плотности вероятностей [42]. На практике, по-видимому, для непараметрического оценивания линейных интегральных функционалов такого рода наиболее часто используются методы Розенблатта – Парзена [43, п.8.5]. Среди оценок этого типа отметим надежную оценку В.А. Епанечникова [107].

В начале 60–х гг. XX в. стал активно разрабатываться аппарат робастной статистики [36-40]. При этом особо выделим коллективный труд [36], авторы которого сегодня поголовно могут считаться классиками анализа данных и прикладной статистики. И снова с сожалением отметим, что эта работа, изданная в Принстонском университете, на русском языке не издавалась.

Термин «робастность» (по-русски, наиболее близко, «прочность») был введен Г. Боксом для обозначения свойств процедуры быть, во-первых, достаточно эффективной в идеальных условиях и, во-вторых, быть стабильной (слабо чувствительной к отклонениям от идеальных условий). Сказанное не является определением, а лишь описанием. В каждом конкретном случае требуется оговорить, во-первых, в каком смысле понимается стабильность процедуры и, во-вторых, как сравнивать эффективность методов. После чего можно утверждать, что «эта процедура более робастна, чем та».

Во многих случаях робастные методы опираются на представление изучаемого распределения как смеси базового с небольшой «добавкой» засоряющего распределения, т.е. модель распределения имеет вид

F(x) = (1- ε) G(x) + ε H(x); 0 < ε << 1,

где - «основное», а Н(х) – «засоряющее» распределение. В качестве Н(х) на практике наиболее часто используют равномерное распределение. Хотя первая модель такого типа, предложенная все тем же Дж.У. Тьюки, имела вид

F(x) = (1- ε) Ф(μ,σ) + ε Ф(μ,3σ).

Здесь основное распределение является гауссовым (интеграл Лапласа) Ф(μ,σ) [108,109] с матожиданием μ и дисперсией , а в качестве «засорения» используется нормальное распределение с тем же матожиданием μ, но с дисперсией,в 9 раз большей, чем у основного распределения.

В 1964 г. П. Хубер [39; 12, с.290-291] сформулировал и доказал теорему, положившую начало оптимизационному подходу к робастности (М-оценки), в которой эмпирическое распределение рассматривалось как ε -нормальное. На сегодня, кроме гауссового, изучены и другие модельные распределения. В России пионером робастной статистики выступил Л.Д. Мешалкин [110,111], создавший высоко стабильный метод «экспоненциального взвешивания» наблюдений [112], за треть века не потерявший свое прикладное значение.

Подчеркнем существование трех классов робастных методов оценивания : минимаксные (или М-оценки), линейные комбинации порядковых статистик (L -оценки) и процедуры, основанные на ранговых критериях (R -оценки) [39].

Среди ранговых робастных методов отметим оценку Ходжеса-Лемана, которая представляет собой статистику вида (n – объем выборочного ансамбля)

T(n) = 0.5 Me( x(i) + x(j) ) ; i, j = 1,2,…,n, i < j ,

где Ме(…) – медиана (среднее по нумерации наблюдение в вариационном ряду [29,43; 12, с.301] выборочных значений эмпирического распределения). Оценка Ходжеса-Лемана основана на ранговом критерии Уилкоксона [113] и часто используется в эконометрических приложениях, хотя эта оценка весьма чувствительна к асимметрии распределения. Поэтому оценка Ходжеса-Лемана может быть корректно применена только в тех случаях, когда из априорных соображений ясно, что изучаемое распределение обладает малой асимметрией.

Отметим, что по степени «свободы от распределения» робастные методы занимают как бы «промежуточное» положение между классическими и непараметрическими методами статистики.

Одно из самых интересных направлений современной прикладной статистики связано с концепцией «анализа данных» Дж.У. Тьюки [90,114-117]. По существу эта концепция является синтезом детерминированных, стохастических и эвристических подходов к анализу выборочных наблюдений. В рамках своей концепции Дж. Тьюки выделяет три этапа «анализа данных»: 1) «разведочный» («пробный») анализ [116]; 2) стохастический анализ и 3) итоговый. Отметим, что по существу весь 1-й том популярного справочного издания по прикладной статистике С.А. Айвазяна с соавторами [87] посвящен вопросам пробного анализа данных.

С конца 70-х гг. в прикладных статистических исследованиях широко используются методы «с интенсивным применением ЭВМ». Смысл методов «с интенсивным применением ЭВМ» (не следует путать с методом «Монте-Карло») сводится к созданию мощной «вторичной статистики», по которой вычисляются итоговые оценки и определяются их погрешности.

Среди методов «с интенсивным применением ЭВМ» наиболее широко используется метод «джекнайф» («складной охотничий нож»), разработанный основоположником «анализа данных» Дж.У. Тьюки [110,112; 12, с.300]. Этот метод действительно хорошо обоснован и может с пользой применяться при анализе «реальных данных». Суть метода «джекнайф» сводится к отказу от небольшой части реально имеющейся выборочной информации, за счет чего (по «урезанным» выборкам данных) получают мощную вторичную статистику. Этот прием совершенно правомерен: любые реальные наблюдений из выборки по каким-то причинам могли в нее и не попасть. Отказ от части реально имеющейся информации (виндзорирование) вполне допустим. Всего из выборки объема n исключать по m наблюдений мы можем способами. Например, при малой выборке n = 25 и m = 3 получаем очень большое число N = 2 300. Это уже весьма большая статистика.

Наряду с методом «джекнайф», в приложениях широко применяется предложенный Брэдли Эфроном метод «бутстрэп» [118] («вспомогательный шнурок для натягивания сапог», иносказательно - «помогаю сам себе»). В части метода «бутстрэп» кратко (а подробнее см. [119]) можно резюмировать, что этот метод имеет неясную логику процесса создания вторичной статистики. При использовании генератора случайных чисел «в режиме бутстрэп», исследуемое (и аналитически неизвестное) распределение фактически заменяется равномерным дискретным распределением, определенным в точках единственной имеющейся выборки. Работая с этим дискретным распределением, создается чрезвычайно мощная вторичная статистика. Но это значит, что вместо изучения стохастических свойств исследуемой генеральной совокупности, мы заняты изучением свойств самой процедуры «бутстрэп».

4. Полиграммные оценки характеристик эмпирического распределения.

В своей практической работе по эконометрике автор предпочитал использование непараметрических оценок полиграммного типа, позволяющих получить относительно простые выражения для оценок интегральных функционалов, зависящих от (аналитически неизвестного) распределения.

Полиграмма К–го порядка, как непараметрическая оценка ФПВ непрерыв-ной случайной величины (НСВ) Х, которая была предложена известным математиком Ф.П. Тарасенко [120], действительно выдающимся русским ученым. В конце-концов, часто ли профессор провинциального сибирского университета был официально признан «Человеком года» в США. Я, с глубокой благодарностью Учителю за потраченное на меня время, констатирую лишь один прецедент такого рода: Феликс Петрович Тарасенко в 1994 году.

Смысл полиграммы как непараметрической оценки ФПВ достаточно прост. Приближенно мы всегда можем представить функцию плотности вероятностей непрерывной случайной величины X в виде p ≈ Δm / Δx, где подразумевается, что на малом отрезке Δx зафиксировано Δm значений Х. Если положить Δx = Const, то мы получим гистограмму, всем известную простейшую непараметрическую оценку ФПВ НСВ Х. Если положить Δm = Const, получается иная непараметрическая оценка той же ФПВ, называемая полиграммой. Разумеется, при математически строгом построении полиграммы ее выражение (через выборочные квантили) имеет значительно более сложный вид. Но исходная идея именно такова.

Доказано, что при весьма общих предположениях [43, с.149-153], полиграмма является состоятельной оценкой ФПВ f(X).

В работе [121] рассмотрена общая теория полиграммного оценивания линейных интегральных функционалов вида J = ∫ ƒ(x) ψ(x) dx , где ƒ(x) – непрерывная (и аналитически неизвестная) ФПФ, а ψ(x) – известная непрерывная функция. Основная теорема из работы [121] дает обоснование того, что полиграммная оценка Ĵ является несмещенной, состоятельной и асимптотически (по объему выборки) нормальной оценкой функционала J . Ее доказательство основано на асимптотических свойствах выборочных квантилей и теореме Мостеллера [43, с.256-260]. На основании результатов этой работы удается получить состоятельные и асимптотически нормальные полиграммные оценки для моментов распределения F = ∫ ƒ(x) dx. Эти оценки широко использовались автором и его коллегами в эконометрических, технико- и социально-экономических прикладных исследованиях [122,123,124].

Замечание. Условия теоремы [121] удается обобщить для нелинейных функционалов. Например, для функционала энтропии E = - ∫ ƒ(x) log ƒ(x) dx получена состоятельная и асимптотически нормальная полиграммная оценка.

В ряде приложений в качестве параметра положения целесообразно и интересно использовать моду (наиболее вероятное значение) распределения. Это касается ситуаций, когда использование в качестве параметра центра математического ожидания (выборочного среднего) или медианы (среднего по нумерации) оказывается существенно менее информативным, чем моды.

Например, что значит фраза: «средняя заработная плата москвичей равна 50 000 рублей» ? Практически это заявление не несет полезной информации, обозначая «среднюю температуру по больнице». Для оценки уровня доходов москвичей нужно наиболее типичное значения их зарплаты, а не усредненная (от консьержек до топ-менеджеров банка «ВТБ») зарплата человеко-единицы.

Заметим, что методы оценки моды слабо разработаны. Кроме полувековой давности процедуры Г. Чернова [125], для оценивания моды вспоминается разве что приближение Холдейна (см. [126]), которое является следствием разложения ФПВ в ряд Эджворта [89,126]. К слову, заметим, что в 1-м томе [87] чрезвычайно популярного трехтомного справочного издания по прикладной статистике С.А. Айвазяна сотоварищи ряд Эджворта приведен в виде трех, а не четырех, как в трудах [89,126], членов. Это описка, М. Кендалл и А. Стюарт показали [126], что третий и четвертый члены разложения ФПВ в ряд Эджворта имеют одинаковый порядок величины. Стало быть, следует использовать либо два, либо четыре первых члена разложения непрерывной ФПВ ряд Эджворта.

В работе [127] дано обоснование полиграммного подхода к оценке моды непрерывной случайной величины. Предложенная оценка, имея простой алгоритм построения, является асимптотически несмещенной и состоятельной.

Пример полиграммного оценивания характеристик эмпирического распределения. Рассмотрим анализ доходов москвичей из работы [80]. Для анализа доходов москвичей в апреле 2009 г. были опрошены студенты младших курсов Академии менеджмента инноваций о заработной плате их родителей. На его основе была сформирована выборка объемом 100 человек (56 женщин и 44 мужчины). В результате обработки данных были получены результаты, отраженные в таблице 2. Использовались классические, поли-граммные и Ходжеса-Лемана (см. выше) оценки параметров распределения.

По официальным данным правительства Москвы на момент проведения эксперимента средняя заработная плата москвичей составляла 17500 рублей. Из таблицы видно, что полиграммная оценка матожидания хорошо согласуется с этой цифрой. Показательно, что мода распределения составляет 14,4 тыс. руб. Это понятно: изучаемое распределение обладает «тяжелым правым хвостом», в связи с чем мода оказывается существенно ниже значения матожидания. Этот факт понятен и без математики. Еще в 20-е гг. ХХ в. Вл. Маяковский писал: «Есть один миллионер и 999 нищих. Складываем, делим – у каждого ровно по тыще». Удивительно точная иллюстрация низкого качества выборочного среднего при его использовании на малых выборках неоднородных данных!

Оценка Ходжеса – Лемана дает не вполне удовлетворительные результаты в силу существенной асимметрии изучаемого распределения.

Таблица 2.

Доходы москвичей (тыс. руб) на одного работающего ( апрель 2009 г.)

Выбо-

рочное

среднее

Выборочн. дисперсия

Мат.ож.

(полигр.)

Дисперсия (полигр.)

Мода

(полигр.

оценка)

Медиана

Оценка

Ходж.-

Лемана

18.42

14.41

17.49

10.82

14.40

16.53

15.57

Полученные результаты хорошо согласуются с приближением Холдейна:

| Матожидание – Медиана | 0,5 | Медиана – Мода | .

В нашем случае: 17,5-16,5 = 1,0 0,5 (16,5-14,4) = 1,05.

5. Проблема полноты и достоверности эмпирических данных.

Статистические методы прогнозирования в экономических задачах

В эконометрических, социально- и технико- экономических работах, как правило, базой для математического анализа информации служат таблицы эмпирических данных, трактуемые как выборка из изучаемой генеральной совокупности. При этом, такие эмпирические таблицы часто оказываются неполными [128] (содержат пропуски значений показателей для некоторых наблюдений) и обладают заметной недостоверностью (часть данных неточна – случайные ошибки, ложные сведения, ошибки ввода данных в базу ЭВМ, умышленная дезинформация). В этой связи ясно, что проблема выявления недостающей и недостоверной информации в эмпирических матрицах данных может считаться неотъемлемой частью первичной статистической обработки данных во всех прикладных эмпирических работах.

Первым среди отечественных специалистов с решением этой проблемы выступил Н.Г. Загоруйко, который совместно с сотрудниками ИМ СО АН разработал алгоритм «ЗЭТ» («заполнение эмпирических таблиц») [129], который в 70 –е гг. ХХ в. широко использовался в прикладных исследованиях. Алгоритм ЗЭТ основан на том, что таблицы данных являются «избыточными», что позволяет оценить недостающие значения матрицы данных. Впоследствии Н.Г. Загоруйко добился значительных теоретических и прикладных результатов в распознавании образов и выявлении эмпирических зависимостей [130,131].

По существу, любая статистическая методология анализа эмпирических таблиц с целью выявления недостающей и ложной информации базируется на том, что, во-первых, числовые показатели, как правило, коррелированны, и, во-вторых, наблюдения в таблице обладают мерами «подобия», которые также поддается формализации в стохастических терминах. Существенную роль играет предпосылка о том, что значения показателей в эмпирических таблицах измерены в интервальных шкалах [69, гл.1], что делает допустимыми любые монотонно возрастающие преобразования переменных.

Отметим работы [132-134], в которых методы выявления недостоверной и недостающей информации значительно усилены за счет использования свойств порядковых статистик [29] и ранговых корреляций [30].

Традиционно одной из основных прикладных задач эконометрики было прогнозирование экономической динамики. В целом эта задача хорошо проработана теоретически и практически [62-65]. На практике основная масса методов прогнозирования, по сути, сводится к экстраполированию временных стационарных последовательностей, базовая идея которого была предложена А.Н. Колмогоровым [135] взаимосвязанных экономических показателей. В рамках предложенного им подхода на сегодня разработано множество статистических методов экономического прогнозирования. Но при этом вопрос о корректности применения конкретного метода статистического прогнозирования зачастую остается вне зрения исследователей. Хотя сам А.Н. Колмогоров обращал на это особое внимание [136].

Используют и статистический (в том числе – спектральный) анализ временных рядов [137-139]. Но этот подход формально требует весьма большой ретроспективы наблюдений. Следует отметить монографию Г. Бриллинджера [140], одного из самых интересных учеников Дж.У. Тьюки, в которой, кроме классических, описаны и робастные процедуры анализа временных рядов.

Часто в приложениях имеется очень короткий ретроспективный ряд (менее 10 точек). В такой ситуации безнадежно искать аналитический вид тренда. В этой связи весьма актуальна проблема разработки методов прогнозирования очень коротких последовательностей (на шаг по5-10точкам), непараметрические методы решения которой даны в [16,80,141-143]. Основу подхода составляет замена в ряду Тэйлора - Маклорена производных конечными разностями соответствующих порядков. В результате прогнозное значение выражается в виде «взвешенной» суммы ретроспективных наблюдений. Веса этих наблюдений, выражаемые через значения неполных дополнительных гамма-функций (см. [108, п.V.С]), распределяются примерно по экспоненте (несколько напоминает распределение весов в эвристическом методе прогнозирования на основе «экспоненциального сглаживания» Р. Брауна – см., например, [62]).

5. Статистическая классификация многомерных объектов.

Соотношение понятий неопределенности, нечеткости и случайности

Процесс систематизации сложных объектов имеет огромное практическое значение, суть которого точно описал Ю.П. Адлер [144]: «Данные наступают на нас со всех сторон. Они накапливаются в темпе, значительно опережающем нашу способность их ассимилировать и использовать. Мы их «складируем впрок», порождая огромные архивы и сложнейшие проблемы хранения, переработки, поиска и использования всего того, что нам удалось «узнать». Значит, с данными нужно что-то делать. Но «делать» – это означает, насколько возможно, сократить их количество и при этом не потерять слишком много «полезной информации», потенциально в них заложенной». Следовательно, классификация – это процедура упрощения массива данных, направленная на то, чтобы облегчить его экспертный анализ и содержательную интерпретацию.

Существуют два принципиально разных подхода к типологизации [46-48]: исключающие и неисключающие классификации. При исключающей систематизации один объект может быть отнесен только к одному из классов (таксонов). При неисключающей классификации объект может быть отнесен к нескольким классам. Развитием идеи неисключающей классификации явилась теория нечетких (размытых, расплывчатых) множеств Л.А. Заде [49,50].

Мы не будем обсуждать здесь аспекты систематизации в терминах нечетких и случайных множеств, а также связанную с этими понятиями важнейшую проблему неопределенности (как проявления или случайности, или нечеткости). Поскольку эти вопросы автор совсем недавно обсуждал в легкодоступных работах [145,146]. Отметим только, что нечеткость является фундаментальным свойством элементов размытого (расплывчатого) множества, характеризующая принципиально плохую формализацию свойств этих элементов. А вероятность в случайном множестве появляется как характеристика меры субъективной осведомленности о принадлежности данного элемента к изучаемому множеству. О вероятностях такого рода Анри Пуанкаре писал [147]: «Однако можно оставить в стороне слабость человеческой природы: то, что представляется случайным для человека необразованного, отнюдь не будет таковым для ученого. Случайность, таким образом, служит как бы мерой нашего невежества (курсив мой. – авт.)». Отсюда следует вывод: на сегодняшнем уровне развития математики бессмысленны любые попытки замены нечеткости случайностью и наоборот.

Заключение к этим заметкам составят два замечания.

1) Список библиографических ссылок, не смотря на довольно приличную длину, в значительной степени отражает личные «научные вкусы» автора и не претендует на полноту. Кроме того, в него входят как работы, требующие хорошего знания математики, так и книги, способные стать вводными курсами.

2) Заинтересованный читатель может углубить полученные представления о многих вопросах, изложенных в этой статье, по только что изданной автором монографии [80], которая в ближайшее время появится в торговой сети Москвы и основных Интернет - магазинах.

Библиографические ссылки

1. Леонов В.П., Ижевский П.В. Об использовании прикладной статистики при подготовке диссертационных работ по медицинским и биологическим специальностям. // Бюлл. Госуд. ВАК, 1997, 3, с. 56-61.

2. Орлов А.И. Статистические методы в российской социологии (тридцать лет спустя). // М.: Академия, 2003.

3. Jevons W.S. Brief of a general mathematical theory of political economy. // Journal of the Statistical Society ofLondon. 1866, v. XXIX, 2, pр.282-287.

4. Паниотто В.И., Максименко В.С. Количественные методы в социологических исследованиях. Киев: Наукова думка, 1982.

5. Толстова Ю.Н. Анализ социологических данных: методология, дескриптивная статистика, изучение связей номинальных признаков. М.: Научный мир, 2000.

6. Толстова Ю.Н. Социология и математика. Сборник избранных научных трудов. М.: Научный мир, 2003.

7. Жуков В.И., Жукова Г.С. Методология математического моделирования управления социальными процессами. М.: Союз, 2006.

8. Винн Р., Холден К. Введение в прикладной эконометрический анализ. / Пер. с англ. М.: Финансы и статистика, 1981.

9. Доугэрти К. Введение в эконометрику. / Пер. с англ. М.: Инфра, 1997.

10. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. В 2-х томах. М.: Юнити, 1998.

11. Орлов А.И. Эконометрика. М.: Экзамен, 2004.

12. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2003.

13. Дмитриев М.Г. Введение в экономико-математические методы. М.: РГСУ, 2005.

14. Мхитарян В.С., Черепанов Е.В. Проблемы прикладной статистики в их привязке к социально-экономическим исследованиям. // Информатика, социология, экономика, менеджмент. Межвузовский сборник научных трудов, вып. 3, ч. 2. М.: Академия менеджмента инноваций (АМИ), 2006, с.23-33.

15. Черепанов Е.В. Вероятностно-статистические основы прикладной социологии и маркетинговых исследований. Монография М.: АМИ, 2006.

16. Черепанов Е.В. Статистическая методология для задач социологических и социально–экономических исследований. Монография М.: АМИ, 2007.

17. Кокрен У. Методы выборочных исследований. / Пер. с англ. М.: Статистика, 1976.

18. Черепанов Е.В. Выборочный метод и квотный опрос в социологических исследованиях. // Анализ социально–экономических и политических процессов и систем, вып. 4. М.: Академия менеджмента инноваций, 2007, с. 154-175.

19. Черепанов Е.В. Стохастическое описание выборочного метода. // Социология: методология, методы, математическое моделирование. М.: ИС РАН, 2007, 25, с.167-189.

20. Бернулли Я. О законе больших чисел. / Пер. с латинск. Юбилейное издание с предисловиями А.А. Маркова и А.Н. Колмогорова. М.: Наука, 1986.

21. Винер Норберт. Творец и робот. М.: Мир, 1966.

22. Косолапов М.С. Принципы построения многоступенчатой вероятностной выборки для субъектов Российской Федерации. // Социологические исследования, 1997, 10, с.98-109.

23. Черепанов Е.В. Стохастические методы анализа данных выборочных маркетинговых и социальных обследований. // Прикладная эконометрика. Научно-практический журнал. М.: ЦЭМИ РАН, 2011, 2 (22), с.48-61.

24. Пфанцагль И. Теория измерений. / Пер. с нем. М.: Мир, 1976.

25. Толстова Ю.Н. Измерение в социологии. М.: Инфра-М, 1998.

26. Тюрин Ю.Н. и др. Анализ нечисловой информации. М.: Научный совет АН СССР по комплексной проблеме «Кибернетика», 1981.

27. Балаш В.А., Балаш О.С., Трошин Л.И. Анализ нечисловой информации. М.:. Государственный университет экономики, статистики и информатики (МЭСИ), 1998.

28. Орлов А.И. Нечисловая статистика. М.: МЗ - Пресс, 2004.

29. Дэйвид Г. Порядковые статистики. / Пер. с англ. М.: Наука, 1979.

30. Кендэл М. Ранговые корреляции. / Пер. с англ. М.: Статистика, 1975.

31. Кендалл М., Стюарт А. Статистические выводы и связи. / Пер. с англ. М.: Наука, 1966.

32. Рао С.Р. Линейные статистические методы и их приложения. / Пер. с англ. М.: Наука, 1968..

33. Епишин Ю.Г. Об оценках параметра регрессии по методу наименьших абсолютных отклонений. // Экономика и математические методы, 1974, т. Х, вып. 5, с. 1023-1028.

34. Закс Ш. Теория статистических выводов. / Пер. с англ. М.: Мир, 1975.

35. Черепанов Е.В. Стохастические методы прикладной социологии и маркетинга рынков. М.: Академия менеджмента инноваций, 2008.

36. Andrews D.F., Bickel P.J., Hampel F.R., Huber P.J., Rogers W.H., Tukey J.W. Robust estimates of location. Survey and advances.Princeton:PrincetonUniv. Press, 1972.

37. Huber P.J. Robust statistics: a review. // Ann. Math. Statist., 1973, v. 43, № 4, p. 56-75.

38. Хампель Ф. Современные тенденции в теории устойчивых статистических процедур. / Пер. с англ. и комментарии проф. Ф.П. Тарасенко. // Математическая статистика и ее приложения, вып. VI. Томск: ТГУ, 1980, с. 3 – 31.

39. Хьюбер П. Робастность в статистике. / Пер. с англ. М.: Мир, 1984.

40. Хампель Ф., Рончетти Э. и др. Робастность в статистике. Подход на основе функций влияния. // М.: Мир, 1989.

41. Hajek J. Course in Nonparametric Statistics. Academic Press, 1970.

42. Непараметрическое оценивание интегральных функционалов по стационарным выборкам. / Коллектив авторов. Под ред. проф. Ф.П. Тарасенко. Томск: ТГУ, 1976.

43. Тарасенко Ф.П. Непараметрическая статистика. Томск: ТГУ, 1976.

44. Тюрин Ю.Н. Непараметрические методы статистики. М.: Наука, 1978.

45. Холлиндер М., Вольф Д. Непараметрические методы статистики. / Пер. с англ. М.: Финансы и статистика, 1983.

46. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974.

47. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: классификация и снижение размерности. М.: Финансы и статистика, 1989.

48. Татарова Г.Г. Основы типологического анализа в социологических исследованиях. М.: Высшее образование, 2007.

49. Заде Л.А. Размытые множества и их применение в распознавании образов и кластер-анализе // Классификация и кластер. Сборник научных работ под ред. Дж. Вэн Райзина. / Пер. с англ. М.: Мир, 1980, с.208-243.

50. Кофман А. Введение в теорию нечетких множеств. М.: Радио и связь,1982.

51. Клемент Э.Ф. О связи между различными понятиями нечетких мер // Нечеткие множества и теория возможностей. Последние достижения. / Пер.с англ. Сборник научных трудов. М.: Радио и связь, 1986, с.279-285.

52. Gupta M.M. Cognition, perception and uncertanity // Fuzzy logic in knowledge-based systems, decision and control / Ed. M.M.Gupta, T.Yamakawa. – Elsevor Science Publishers B.V. – 1988. – P.3-10.

53. Дюбуа Д., Прад А. К анализу и синтезу нечетких отображений // Нечеткие множества и теория возможностей. Последние достижения / Пер.с англ. Сборник научных трудов. М.: Радио и связь. 1986. С.229-240.

54. Дюбуа Д., Прад А. Теория возможностей. Приложение к представлению знаний в информатике / Пер. с фр. М.: Радио и связь, 1990.

55. Себер Дж.Линейный регрессионный анализ. / Пер. с англ. М.: Мир, 1980.

56. Айвазян С.А, Енюков И.С., Мешалкин Л.Д. Прикладная статистика: исследование зависимостей. М.: Финансы и статистика, 1985.

57. Вучков И., Бояджиева А., Солаков Е. Прикладной линейный регрессионный анализ. М.: Финансы и статистика, 1987.

58. Клеймер Г.С., Смоляк С.А. Эконометрические зависимости: принципы и методы построения. М.: Наука, 2000.

59. Лоули Д., Максвелл А. Факторный анализ как статистический метод. / Пер. с англ. М.: Мир, 1967.

60. Дубров А.М. Обработка статистических данных методом главных компонент. М.: Статистика, 1973.

61. Иберла К. Факторный анализ. / Пер. с англ. М.: Статистика, 1980.

62. Чуев Ю.В. и др. Прогнозирование количественных характеристик процессов. М.: Советское радио, 1975.

63. Четыркин Е.М. Статистические методы прогнозирования. М.: Статистика, 1977.

64. Льюис К.Д. Методы прогнозирования экономических показателей. / Пер. с англ. М.: Финансы и статистика, 1986.

65. Дуброва Т.А.Статистические методы прогнозирования. М.: Юнити-дана, 2003.

66. Миркин Б.Г. Группировка в социально-экономических исследованиях. М.: Финансы и статистика, 1985.

67. Жамбю М. Иерархический кластер-анализ и соответствия. / Пер. с франц. М.: Финансы и статистика, 1988.

68. Загоруйко Н.Г., Пичуева А.Г. Сравнение иерархических структур. // Искусственный интеллект и экспертные системы, 157. Новосибирск: Вычислительные системы, 1996, с. 101-111.

69. Орлов А.И. Прикладная статистика. М.: Экзамен, 2006.

70. Матвеенков А.Т. К вопросу реконструкции некоторых забытых «Начал» Евклида. М. Рукопись, 1997.

71. Успенский В.А. Семь размышлений на темы философии математики // Успенский В.А. Труды по НЕматематике. В 2-х т. М.: ОГИ, 2002, т. 1, с. 63-110.

72. Лосев А.Ф. Диалектика числа у Плотина. // Лосев А.Ф. Самое само. Сочинения. Сер.: Антология мысли. М.: ЭКСМО – Пресс, 1999, с. 823 - 982.

73. Биркгоф Г., Барти Т. Современная прикладная алгебра. / Пер. с англ. М.: Мир, 1976.

74. Савелов В.И., Черепанов Е.В. и др. Статистики бинарного отношения на множествах. // Проблемы перспективного планирования и управления. Сборник научных трудов. М.: изд. Госплана СССР, 1990, с. 88-98.

75. Черепанов Е.В. Основы теории множеств с элементами современных алгебры и анализа. М.: Академия менеджмента инноваций, 2005.

76. Толстова Ю.Н., Масленников Е.В. Качественная и количественная стратегии: эмпирическое исследование как измерение в широком смысле. // Социологические исследования. 2000, № 10, с. 101-109.

77. Лбов Г.С. Методы обработки разнотипных экспериментальных данных. Новосибирск: Наука, 1981.

78. Миркин Б.Г. Анализ качественных признаков и структур. М.: Статистика, 1980.

79. Курно Ог. Основы теории шансов и вероятностей. / Пер. с франц. М.: Наука, 1970.

80. Черепанов Е.В. Нетрадиционные вероятностно-статистические методы для социально –экономических и социологических исследований. Монография. М.: изд. «Спутник Плюс», 2012. – 214 с.

81. Справочник по теории вероятностей и математической статистике. / Колл. авторов. Под ред. В.С. Королюка. Киев: Наукова думка, 1978.

82. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. М.: ГУ ВШЭ, 2006.

83. Мхитарян В.С., Черепанов Е.В. Выборочный метод на случайных выборках в социологических и социально-экономических исследованиях: 1. Стохастическое обоснование. // Информатика, социология, экономика, менеджмент. Межвуз. сб. научн. трудов, вып. 4, ч.2. М.: Академия менеджмента инноваций, 2007, с.38-47.

84. Мхитарян В.С., Черепанов Е.В. Выборочный метод на случайных выборках в социологических и социально-экономических исследованиях: 2. Статистические оценки. // Информатика, социология, экономика, менеджмент. Межвуз. сборник научных тр., вып. 5, ч.2. М.: Академия менеджмента инноваций, 2007, с. 42-61.

85. Черепанов Е.В. Негосударственное пенсионное страхование: состояние и перспективы (по результатам ряда социологических исследований 2006 года). // Социальная политика и социология. М.: РГСУ, 2007, 2(34), с.87-98.

86. Черепанов Е.В. Социологический анализ структуры пользователей страховых услуг (на примере региональных исследований 2006 года по страхованию жизни и страхованию от несчастных случаев). // Социальная политика и социология. М.: РГСУ, 2007, № 4 (36), с. 126-136.

87. Айвазян С.А, Енюков И.С., Мешалкин Л.Д. Прикладная статистика: основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.

88. Уилкс С. Математическая статистика. / Пер. с англ. М.: Наука, 1967.

89. Крамер Г. Математические методы статистики. / Пер. с англ. М.: Мир, 1975.

90. Тьюки Дж.У. Анализ данных, вычисления на ЭВМ и математика. // Современные проблемы математики. Сб. научных работ. / Пер. с англ. М.: Знание, 1977.

91. Колмогоров А.Н. Общая теория меры и исчисление вероятностей. // Труды Коммунистической академии, разд. математ., 1929, т.1, с.8-21.

92. Колмогоров А.Н. Основные понятия теории вероятностей. М.: Наука, 1974.

93. Мизес Р. Вероятность и статистика / Пер. с нем. М.-Л.: Госиздат, 1930.

94. Смирнов Н.В. Теория вероятностей и математическая статистика. Избранные труды. М.: Наука, 1970.

95. Постников А.Г. Арифметическое моделирование случайных процессов. // Труды Математического института АН СССР им. Стеклова, 1960, т. 57, с. 272-291.

96. Филиппова А.А. Теорема Мизеса о предельном поведении функционалов от эмпирических функций распределения и ее статистические применения. // Теория вероятностей и ее применения. 1962, т. 7, 1, с.187-196.

97. Устинов Ю.К. О понятии статистического пространства Мизеса. // Математическая статистика и ее приложения. Вып. Х. Томск: ТГУ, 1986, с. 212-218.

98. Тутубалин В.Н. Теория вероятностей. Краткий курс и научно–методические замечания. М.: МГУ, 1972.

99. Тутубалин В.Н. Границы применимости (вероятностно–статистические методы и их возможности). М.: Знание, 1977.

100. Алимов Ю.И. Альтернатива методу математической статистики. М.: Знание, 1980.

101. Алимов Ю.И. Об оценивании устойчивости эмпирических распределений. // Математическая статистика и ее приложения, вып. IX. Томск: ТГУ, 1983. С. 24-32.

102. Алимов Ю.И., Кравцов Ю.А. Является ли вероятность «нормальной» физической величиной? // Успехи физич. наук, 1992, т. 162, 7, с.149-182.

103. Мхитарян В.С., Черепанов Е.В. Стохастические методы в прикладных исследованиях: корректность и надежность использования. // Анализ социально-экономических и политических процессов и систем, вып. 3. М.: Академия Менеджмента Инноваций, 2006, с. 57-67.

104. Черепанов Е.В. К вопросу корректности использования стохастического формализма в социологических и социально–экономических исследованиях. // Безопасность Евразии. 2007, 2 (28), с. 386-402.

105. Ершов А.А. Стабильные методы оценки параметров. Обзор. // Автоматика и телемеханика, 1978, № 7, с. 67-89.

106. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания. М.: Статистика, 1980.

107. Епанечников В.А. Непараметрическая оценка многомерной плотности вероятностей. // Теория вероятностей и ее прим., 1969, т. XIX, 1, с. 98-103.

108. Янке Е., Эмде Ф., Леш Ф. Специальные функции. / Пер. с нем. М.: Наука, 1977.

109. Люк Ю. Специальные математические функции и их аппроксимации. / Пер. с англ. М.: Мир, 1980.

110. Мешалкин Л.Д. и др. Об устойчивости оценок центра распределения. // Заводская лаборатория, 1969, т. XXXV, № 5, с. 594-597.

111. Мешалкин Л.Д. Параметризация многомерных распределений. // Прикладной многомерный статистический анализ. Сборник научных трудов. М.: Наука, 1978, с.11-18.

112. Мешалкин Л.Д. Применение экспоненциальной весовой функции: 1. Робастная параметризация многомерных распределений; 2. Нелинейный факторный анализ с одной латентной переменной. // Прикладной многомерный статистический анализ. Сборник научных трудов. М.: Наука, 1978, с. 299-301.

113. Гаек Я., Шидак З. Теория ранговых критериев. / Пер. с англ. М.: Наука, 1971.

114. Tukey J. The future of data analysis // Ann. Math. Stat., 1962, v.33, p.1-67.

115. Tukey J.W. Exploratory data analysis. V.1-3. Addison-Wesley,ReadingMass., 1971.

116. Тьюки Дж.У. Анализ результатов наблюдений. Разведочный анализ. / Пер. с англ. М.: Советское радио, 1981.

117. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия. В 2 -х т. / Пер. с англ. М.: Финансы и статистика, 1982.

118. Эфрон Б. Нетрадиционные методы многомерного статистического анализа. М.: Финансы и статистика, 1988.

119. Черепанов Е.В. Об использовании статистических методов «с интенсивным применением ЭВМ» // Техника средств связи. Сер.: Техника, экономика, управление. 1985, вып. 1 (16), с.23-28.

120. Tarasenko F.Р. On evolution of an unknown probability density function the direct estimation of entropy from in dependent observations of a continuous random variable and the distribution – free entropy test of goodness – of – fit. // Proc. IEEE. 1968, № 56.

121. Тарасенко Ф.П., Черепанов Е.В. Полиграммные оценки линейных функционалов. // Математическая статистика и ее приложения, вып. Х. Томск: ТГУ, 1986, с. 204-211.

122. Тарасенко Ф.П., Черепанов Е.В. Анализ распределений технико–экономических данных на основе непараметрических полиграммных оценок. // Техника средств связи. Сер.: Техника, экономика, управление. 1986, вып.2(19), с. 76-87.

123. Рыбаков К.А., Черепанов Е.В. Полиграммные оценки моментов непрерывных случайных величин в социально–экономических исследованиях. // Информатика, социология, экономика, менеджмент. Межвузовский сборник научных трудов, вып. 3. М.: Академия менеджмента инноваций (АМИ), 2006, с. 246-255.

124. Черепанов Е.В. Полиграммные непараметрические оценки моментов распределений непрерывных стохастических показателей для социально-экономических исследований. // Информатика, социология, экономика, менеджмент. Межвуз. сборник научн. трудов, вып. 4, ч.2. М.: АМИ, 2007, с. 132-135.

125. Chernoff H. Estimation of the mode // Ann. of Inst. Stat. Math. 1964, № 16.

126. Кендалл М., Стюарт А. Теория распределений. / Пер. с англ. М.: Наука, 1966.

127. Черепанов Е.В. Полиграммная оценка моды распределения. // Математическая статистика и ее приложения, вып. Х. Томск: ТГУ, 1986, с. 233-237.

128. Литтл Р.Дж., Рубин Д.Б. Статистический анализ данных с пропусками. / Пер. с англ. М.: Финансы и статистика, 1991.

129. Загоруйко Н.Г., Елкина В.Н., Тимеркаев В.С. Алгоритм заполнения пропусков в эмпирических таблицах (алгоритм ZET). // Эмпирическое предсказание и распознавание образов, вып. 61. Новосибирск: Вычислительные системы, 1975, с.3-27.

130. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: ИМ СО РАН, 1999.

131. Загоруйко Н.Г. Распознавание образов методом попарного сравнения эталонов. // Доклады РАН, 2002, т. 382, № 1, с. 1-3.

132. Черепанов Е.В. Анализ полноты и достоверности информации в таблицах эмпирических данных. // Анализ социально–экономических и политических процессов и систем, вып. 4. М.: Академии менеджмента инноваций (АМИ), 2007, с.147-153.

133. Рыбаков К.А., Черепанов Е.В. Анализ данных в эмпирических таблицах с использованием порядковых статистик. // Информатика, социология, экономика, менеджмент. Межвузовский сборник научных трудов. Вып. 7, ч. 2. М.: Академии менеджмента инноваций (АМИ), 2010, с. 60-65.

134. Черепанов Е.В. Автоматизированный анализ статистических таблиц технико-экономических данных. // Системы и средства связи, телевидения и радиовещания. Научно-технический журнал. (ISBN 2079-6137). М.: 2011, № 1-2, с.18-22.

135. Колмогоров А.Н. Интерполирование и экстраполирование стационарных случайных последовательностей. // Известия АН СССР. Сер. матем., 1941, том 5, № 1, с. 108-121.

136. Колмогоров А.Н. К вопросу о пригодности найденных статистическим путем формул прогноза. // Журн. геофиз., 1933, том 3, с. 78-82.

137. Кендалл М., Стюарт А. Многомерный статистический анализ и временные ряды. / Пер. с англ. М.: Наука, 1976.

138. Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике. / Пер. с англ. М.: Статистика, 1972.

139. Box G.E., Jenkins G.M. Time Series Analysis. // Forecasting and Control.San Francisco: Holden-Day, 1976, р. 216.

140. Бриллинджер Г.Временные ряды. Обработка данных и теория. / Пер. с англ.М.: Мир, 1980.

141. Черепанов Е.В., Щиренко Е.Г. Экономическое прогнозирование многомерных последовательностей технико-экономических показателей в задачах производственного планирования. // Техника средств связи. Сер.: Техника, экономика, управление. 1987, № 3, с. 56-64.

142. Жеруль А.О., Черепанов Е.В. Макроэкономическое прогнозирование на основе непараметрического экстраполирования временных рядов. // Информатика, социология, экономика, менеджмент. Межвузовский сборник научных трудов, вып. 2. М.: Академия менеджмента инноваций (АМИ), 2006, с. 141-148.

143. Черепанов Е.В. Статистическая методология для задач социологических и социально–экономических исследований. Монография. М.: АМИ, 2007.

144. Адлер Ю.П. Наука и искусство анализа данных. / Предисловие к двухтомнику [117].

145. Черепанов Е.В. К вопросу о неопределенности, случайности и нечеткости в социально-экономических задачах классификации. // Современные научные исследования и инновации. Электронный научный журнал. Октябрь, 2011. (ISSN 2223-4888). (https://web.snauka.ru/issues/2011/10/4811).

146. Черепанов Е.В. Типологическое пространство и его использование при классификации социально-экономических объектов. // Экономические и гуманитарные исследования регионов. Научно-теоретический журнал. (ISBN 2079-1968). Ростов/Дон: ЮФГУ, 2011, 5, с.109-127.

147. Пуанкаре А. Наука и метод. // Пуанкаре Анри. О науке. Сборник избранных научных трудов. / Пер. с франц. М.: Наука, 1990, с. 367-522.

Все статьи автора «Черепанов Евгений Васильевич»

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий

Вы должны авторизоваться, чтобы оставить комментарий.

Если Вы еще не зарегистрированы на сайте, то Вам необходимо зарегистрироваться:

Авторам

О журнале

ЧЕРЕПАНОВ Е.В. СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ: ОБЗОР ДЛЯ СОЦИОЛОГОВ И ЭКОНОМИСТОВ

ЧЕРЕПАНОВ Е.В. СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ: ОБЗОР ДЛЯ СОЦИОЛОГОВ И ЭКОНОМИСТОВ

Связь с автором (комментарии/рецензии к статье)

Оставить комментарий