Основоположник теории полезности и потребительского спроса У. Джевонс считал экономику наукой стохастической: «Такие сложные законы, как законы экономики… невозможно точно определить в каждом конкретном случае. Их действие можно обнаружить только для совокупностей и методом средних» [1]. На современном языке это значит: «Законы экономики носят вероятностный характер и должны изучаться статистическими методами». В этой ситуации основным аналитическим инструментарием обработки результатов социально-экономических обследований служит выборочный метод [2]. Ранее автор рассмотрел проблему стохастического описания случайной выборки из неоднородных совокупностей, основанного на обобщениях распределений гипергеометрического типа [3].
В тех случаях, когда объем выборки составляет менее 10% от мощности генеральной совокупности, что практически всегда выполняется в маркетинговых и социальных работах, гипергеометрическое распределение без заметной потери в точности может быть заменено биномиальным распределением [4, с.104]. Но в ряде случаев при изучении социально-экономических объектов, например, потребительских рынков, приходится иметь дело с непрерывными распределениями, представленными таблицей значений компонент непрерывного случайного вектора (показателей, измеренных в сильных шкалах). В этой связи важно разобраться с видом соответствующих непрерывных распределений, что позволит не только построить выборочные оценки для обработки данных маркетинговых исследований, но и работать непосредственно со статистической отчетной информацией.
Первая конечная разность для биномиального [4, п. 2.2.1] распределения (БР)
,
где θ – априорная вероятность «успеха» в каждом отдельном опыте, приближенно имеет вид
(1)
В формуле (1) использовано, что при больших объемах выборочного ансамбля можно считать, что .
При распределение bi(m|n) становится непрерывным:
. Конечные разности являются прямыми аналогами производных соответствующих порядков, в силу чего из соотношения (1) мы приходим к уравнению вида
,
где m – «непрерывное количество успехов», а обозначает функцию плотности вероятностей (ФПВ) непрерывного БР. Но, в силу симметрии «успехов» и «неуспехов» в схеме испытаний Бернулли можно записать:
.
Это позволяет записать выражение для ФПВ непрерывного БР в виде
Многомерный случай схемы Бернулли, когда есть r вариантов исхода опыта, описывается [4, п. 6.4.1] полиномиальным распределением (ПР) вида
где подразумевается, что .
По аналогии с двумерным случаем (описываемым БР), r- мерное «непрерывное полиномиальное распределение» (НПР) должно иметь вид
. (2)
Значение параметра найдем из условия нормировки функции распределения к 1:
. (3)
Используя [5, п.2.2.5.1] соотношение вида
, (4)
где В(…,…) – бета-функция, которая определена в виде [6, п.V.А.3.3]
,
путем последовательного интегрирования выражения (3) получаем:
Тогда ФПВ непрерывного ПР (НПР), учитывая (1-2), запишется в виде
. (5)
Для соответствующей функции распределения (ФР) можно записать:
,
где случайный вектор определен в виде
.
В правой части этого выражения стоит ФР распределения Дирихле [7]. Его ФПВ имеет вид .
Отметим, что в популярном справочнике [4, п.6.4.5] в описание распределения Дирихле вкрались ошибки. Заметим также, что распределение
Дирихле, служит, как и непрерывное полиномиальное распределение (5), многомерным аналогом бета- распределения [4, п.6.2.7].
Если в серии n испытаний Бернулли с r
непрерывными исходами рассматривается распределение абсолютного числа различных исходов опытов, то мы имеем дело с НПР (5). Если же рассматривается распределение долей различных исходов опытов, то его описывает распределение Дирихле. В частности, непрерывное БР имеет вид
,
а двумерное распределение Дирихле имеет вид
Первые центральные моменты компонент случайного вектора , подчиненного распределению Дирихле, вычисляются в виде
Для определения вектора мод (наиболее вероятных значений) для вектора , подчиненного распределению Дирихле, запишем:
.
Откуда следует, в силу произвольности нумерации компонент вектора , что в точке глобального максимума правомерно записать
.
Из выражений для параметров , в силу
, тривиально следуют соотношения для соответствующих параметров НПР.
Пример. В данном сорте водки должно содержаться 100% воды, 100
% – этилового спирта, а остальное – допустимый процент примесей. Взята проба объемом n литров этой водки. НПР
определяет вероятность абсолютных значений
фактически обнаруженных в пробе составляющих водки, а распределение
– вероятность фактически зарегистрированных
и
долей этих составляющих в пробе.
На соотношение (2) можно взглянуть иначе, представив его в виде
. (6)
В этом случае случайными величинами будут n и . Иное значение приобретет и константа
. Из условия нормировки
.
путем последовательного интегрирования с использованием выражения (4), находим: .
Таким образом, распределение (6) имеет вид
.
Назовем выражение (7) непрерывным структурированным полиномиальным распределением (НСПР). НСПР характеризует появление за фиксированный промежуток времени n независимых событий r типов, со структурой :
. (7)
Пример. На потребительском рынке представлено r видов конкурентных товаров. За единицу времени продано n единиц товаров, причем по маркам товаров структура совокупной покупки имеет вид . Такая ситуация описывается НСПР вида (7).
Характеристики распределения (7) легко вычисляется в виде:
НСПР имеет ФР вида
где – неполная гамма-функция [6, п.V.С]:
.
Представляет интерес распределение суммы r случайных величин . Из соотношения (7) находим:
(8)
Вид распределения (8) свидетельствует, что представляет собой частный случай гамма – распределения [4, п.6.2.6]. Мода
равна
, а его первые моменты равны
.
ФР запишется в виде
.
Легко видеть, что, как и должно быть: . (9)
Библиографический список
- Jevons W.S. Brief of a general mathematical theory of political economy. // Journal of the Statistical Society of London, 1866, XXIX, № 2, рp. 282-287.
- Черепанов Е.В. Стохастическое описание выборочного метода // Социология: методология, методы, математическое моделирование. М.: ИС РАН, 2007, 25, с. 167-189.
- Черепанов Е.В. Стохастические методы анализа данных выборочных маркетинговых и социальных обследований. // Прикладная эконометрика. М.: ЦЭМИ РАН, 2011, 2(22), с.48-61.
- Королюк В.С. (ред.), Скороход А.В. и др. Справочник по теории вероятностей и математической статистике. Киев: Наукова думка, 1978.
- Прудников А.П. и др. Интегралы и ряды. М.: Наука, 1981.
- Янке Е., Эмде Ф., Леш Ф. Специальные функции. / Пер. с нем. М.: Наука, 1977.
- Dirichlet distribution (http://en.wikipedia.org/wiki/Dirichlet_distribution).