Как найти среднеквадратическое отклонение. Среднеквадратическое (стандартное) отклонение
Одним из основных инструментов статистического анализа является расчет среднего квадратичного отклонения. Данный показатель позволяет сделать оценку стандартного отклонения по выборке или по генеральной совокупности. Давайте узнаем, как использовать формулу определения среднеквадратичного отклонения в Excel.
Сразу определим, что же представляет собой среднеквадратичное отклонение и как выглядит его формула. Эта величина является корнем квадратным из среднего арифметического числа квадратов разности всех величин ряда и их среднего арифметического. Существует тождественное наименование данного показателя — стандартное отклонение. Оба названия полностью равнозначны.
Но, естественно, что в Экселе пользователю не приходится это высчитывать, так как за него все делает программа. Давайте узнаем, как посчитать стандартное отклонение в Excel.
Расчет в Excel
Рассчитать указанную величину в Экселе можно с помощью двух специальных функций СТАНДОТКЛОН.В (по выборочной совокупности) и СТАНДОТКЛОН.Г (по генеральной совокупности). Принцип их действия абсолютно одинаков, но вызвать их можно тремя способами, о которых мы поговорим ниже.
Способ 1: мастер функций
Способ 2: вкладка «Формулы»
Способ 3: ручной ввод формулы
Существует также способ, при котором вообще не нужно будет вызывать окно аргументов. Для этого следует ввести формулу вручную.
Как видим, механизм расчета среднеквадратичного отклонения в Excel очень простой. Пользователю нужно только ввести числа из совокупности или ссылки на ячейки, которые их содержат. Все расчеты выполняет сама программа. Намного сложнее осознать, что же собой представляет рассчитываемый показатель и как результаты расчета можно применить на практике. Но постижение этого уже относится больше к сфере статистики, чем к обучению работе с программным обеспечением.
Квадратный корень из дисперсии носит название среднего квадратического отклонения от средней, которое рассчитывается следующим образом:
Элементарное алгебраическое преобразование формулы среднего квадратического отклонения приводит ее к следующему виду:
Эта формула часто оказывается более удобной в практике расчетов.
Среднее квадратическое отклонение так же, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Между ними имеется такое соотношение:
Зная это соотношение, можно по известному показатели определить неизвестный, например, но (I рассчитать а и наоборот. Среднее квадратическое отклонение измеряет абсолютный размер колеблемости признака и выражается в тех же единицах измерения, что и значения признака (рублях, тоннах, годах и т.д.). Оно является абсолютной мерой вариации.
Для альтернативных признаков, например наличия или отсутствия высшего образования, страховки, формулы дисперсии и среднего квадратического отклонения такие:
Покажем расчет среднего квадратического отклонения по данным дискретного ряда, характеризующего распределение студентов одного из факультетов вуза по возрасту (табл. 6.2).
Таблица 6.2.
Результаты вспомогательных расчетов даны в графах 2-5 табл. 6.2.
Средний возраст студента, лет, определен по формуле средней арифметической взвешенной (графа 2):
Квадраты отклонения индивидуального возраста студента от среднего содержатся в графах 3-4, а произведения квадратов отклонений на соответствующие частоты - в графе 5.
Дисперсию возраста студентов, лет, найдем по формуле (6.2):
Тогда о = л/3,43 1,85 *ода, т.е. каждое конкретное значение возраста студента отклоняется от среднего значения на 1,85 года.
Коэффициент вариации
По своему абсолютному значению среднее квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариантов и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с различными средними уровнями непосредственно нельзя. Чтобы иметь возможность для такого сравнения, нужно найти удельный вес среднего отклонения (линейного или квадратического) в среднем арифметическом показателе, выраженном в процентах, т.е. рассчитать относительные показатели вариации.
Линейный коэффициент вариации вычисляют по формуле
Коэффициент вариации определяют по следующей формуле:
В коэффициентах вариации устраняется не только несопоставимость, связанная с различными единицами измерения изучаемого признака, но и несопоставимость, возникающая вследствие различий в величине средних арифметических. Кроме того, показатели вариации дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
По данным табл. 6.2 и полученным выше результатам расчетов определим коэффициент вариации, %, по формуле (6.3):
Если коэффициент вариации превышает 33%, то это свидетельствует о неоднородности изучаемой совокупности. Полученное в пашем случае значение говорит о том, что совокупность студентов по возрасту однородна по своему составу. Таким образом, важная функция обобщающих показателей вариации - оценка надежности средних. Чем меньше с1, а2 и V, тем однороднее полученная совокупность явлений и надежнее полученная средняя. Согласно рассматриваемому математической статистикой "правилу трех сигм" в нормально распределенных или близких к ним рядах отклонения от средней арифметической, не превосходящие ±3ст, встречаются в 997 случаях из 1000. Таким образом, зная х и а, можно получить общее первоначальное представление о вариационном ряде. Если, например, средняя заработная плата работника по фирме составила 25 000 руб., а а равна 100 руб., то с вероятностью, близкой к достоверности, можно утверждать, что заработная плата работников фирмы колеблется в пределах (25 000 ± ± 3 х 100) т.е. от 24 700 до 25 300 руб.
Математическое ожидание и дисперсия
Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?
Будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию M x . В данном случае M x = 3,5.
Каким образом получилась эта величина? Пусть в N испытаниях раз выпало 1 очко, раз – 2 очка и так далее. Тогда При N → ∞ количество исходов, в которых выпало одно очко, Аналогично, Отсюда
Модель 4.5. Игральные кости
Предположим теперь, что мы знаем закон распределения случайной величины x , то есть знаем, что случайная величина x может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .
Математическое ожидание M x случайной величины x равно:
Ответ. 2,8.
Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.
Медианой случайной величины называют число x 1/2 такое, что p (x < x 1/2) = 1/2.
Другими словами, вероятность p 1 того, что случайная величина x окажется меньшей x 1/2 , и вероятность p 2 того, что случайная величина x окажется большей x 1/2 , одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.
Вернёмся к случайной величине x , которая может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .
Дисперсией случайной величины x называется среднее значение квадрата отклонения случайной величины от её математического ожидания:
Пример 2
В условиях предыдущего примера вычислить дисперсию и среднеквадратическое отклонение случайной величины x .
Ответ. 0,16, 0,4.
Модель 4.6. Стрельба в мишень
Пример 3
Найти распределение вероятности числа очков, выпавших на кубике с первого броска, медиану, математическое ожидание, дисперсию и среднеквадратичное отклонение.
Выпадение любой грани равновероятно, так что распределение будет выглядеть так:
Среднеквадратичное отклонение Видно, что отклонение величины от среднего значения очень велико.
Свойства математического ожидания:
- Математическое ожидание суммы независимых случайных величин равно сумме их математических ожиданий:
Пример 4
Найти математическое ожидание суммы и произведения очков, выпавшей на двух кубиках.
В примере 3 мы нашли, что для одного кубика M (x ) = 3,5. Значит, для двух кубиков
Свойства дисперсии:
- Дисперсия суммы независимых случайных величин равно сумме дисперсий:
D x + y = D x + D y .
Пусть за N бросков на кубике выпало y очков. Тогда
Этот результат верен не только для бросков кубика. Он во многих случаях определяет точность измерения математического ожидания опытным путем. Видно, что при увеличении количества измерений N разброс значений вокруг среднего, то есть среднеквадратичное отклонение, уменьшается пропорционально
Дисперсия случайной величины связана с математическим ожиданием квадрата этой случайной величины следующим соотношением:
Найдём математические ожидания обеих частей этого равенства. По определению,
Математическое же ожидание правой части равенства по свойству математических ожиданий равно
Среднее квадратическое отклонение
Среднеквадратическое отклонение
равно квадратному корню из дисперсии:
При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:
Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:
Среднее квадратическое отклонение простое:
Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:
Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.
Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.
Дисперсия, ее виды, среднеквадратическое отклонение.
Дисперсия случайной величины — мера разброса данной случайной величины, т. е. её отклонения отматематического ожидания. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии называется среднеквадратичным отклонением, стандартным отклонением или стандартным разбросом.
Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.
Межгрупповая дисперсия (σ 2 м.гр ) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака - фактора, положенного в основание группировки.
Среднеквадратическое отклонение (синонимы: среднее квадратическое отклонение, среднеквадратичное отклонение, квадратичное отклонение; близкие термины: стандартное отклонение, стандартный разброс) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величиныотносительно её математического ожидания. При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическоесовокупности выборок.
Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется какквадратный корень из дисперсии случайной величины.
Среднеквадратическое отклонение:
Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии):
где — дисперсия; — i -й элемент выборки; — объём выборки; — среднее арифметическое выборки:
Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной.
Сущность, область применения и порядок определения моды и медианы.
Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и внутреннего строения рядов распределения пользуются структурными средними, которые представлены,в основном, модой и медианой .
Мода — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем — значение модальной величины признака по формуле:
- — значение моды
- — нижняя граница модального интервала
- — величина интервала
- — частота модального интервала
- — частота интервала, предшествующего модальному
- — частота интервала, следующего за модальным
Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.
Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение варианта приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле:
М е = (n (число признаков в совокупности) + 1)/2,
в случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда).
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:
- — искомая медиана
- — нижняя граница интервала, который содержит медиану
- — величина интервала
- — сумма частот или число членов ряда
Сумма накопленных частот интервалов, предшествующих медианному
- — частота медианного интервала
Пример . Найти моду и медиану.
Решение
:
В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).
Рассчитаем величину моды:
Это значит что модальный возраст студентов равен 27 годам.
Вычислим медиану . Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σf i /2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:
Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.
Кроме моды и медианы могут быть использованы такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили - 10 частей и перцентили — на 100 частей.
Понятие выборочного наблюдения и область его применения.
Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно . Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.
Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом числоединиц ввыборке обозначают n , а во всей ГС - N . Отношение n/N называется относительныйразмер или долявыборки.
Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц , который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.
Существует 4 способа случайного отбора в выборку:
- Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.
- Механический отбор, согласно которому отбирается каждая (N/n )-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.
- Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.
- Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.
Качество выборочных наблюдений зависит и от типа выборки : повторная или бесповторная.
При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.
Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.
Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.
Предельная ошибка выборки наблюдения, средняя ошибка выборки, порядок их расчета.
Рассмотрим подробно перечисленные выше способы формирования выборочной совокупности и возникающие при этом ошибки репрезентативности
.
Собственно-случайная
выборка основывается на отборе единиц из генеральной совокупности наугад без каких-либо элементов системности. Технически собственно-случайный отбор проводят методом жеребьевки (например, розыгрыши лотерей) или по таблице случайных чисел.
Собственно-случайный отбор «в чистом виде» в практике выборочного наблюдения применяется редко, но он является исходным среди других видов отбора, в нем реализуются основные принципы выборочного наблюдения. Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.
Ошибка выборочного наблюдения - это разность между величиной параметра в генеральной совокупности, и его величиной, вычисленной по результатам выборочного наблюдения. Для средней количественного признака ошибка выборки определяется
Показатель называется предельной ошибкой выборки.
Выборочная средняя является случайной величиной, которая может принимать различные значения в зависимости от того, какие единицы попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок - среднюю ошибку выборки
, которая зависит от:
Объема выборки: чем больше численность, тем меньше величина средней ошибки;
Степени изменения изучаемого признака: чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки.
При случайном повторном отборе
средняя ошибка рассчитывается:
.
Практически генеральная дисперсия точно не известна, но в теории вероятности
доказано, что
.
Так как величина при достаточно больших n близка к 1, можно считать, что . Тогда средняя ошибка выборки может быть рассчитана:
.
Но в случаях малой выборки (при n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.
При случайной бесповторной выборке
приведенные формулы корректируются на величину . Тогда средняя ошибка бесповторной выборки:
и .
Т.к. всегда меньше , то множитель () всегда меньше 1. Это значит, что средняя ошибка при бесповторном отборе всегда меньше, чем при повторном.
Механическая выборка
применяется, когда генеральная совокупность каким-либо способом упорядочена (например, списки избирателей по алфавиту, телефонные номера, номера домов, квартир). Отбор единиц осуществляется через определенный интервал, который равен обратному значению процента выборки. Так при 2% выборке отбирается каждая 50 единица =1/0,02 , при 5% каждая 1/0,05=20 единица генеральной совокупности.
Начало отсчета выбирается разными способами: случайным образом, из середины интервала, со сменой начала отсчета. Главное при этом - избежать систематической ошибки. Например, при 5% выборке, если первой единицей выбрана 13-я, то следующие 33, 53, 73 и т.д.
По точности механический отбор близок к собственно-случайной выборке. Поэтому для определения средней ошибки механической выборки используют формулы собственно-случайного отбора.
При типическом отборе обследуемая совокупность предварительно разбивается на однородные, однотипные группы. Например, при обследовании предприятий это могут быть отрасли, подотрасли, при изучении населения - районы, социальные или возрастные группы. Затем осуществляется независимый выбор из каждой группы механическим или собственно-случайным способом.
Типическая выборка дает более точные результаты по сравнению с другими способами. Типизация генеральной совокупности обеспечивает представительство в выборке каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Следовательно, при нахождении ошибки типической выборки согласно правилу сложения дисперсий () необходимо учесть лишь среднюю из групповых дисперсий. Тогда средняя ошибка выборки:
при повторном отборе
,
при бесповторном отборе
,
где - средняя из внутригрупповых дисперсий в выборке.
Серийный (или гнездовой) отбор
применяется в случае, когда генеральная совокупность разбита на серии или группы до начала выборочного обследования. Этими сериями могут быть упаковки готовой продукции, студенческие группы, бригады. Серии для обследования выбираются механическим или собственно-случайным способом, а внутри серии производится сплошное обследование единиц. Поэтому средняя ошибка выборки зависит только от межгрупповой (межсерийной) дисперсии, которая вычисляется по формуле:
где r - число отобранных серий;
- средняя і-той серии.
Средняя ошибка серийной выборки рассчитывается:
при повторном отборе:
,
при бесповторном отборе:
,
где R - общее число серий.
Комбинированный отбор представляет собой сочетание рассмотренных способов отбора.
Средняя ошибка выборки при любом способе отбора зависит главным образом от абсолютной численности выборки и в меньшей степени - от процента выборки. Предположим, что проводится 225 наблюдений в первом случае из генеральной совокупности в 4500 единиц и во втором - в 225000 единиц. Дисперсии в обоих случаях равны 25. Тогда в первом случае при 5 %-ном отборе ошибка выборки составит:
Во втором случае при 0,1 %-ном отборе она будет равна:
Таким образом
, при уменьшении процента выборки в 50 раз, ошибка выборки увеличилась незначительно, так как численность выборки не изменилась.
Предположим, что численность выборки увеличили до 625 наблюдений. В этом случае ошибка выборки равна:
Увеличение выборки в 2,8 раза при одной и той же численности генеральной совокупности снижает размеры ошибки выборки более чем в 1,6 раза.
Методы и способы формирования выборочной совокупности.
В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.
Основным условием проведения выборочного обследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.
Существуют следующие способы отбора единиц из генеральной совокупности:
1) индивидуальный отбор — в выборку отбираются отдельные единицы;
2) групповой отбор — в выборку попадают качественно однородные группы или серии изучаемых единиц;
3) комбинированный отбор — это комбинация индивидуального и группового отбора.
Способы отбора определяются правилами формирования выборочной совокупности.
Выборка может быть:
- собственно-случайная состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) отбора отдельных единиц из генеральной совокупности. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки. Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т.е.
- механическая состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы). При этом размер интервала в генеральной совокупности равен обратной величине доли выборки. Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке — каждая 20-я единица (1:0,05) и т.д. Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.
- типическая - при которойгенеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность;
- серийная - при которой генеральную совокупность делят на одинаковые по объему группы - серии. В выборочную совокупность отбираются серии. Внутри серий производится сплошное наблюдение единиц, попавших в серию;
- комбинированная - выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.
В статистике различают следующие способы отбора единиц в выборочную совокупность :
- одноступенчатая выборка - каждая отобранная единица сразу же подвергается изучению по заданному признаку (собственно-случайная и серийная выборки);
- многоступенчатая выборка - производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы (типическая выборка с механическим способом отбора единиц в выборочную совокупность).
Кроме того различают:
- повторный отбор - по схеме возвращенного шара. При этом каждая попавшая в выборку единица иди серия возвращается в генеральную совокупность и поэтому имеет шанс снова попасть в выборку;
- бесповторный отбор - по схеме невозвращенного шара. Он имеет более точные результаты при одном и том же объеме выборки.
Определение необходимого объема выборки (использование таблицы Стьюдента).
Одним из научных принципов в теории выборочного метода является обеспечение достаточного числа отобранных единиц. Теоретически необходимость соблюдения этого принципа представлена в доказательствах предельных теорем теории вероятностей, которые позволяют установить, какой объем единиц следует выбрать из генеральной совокупности, чтобы он был достаточным и обеспечивал репрезентативность выборки.
Уменьшение стандартной ошибки выборки, а следовательно, увеличение точности оценки всегда связано с увеличением объема выборки, поэтому уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Расчет необходимого объема выборки строится с помощью формул, выведенных из формул предельных ошибок выборки (А), соответствующих тому или иному виду и способу отбора. Так, для случайного повторного объема выборки (n) имеем:
Суть этой формулы - в том, что при случайном повторном отборе необходимой численности объем выборки прямо пропорционален квадрату коэффициента доверия (t2) и дисперсии вариационного признака (?2) и обратно пропорционален квадрату предельной ошибки выборки (?2). В частности, с увеличением предельной ошибки в два раза необходимая численность выборки может быть уменьшена в четыре раза. Из трех параметров два (t и?) задаются исследователем.
При этом исследователь исходя из целии задач выборочного обследования должен решить вопрос: в каком количественном сочетании лучше включить эти параметры для обеспечения оптимального варианта? В одном случае его может больше устраивать надежность полученных результатов (t), нежели мера точности (?), в другом - наоборот. Сложнее решить вопрос в отношении величины предельной ошибки выборки, так как этим показателем исследователь на стадии проектировки выборочного наблюдения не располагает, поэтому в практике принято задавать величину предельной ошибки выборки, как правило, в пределах до 10 % предполагаемого среднего уровня признака. К установлению предполагаемого среднего уровня можно подходить по разному: использовать данные подобных ранее проведенных обследований или же воспользоваться данными основы выборки и произвести небольшую пробную выборку.
Наиболее сложно установить при проектировании выборочного наблюдения третий параметр в формуле (5.2) - дисперсию выборочной совокупности. В этом случае необходимо использовать всю информацию, имеющуюся в распоряжении исследователя, полученную в ранее проведенных подобных и пробных обследованиях.
Вопрос об определении необходимой численности выборки усложняется, если выборочное обследование предполагает изучение нескольких признаков единиц отбора. В этом случае средние уровни каждого из признаков и их вариация, как правило, различны, и поэтому решить вопрос о том, дисперсии какого из признаков отдать предпочтение, возможно лишь с учетом цели и задач обследования.
При проектировании выборочного наблюдения предполагаются заранее заданная величина допустимой ошибки выборки в соответствии с задачами конкретного исследования и вероятность выводов по результатам наблюдения.
В целом формула предельной ошибки выборочной средней величины позволяет определять:
Величину возможных отклонений показателей генеральной совокупности от показателей выборочной совокупности;
Необходимую численность выборки, обеспечивающую требуемую точность, при которой пределы возможной ошибки не превысят некоторой заданной величины;
Вероятность того, что в проведенной выборке ошибка будет иметь заданный предел.
Распределение Стьюдента в теории вероятностей — это однопараметрическое семейство абсолютно непрерывных распределений.
Ряды динамики (интервальные, моментные), смыкание рядов динамики.
Ряды динамики - это значения статистических показателей, которые представлены в определенной хронологической последовательности.
Каждый динамический ряд содержит две составляющие:
1) показатели периодов времени (годы, кварталы, месяцы, дни или даты);
2) показатели, характеризующие исследуемый объект за временные периоды или на соответствующие даты, которые называют уровнями ряда.
Уровни ряда выражаются как абсолютными, так и средними или относительными величинами. В зависимости от характера показателей строят динамические ряды абсолютных, относительных и средних величин. Ряды динамики из относительных и средних величин строят на основе производных рядов абсолютных величин. Различают интервальные и моментные ряды динамики.
Динамический интервальный ряд содержит значения показателей за определенные периоды времени. В интервальном ряду уровни можно суммировать, получая объем явления за более длительный период, или так называемые накопленные итоги.
Динамический моментный ряд отражает значения показателей на определенный момент времени (дату времени). В моментных рядах исследователя может интересовать только разность явлений, отражающая изменение уровня ряда между определенными датами, поскольку сумма уровней здесь не имеет реального содержания. Накопленные итоги здесь не рассчитываются.
Важнейшим условием правильного построения динамических рядов является сопоставимость уровней рядов, относящихся к различным периодам. Уровни должны быть представлены в однородных величинах, должна иметь место одинаковая полнота охвата различных частей явления.
Для того, чтобы избежать искажения реальной динамики, в статистическом исследовании проводятся предварительные расчеты (смыкание рядов динамики), которые предшествуют статистическому анализу динамических рядов. Под смыканием рядов динамики понимается объединение в один ряд двух и более рядов, уровни которых рассчитаны по разной методологии или не соответствуют территориальным границам и т.д. Смыкание рядов динамики может предполагать также приведение абсолютных уровней рядов динамики к общему основанию, что нивелирует несопоставимость уровней рядов динамики.
Понятие сопоставимости рядов динамики, коэффициенты, темпы роста и прироста.
Ряды динамики — это ряды статистических показателей, характеризующих развитие явлений природы и общества во времени. Публикуемые Госкомстатом России статистические сборники содержат большое количество рядов динамики в табличной форме. Ряды динамики позволяют выявить закономерности развития изучаемых явлений.
Ряды динамики содержат два вида показателей. Показатели времени (годы, кварталы, месяцы и др.) или моменты времени (на начало года, на начало каждого месяца и т.п.). Показатели уровней ряда . Показатели уровней рядов динамики могут быть выражены абсолютными величинами (производство продукта в тоннах или рублях), относительными величинами (удельный вес городского населения в %) и средними величинами (средняя заработная плата работников отрасли по годам и т. п.). В табличной форме ряд динамики содержит два столбца или две строки.
Правильное построение рядов динамики предполагает выполнение ряда требований:
- все показатели ряда динамики должны быть научно обоснованными, достоверными;
- показатели ряда динамики должны быть сопоставимы по времени, т.е. должны быть исчислены за одинаковые периоды времени или на одинаковые даты;
- показатели ряда динамики должны быть сопоставимы по территории;
- показатели ряда динамики должны быть сопоставимы по содержанию, т.е. исчислены по единой методологии, одинаковым способом;
- показатели ряда динамики должны быть сопоставимы по кругу учитываемых хозяйств. Все показатели ряда динамики должны быть приведены в одних и тех же единицах измерения.
Статистические показатели могут характеризовать либо результаты изучаемого процесса за период времени, либо состояние изучаемого явления на определенный момент времени, т.е. показатели могут быть интервальными (периодическими) и моментными. Соответственно первоначально ряды динамики могут быть либо интервальными, либо моментными. Моментные ряды динамики в свою очередь могут быть с равными и неравными промежутками времени.
Первоначальные ряды динамики могут быть преобразованы в ряд средних величин и ряд относительных величин (цепной и базисный). Такие ряды динамики называют производными рядами динамики.
Методика расчета среднего уровня в рядах динамики различна, обусловлена видом ряда динамики. На примерах рассмотрим виды рядов динамики и формулы для расчета среднего уровня.
Абсолютные приросты (Δy ) показывают, на сколько единиц изменился последующий уровень ряда по сравнению с предыдущим (гр.3. — цепные абсолютные приросты) или по сравнению с начальным уровнем (гр.4. — базисные абсолютные приросты). Формулы расчета можно записать следующим образом:
При уменьшении абсолютных значений ряда будет соответственно "уменьшение", "снижение".
Показатели абсолютного прироста свидетельствуют о том, что, например, в 1998 г. производство продукта "А" увеличилось по сравнению с 1997 г. на 4 тыс. т, а по сравнению с 1994 г. — на 34 тыс. т.; по остальным годам см. табл. 11.5 гр. 3 и 4.
Коэффициент роста показывает, во сколько раз изменился уровень ряда по сравнению с предыдущим (гр.5 — цепные коэффициенты роста или снижения) или по сравнению с начальным уровнем (гр.6 — базисные коэффициенты роста или снижения). Формулы расчета можно записать следующим образом:
Темпы роста показывают, сколько процентов составляет последующий уровень ряда по сравнению с предыдущим (гр.7 — цепные темпы роста) или по сравнению с начальным уровнем (гр.8 — базисные темпы роста). Формулы расчета можно записать следующим образом:
Так, например, в 1997 г. объем производства продукта "А" по сравнению с 1996 г. составил 105,5 % (
Темпы прироста показывают, на сколько процентов увеличился уровень отчетного периода по сравнению с предыдущим (гр.9- цепные темпы прироста) или по сравнению с начальным уровнем (гр.10- базисные темпы прироста). Формулы расчета можно записать следующим образом:
Т пр = Т р - 100% или Т пр = абсолютный прирост / уровень предшествующего периода * 100%
Так, например, в 1996 г. по сравнению с 1995 г. продукта "А" произведено больше на 3,8 % (103,8 %- 100%) или (8:210)х100%, а по сравнению с 1994 г. — на 9% (109% — 100%).
Если абсолютные уровни в ряду уменьшаются, то темп будет меньше 100% и соответственно будет темп снижения (темп прироста со знаком минус).
Абсолютное значение 1% прироста (гр. 11) показывает, сколько единиц надо произвести в данном периоде, чтобы уровень предыдущего периода возрос на 1 %. В нашем примере, в 1995 г. надо было произвести 2,0 тыс. т., а в 1998 г. — 2,3 тыс. т., т.е. значительно больше.
Определить величину абсолютного значения 1% прироста можно двумя способами:
Уровень предшествующего периода разделить на 100;
Цепные абсолютные приросты разделить на соответствующие цепные темпы прироста.
Абсолютное значение 1% прироста =
В динамике, особенно за длительный период, важен совместный анализ темпов прироста с содержанием каждого процента прироста или снижения.
Заметим, что рассмотренная методика анализа рядов динамики применима как для рядов динамики, уровни которых выражены абсолютными величинами (т, тыс. руб., число работников и т.д.), так и для рядов динамики, уровни которых выражены относительными показателями (% брака, % зольности угля и др.) или средними величинами (средняя урожайность в ц/га, средняя заработная плата и т.п.).
Наряду с рассмотренными аналитическими показателями, исчисляемыми за каждый год в сравнении с предшествующим или начальным уровнем, при анализе рядов динамики необходимо исчислить средние за период аналитические показатели: средний уровень ряда, средний годовой абсолютный прирост (уменьшение) и средний годовой темп роста и темп прироста.
Методы расчета среднего уровня ряда динамики были рассмотрены выше. В рассматриваемом нами интервальном ряду динамики средний уровень ряда исчисляется по формуле средней арифметической простой:
Среднегодовой объем производства продукта за 1994- 1998 гг. составил 218,4 тыс. т.
Среднегодовой абсолютный прирост исчисляется также по формуле средней арифметической простой:
Ежегодные абсолютные приросты изменялись по годам от 4 до 12 тыс.т (см.гр.3), а среднегодовой прирост производства за период 1995 — 1998 гг. составил 8,5 тыс. т.
Методы расчета среднего темпа роста и среднего темпа прироста требуют более подробного рассмотрения. Рассмотрим их на примере приведенных в таблице годовых показателей уровня ряда.
Средний уровень ряда динамики.
Ряд динамики (или временной ряд) - это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).
Числовые значения того или иного статистического показателя, составляющего ряд динамики, называютуровнями ряда и обычно обозначают буквой y . Первый член ряда y 1 называют начальным или базисным уровнем , а последний y n - конечным . Моменты или периоды времени, к которым относятся уровни, обозначают через t .
Ряды динамики, как правило, представляют в виде таблицы или графика, причем по оси абсцисс строится шкала времени t , а по оси ординат - шкала уровней ряда y .
Средние показатели ряда динамики
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщать в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении изменений того или иного показателя в разные периоды, в разных странах и т.д.
Обобщенной характеристикой ряда динамики может служить прежде всего средний уровень ряда . Способ расчета среднего уровня зависит от того, моментный ряд или интервальный (периодный).
В случае интервального ряда его средний уровень определяется по формуле простой средней арифметической величины из уровней ряда, т.е.
=
Если имеется моментный
ряд, содержащий n
уровней (y1, y2, …, yn
) с равными промежутками между датами (моментами времени), то такой ряд легко преобразовать в ряд средних величин. При этом показатель (уровень) на начало каждого периода одновременно является показателем на конец предыдущего периода. Тогда средняя величина показателя для каждого периода (промежутка между датами) может быть рассчитана как полусумма значений у
на начало и конец периода, т.е. как . Количество таких средних будет . Как указывалось ранее, для рядов средних величин средний уровень рассчитывается по средней арифметической.
Следовательно, можно записать:
.
После преобразования числителя получаем:
,
где Y1 и Yn — первый и последний уровни ряда; Yi — промежуточные уровни.
Эта средняя известна в статистике как средняя хронологическая для моментных рядов. Такое название она получила от слова «cronos» (время, лат.), так как рассчитывается из меняющихся во времени показателей.
В случае неравных
промежутков между датами среднюю хронологическую для моментного ряда можно рассчитать как среднюю арифметическую из средних значений уровней на каждую пару моментов, взвешенных по величине расстояний (отрезков времени) между датами, т.е.
.
В данном случае
предполагается, что в промежутках между датами уровни принмали разные значения, и мы из двух известных (yi
и yi+1
) определяем средние, из которых затем уже рассчитываем общую среднюю для всего анализируемого периода.
Если же предполагается, что каждое значение yi
остается неизменным до следующего (i+
1)-
го момента, т.е. известна точная дата изменения уровней, то расчет можно осуществлять по формуле средней арифметической взвешенной:
,
где - время, в течение которого уровень оставался неизменным.
Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели - среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.
Базисное среднее абсолютное изменение представляет собой частное от деления последнего базисного абсолютного изменения на количество изменений. То есть
Цепное среднее абсолютное изменение уровней ряда представляет собой частное от деления суммы всех цепных абсолютных изменений на количество изменений, то есть
По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность.
Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными.
Наряду со средними абсолютным изменением рассчитывается и среднее относительное тоже базисным и цепным способами.
Базисное среднее относительное изменение определяется по формуле:
Цепное среднее относительное изменение определяется по формуле:
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность.
Вычитанием 1 из базисного или цепного среднего относительного изменения образуется соответствующий среднийтемп изменения
, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики.
Сезонные колебания и индексы сезонности.
Сезонные колебания - устойчивые внутригодичные колебания.
Основной принцип хозяйствования для получения максимального эффекта - это максимизация доходов и минимизация затрат. Изучая сезонные колебания решается задача максимального уравнения в каждом уровне года.
При изучении сезонных колебаний решаются две взаимосвязанные задачи:
1. Выявление специфики развития явления во внутригодовой динамике;
2. Измерение сезонных колебаний с построением модели сезонной волны;
Для измерения сезонных колебаний обычно исчисляют индеек сезонности. В общем виде они определяются отношением исходных уравнений ряда динамики к теоретическим уравнениям, выступающим в качестве базы для сравнения.
Так как на сезонные колебания накладываются случайные отклонения, для их устранения производят усреднение индексов сезонности.
В этом случае для каждого периода годового цикла определяются обобщенные показатели в виде средних сезонных индексов:
Средние индексы сезонных колебаний свободны от влияние случайных отклонений основной тенденции развития.
В зависимости от характера тренда формула среднего индекса сезонности может принимать следующие виды:
1. Для рядов внутригодовой динамики с ярковыраженной основной тенденцией развития:
2. Для рядов внутригодовой динамики в которой повышающийся или снижающийся тренд отсутствует, либо незначителен:
Где - общее среднее;
Методы анализа основной тенденции.
На развитие явлений по времени оказывают влияние факторы различные по характеру и силе воздействия. Некоторые из них носят случайный характер, другие оказывают практически постоянное воздействие и формируют в рядах динамики определенную тенденцию развития.
Важной задачей статистики является выявление в рядах динамики тренда, освобожденного от действия различных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней и аналитического выравнивания и др.
Метод укрупнения интервалов основан на укрупнении периодов времени, к которым относятся уровни ряда динамики, т.е. представляет из себя замену данных, имеющих отношение к мелким временным периодам, данными по более крупным периодам. Особенно эффективен, когда первоначальные уровни ряда относятся к коротким промежуткам времени. Например, ряды показателей, относящиеся к ежедневным событиям, заменяются рядами, относящимся к недельным, помесячным и т.д. Это позволит более отчетливо показать «ось развития явления» . Средняя, исчисленная по укрупненным интервалам, позволяет выявлять направление и характер (ускорение или замедление роста) основной тенденции развития.
Метод скользящей средней схож с предыдущим, но в данном случаефактические уровнизаменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих m уровней ряда.
Например , если принять m=3, то вначале рассчитывается средняя из первых трех уровней ряда, затем - из такого же числа уровней, но начиная со второго по счету, далее - начиная с третьего и т.д. Таким образом, средняя как бы «скользит» по ряду динамики, передвигаясь на один срок. Рассчитанные из m членов скользящие средние относятся к середине (центру) каждого интервала.
Этот метод устраняет лишь случайные колебания. Если же ряд имеет сезонную волну, то она сохранится и после сглаживания методом скользящей средней.
Аналитическое выравнивание. В целях устранения случайных колебаний и выявления тренда применяется выравнивание уровней ряда по аналитическим формулам (или аналитическое выравнивание). Его суть состоит в замене эмпирических (фактических) уровней теоретическими , которые рассчитаны по определенному уравнению, принятому за математическую модель тренда, где теоретические уровни рассматриваются как функция времени: . При этом каждый фактический уровень рассматривается как сумма двух составляющих: , где - систематическая составляющая и выраженная определенным уравнением, а - случайная величина, вызывающая колебания вокруг тренда.
Задача аналитического выравнивания сводится к следующему:
1. Определение на основе фактических данных вида гипотетической функции , способной наиболее адекватно отразить тенденцию развития исследуемого показателя.
2. Нахождение по эмпирическим данным параметров указанной функции (уравнения)
3. Расчет по найденному уравнению теоретических (выровненных) уровней.
Выбор той или иной функции осуществляется, как правило, на основе графического изображения эмпирических данных.
В качестве моделей служат уравнения регрессии, параметры которых рассчитывают по способу наименьших квадратов
Ниже приводятся наиболее часто используемые для выравнивания динамических рядов уравнения регрессии с указанием для отражения каких именно тенденций развития они наиболее всего подходят.
Для нахождения параметров приведенных выше уравнений существуют специальные алгоритмы и компьютерные программы. В частности для нахождения параметров уравнения прямой может быть использован такой алгоритм:
Если периоды или моменты времени пронумеровать так, чтобы получилось St =0, то вышеприведенные алгоритмы существенно упростятся и превратятся в
Выровненные уровни на графике расположатся на одной прямой, проходящей на самом близком расстоянии от фактических уровней данного динамического ряда. Сумма квадратов отклонений является отражением влияния случайных факторов.
С ее помощью рассчитаем среднюю (стандартную) ошибку уравнения :
Здесь n - число наблюдений, а m - число параметров в уравнении (их у нас два - b 1 и b 0).
Основная тенденция (тренд) показывает, как воздействуют систематические факторы на уровни ряда динамики, а колеблемость уровней около тренда () служит мерой воздействия остаточных факторов.
Для оценки качества используемой модели динамического ряда применяется также критерий F Фишера . Он представляет из себя отношение двух дисперсий, а именно отношение дисперсии, вызванной регрессией, т.е. изучаемым фактором, к дисперсии, вызванной случайными причинами, т.е. остаточной дисперсией:
В развернутом виде формула этого критерия может быть представлена так:
где n - число наблюдений, т.е. число уровней ряда,
m - число параметров в уравнении, y - фактический уровень ряда,
Выровненный уровень ряда, - средний уровень ряда.
Более удачная, чем другие, модель не всегда может оказаться достаточно удовлетворительной. Ее можно признать таковой только в том случае, когда критерий F у нее перешагнет известную критическую границу. Эта граница устанавливается с помощью таблиц F-распределения.
Сущность и классификация индексов.
Под индексом в статистике понимают относительный показа-тель, характеризующий изменение величины какого-либо явления во времени, пространстве или по сравнению с любым эталоном.
Основным элементом индексного отношения является индек-сируемая величина. Под индексируемой величиной понимают зна-чение признака статистической совокупности, изменение которого яв-ляется объектом изучения.
С помощью индексов решаются три главные задачи:
1) оценка изменения сложного явления;
2) определение влияния отдельных факторов на изменение сложного явления;
3) сравнение величины какого-то явления с величиной прошло-го периода, величиной по другой территории, а также с нор-мативами, планами,прогнозами.
Индексы классифицируют по 3-м признакам:
2) по степени охвата элементов совокупности;
3) по методам расчета общих индексов.
По содержанию индексируемых величин индексы разделяют-ся на индексы количественных (объемных) показателей и индексы ка-чественных показателей. Индексы количественных показателей -индексы физического объема промышленной продукции, физического объема продаж, численности и др. Индексы качественных показате-лей — индексы цен, себестоимости, производительности труда, средней заработной платы и др.
По степени охвата единиц совокупности индексы делятся на два класса: индивидуальные и общие. Для их характеристики введем следующие условные обозначения, принятые в практике применения индексного метода:
q - количество (объем) какого-либо продукта в натуральном вы-ражении; р - цена единицы продукции; z - себестоимость единицы продукции; t — затраты времени на производство единицы продукции (тру-доемкость); w — выработка продукции в стоимостном выражении в единицу времени; v - выработка продукции в натуральном выражении в единицу времени; Т — общие затраты времени или численность работников.
Для того чтобы различать, к какому периоду или объекту отно-сятся индексируемые величины, принято справа внизу за соответст-вующим символом ставить подстрочные знаки. Так, например, в ин-дексах динамики, как правило, для сравниваемых (текущих, отчетных) периодов используется подстрочный знак 1 и для периодов, с которы-ми производится сравнение,
Индивидуальные индексы служат для характеристики изме-нения отдельных элементов сложного явления (например -изменение объема выпуска продукции одного вида). Они представляют собой относительные величины динамики, выполнения обязательств, сравнения индексируемых величин.
Индивидуальный индекс физического объема продукции опре-деляется
С аналитической точки зрения приведенные индивидуальные индексы динамики аналогичны коэффициентам (темпам) роста и ха-рактеризуют изменение индексируемой величины в текущем периоде по сравнению с базисным, т. е. показывают, во сколько раз она воз-росла (уменьшилась) или сколько процентов составляет ее рост (сни-жение). Значения индексов выражают в коэффициентах или процен-тах.
Общий (сводный) индекс отражает изменение всех элементов сложного явления.
Агрегатный индекс является основной формой индекса. Агре-гатным он называется потому, что его числитель и знаменатель пред-ставляют собой набор «агрегат»
Средние индексы, их определение.
Помимо агрегатных индексов в статистике применяется другая их форма - средневзвешенные индексы. К их исчислению прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать общий агрегатный индекс. Так, если отсутствуют данные о ценах, но имеется информация о стоимости продукции в текущем периоде и известны индивидуальные индексы цен по каждому товару, то общий индекс цен как агрегатный определить нельзя, однако возможно исчислить его как средний из индивидуальных. Точно так же, если не известны количества произведенных отдельных видов продукции, но известны индивидуальные индексы и стоимость продукции базисного периода, то можно определить общий индекс физического объема продукции как средневзвешенную величину.
Средний индекс - это индекс, вычисленный как средняя величина из индивидуальных индексов. Агрегатный индекс является основной формой общего индекса, поэтому средний индекс должен быть тождествен агрегатному индексу. При исчислении средних индексов используются две формы средних: арифметическая и гармоническая.
Средний арифметический индекс тождествен агрегатному индексу, если весами индивидуальных индексов будут слагаемые знаменателя агрегатного индекса. Только в этом случае величина индекса, рассчитанного по формуле средней арифметической, будет равна агрегатному индексу.
Кроме математического ожидания случайной величины которое. определяет положение центра распределения вероятностей, количественной характеристикой распределения случайной величины является дисперсия случайной величины
Дисперсию будем обозначать D [х] или .
Слово «дисперсиям означает рассеивание. Дисперсия является числовой характеристикой рассеивания, разброса значений случайной величины относительно ее математического ожидания.
Определение 1. Дисперсией случайной величины называется матемйтическое ожидание квадрата разности случайной величины и ее математического ожидания.(т. е. математическое ожидание квадрата соответствующей центрированной, случайной величины):
Дисперсия имеет размерность квадрата случайной величины. Иногда, для характеристики рассеивания, удобнее пользоваться величиной, размерйость которой совпадает с размерностью случайной величины. Такая величина - среднеквадратичное отклонение.
Определение 2. Среднеквадратичным отклонением случайной величины называется корень квадратный из ее дисперсии:
или в развернутом виде
Среднеквадратичное отклонение обозначают также
Замечание 1. При вычислении дисперсии формулу (1) бывает удобно преобразовать так:
т. е. дисперсия равна разности математического ожидания квадрата случайной величины и квадрата математического ожидания случайной величины.
Пример 1. Производится один выстрел по объекту. Вероятность попадания . Определить математическое ожидание, дисперсию и среднеквадратичное отклонение.
Решение. Строим таблицу значений числа попаданий
Следовательно,
Чтобы представить смысл понятия дисперсии и среднеквадратичного отклонения как характеристики рассеивания случайной величины, рассмотрим примеры.
Пример 2. Случайная величина задана следующим законом распределения (см. таблицу и рис. 413):
Пример 3. Случайная величина задана следующим законом распределения (см. таблицу и рис. 414):
Определить: 1) математическое ожидание, 2) дисперсию, 3) среднеквадратичное отклонение.
Рассеивание, разброс случайной величины в первом примере меньше рассеивания случайной величины во втором примере (см. рис. 414 и 415). Дисперсии этих величин соответственно равны 0,6 и 2,4.
Пример 4; Случайная величина задана следующим законом распределения (см. таблицу и рис. 415):
Определить: 1) математическое ожидание, 2) дисперсию, 3) среднеквадратичное отклонение.