Главная страница
qrcode

Выборочные характеристики статистических распределений


Скачать 199.5 Kb.
НазваниеВыборочные характеристики статистических распределений
АнкорВыборочные характеристики.doc
Дата19.09.2017
Размер199.5 Kb.
Формат файлаdoc
Имя файлаВыборочные характеристики.doc
ТипДокументы
#3257
Каталог

Выборочные характеристики

статистических распределений



Статистическое распределение содержит полную информацию об изменчивости (вариации) признака. Однако на практике часто нет необходимости непосредственно использовать статистическое распределение, достаточно знать некоторые сводные характеристики, которые довольно успешно и полно описывают основные свойства распределения.

Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих видов: 1) средние; 2) характеристики вариации (рассеяния).

Существуют различные виды средних: средняя арифметическая, средняя геометрическая, средняя гармоническая и др. Это так называемые аналитические средние. Основным видом аналитических средних является средняя арифметическая, или выборочная средняя. Выборочная средняя характеризует типичное для выборки значение признака Х. Она также приближенно характеризует (оценивает) типичное для генеральной совокупности значение признака Х .

Если данные наблюдения не сгруппированы, то выборочная средняя рассчитывается как простая средняя арифметическая:

.

Если же данные сгруппированы, то выборочная средняя рассчитывается как взвешенная средняя по одной из следующих формул:



Здесь частоты miи частости wi являются весами.

Следует отметить, что данные формулы непосредственно применимы только к статистическому распределению дискретного признака (дискретному ряду).

Кроме рассмотренной средней арифметической, для статистических распределений используют еще структурные, или порядковые, средние. Из них наиболее часто применяют медиану и моду.

Медиана хме - это серединное значение признака Х, то есть значение признака, которое делит ранжированный вариационный ряд на две равные по численности группы. Медиана хме определяется следующим образом:

, если n = 2j - четное;

хме=хj+1 , если = 2j+1 - нечетное.

Из определения накопленной относительной частоты следует, что

.

Мода - наиболее часто встречающееся значение признака X, то есть такое значение признака X в выборке, которому соответствует наибольшая частота. Следовательно, хмo=xi , если m=mmax .

Если  = хмo = хме, то распределение признака Х симметричное. При нарушении симметрии равенство нарушается (хотя бы одно).

Рассмотренные средние тем более характерны для данного распределения, чем теснее группируются отдельные варианты вокруг средней, то есть чем менее они рассеяны.

Поэтому средние характеристики должны быть дополнены измерением вариации признака относительно средней, то есть характеристиками рассеяния.

Самую грубую оценку рассеяния значений признака дает размах вариации R = хmax-хmin , который учитывает лишь два крайних значения признака. Но он не дает представления о расположении вариант вокруг средней.

Для оценки колеблемости значений признака относительно средней чаще всего используют дисперсию.

Выборочная дисперсия есть выборочная средняя арифметическая квадратов отклонений значений признака X от выборочной средней , то есть

.

Если данные наблюдения не сгруппированы, то выборочная дисперсия определяется следующей формулой:

.

Для сгруппированных данных находят выборочную взвешенную дисперсию:

и .

Эти формулы непосредственно применимы только к статистическому распределению дискретного признака (дискретному ряду).

Выборочную дисперсию еще можно определить по формуле

,

то есть выборочная дисперсия равна среднему квадрату без квадрата средней.

Средний квадрат есть выборочная средняя арифметическая квадратов значений признака X (данные наблюдения не сгруппированы и сгруппированы, соответственно):

и .

Однако дисперсия вследствие суммирования квадратов отклонений дает искаженное представление о самой величине отклонений, измеряя их в квадратных единицах. Поэтому, используя дисперсию, вводят еще характеристики: выборочное среднее квадратическое отклонение и коэффициент вариации .

Выборочное среднее квадратическое отклонение () есть арифметическое значение корня квадратного из выборочной дисперсии, т.е.

.

Оно показывает, на сколько в среднем отклоняются значения xj признака X от выборочной средней . Измеряется в тех же единицах, что и сам признак. Величина является наиболее удобной и чаще всего применяемой характеристикой рассеяния.

Коэффициент вариации равен процентному отношению среднего квадратического отклонения к средней, то есть . Он показывает, сколько процентов от выборочной средней составляет среднее квадратическое отклонение. Коэффициент вариации характеризует однородность совокупности значений признака. На практике считают, что если , то совокупность считается однородной, в противном случае - неоднородной. Этот коэффициент применяют еще для сравнения вариации признаков, имеющих разные единицы измерения (разные наименования).

Замечание. Приведенные выше формулы вычисления выборочных характеристик, применимые только к дискретному ряду, могут быть использованы для приближенного вычисления выборочных характеристик непрерывного признака, представленного интервальным рядом. Для этого предварительно каждый интервал (xi-1-xi) заменяется его серединой  = (xi-1+xi) / 2, то есть производится замена интервального ряда дискретным, соответствующим ему приближенно.

Пример 1. Найти числовые характеристики распределения предприятий по числу работающих.

Решение. Признак Х - число работающих (чел.) на предприятии. Для расчета характеристик данного распределения удобнее использовать таблицу:

Число работающих

на предприятии,

хi ,чел.

Число предприятий, mi

хi mi

Н(хi)

(хi -)2 mi

хi2mi

150

250

350

450

550

650

750

1

3

7

30

19

15

5

150

750

2450

13500

10450

9750

3750

0

1

4

11

41

60

75

129600

202800

179200

108000

30400

294000

288000

22500

187500

857500

6045000

5747500

6337500

2812500

Итого

80

40800

-

1232000

22040000

510 (чел.) - среднее число работающих на предприятии.

Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj xi при Н(хi) + 1 £ £ Н(хi+1). Для рассматриваемого примера: xj = 450 при 12£ £ 41.

Объем выборки = 80 - число четное. Пусть n = 2j , тогда = 40. Поэтому

450 (чел.).

Частота достигает максимума: mi = mmax = 30 при xi = 450, поэтому хмо = 450 (чел.).

Очевидно, хмo= хме¹ - распределение асимметричное.

R = хmax - хmin= 750 - 150 = 600 (чел.).

Дисперсию вычислим двумя способами:

1) ;

2)

= 275500 - (510)2 = 15400.

Тогда (то есть численность работающих на каждом предприятии отклоняется от средней численности в среднем на 124 чел.).

» 24,3 %.

Так как , то можно считать совокупность однородной.

Пример 2.Найти числовые характеристики распределения затрат времени на обработку одной детали.

Решение. Признак Х - затраты времени (мин) на обработку одной детали - непрерывный. Распределение задано интервальным рядом. Характеристики такого ряда находят по тем же формулам, что и для дискретного ряда, предварительно заменив интервальный ряд дискретным. Для этого каждый интервал xi-1-xi заменяется его серединой . Расчеты представим в таблице:

Затраты времени на обработку

1 детали,

Х, мин: xi-1-xi

Число рабочих,

mi



mi

Н()



()2 mi

22-24

24-26

26-28

28-30

30-32

32-34

2

12

34

40

10

2

23

25

27

29

31

33

46

300

918

1160

310

66

0

2

14

48

88

98

50

108

34

40

90

50

1058

7500

24786

33640

9610

2178

Итого

100

-

2800

-

372

78772

28 (мин) - среднее время на обработку одной детали.

Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = при Н() + 1 £ £ Н(). Для рассматриваемого примера xj = 29 при 49£ £ 88.

Объем выборки = 100 - число четное. Пусть n = 2j , тогда = 50. Поэтому

29 (мин).

Частота достигает максимума: mi = mmax = 40 при xi = 29, поэтому хмо=29 (мин).

Очевидно, хмo = хме ¹ - распределение асимметричное.

R = хmax - хmin = 34 - 22 = 12 (мин).

Дисперсию найдем двумя способами:

1) ;

2) ;

= 787,72 - (28)2 = 3,72.

 » 1,93 (мин), то есть затраты времени на обработку одной детали каждым рабочим отклоняются от средних затрат времени в среднем на 1,93 мин.

, <33%. Исследуемая совокупность однородная.




перейти в каталог файлов


связь с админом