Лекция 13. Основные выборочные характеристики


  1. Выборочная функция распределения


Замечание 1.   Математическая статистика - это наука o математических методах, позволяющих по статистическим данным (реализациям СВ) построить теоретико-вероятностную модель исследуемого явления. Задачи математической статистики являются, в некотором смысле, обратными к задачам теории вероятностей. Центральным понятием математической статистики является выборка.

Определение 1.   Случайной выборкой (выборкой) объема n называется случайный вектор

Zn
Δ
=

col(X1, ... , Xn),
где СВ Xi, i = 1,n являются независимыми и одинаково распределенными с функцией распределения

F(x)
Δ
= FX.
Будем говорить, что выборка Zn соответствует функции распределения F(x).

Замечание 2.   В определении 1 выборка Zn рассматривается априорно (до опыта) и поэтому является случайным вектором. Если же рассматривать выборку апостериорно (после опыта), то она будет уже реализацией многомерной СВ Zn, т.е. неслучайным вектором

zn
Δ
=

col(x1, ... , xn)
Из определения 1 вытекает, что апостериорную выборку zn можно также рассматривать как набор x1, ... , xn из n реализаций одной и той же СВ в серии из n независимых одинаковых опытов.

Пример 1.   Пусть требуется определить неизвестную долю белых шаров в урне. По схеме случайного выбора с возвращением отобрано n шаров. Будем считать, что реализация xk СВ Xk равна 1, если k-ый выбранный шар оказался белым и xn = 0 в противном случае. Здесь СВ Xk независимы и одинаково распределены, причем вероятность p того, что будет извлечен белый шар

p
Δ
=

P{Xk = 1},
равна по величине доле белых шаров в урне. Соответственно вероятность того, что будет извлечен черный шар

q
Δ
=

P{Xk = 0},
равна q = 1 - p. Таким образом, выборка

Zn
Δ
=

col(X1, ... , Xn)
соответствует распределению Бернулли. Пусть значения p и q априори (до опыта) неизвестны. В соответствии с теоремой Бернулли (Л10.Р2.Т5) доля белых шаров p в выборке может быть оценена с помощью СВ
^
p
Δ
=

1
n

   n
 
 k=1

Xk,
которая формируется по выборке

Zn
Δ
=

col(X1, ... , Xn).
Однако, если выборка Zn уже реализовалась как

zn
Δ
=

col(x1, ... , xn),
то апостериорная (после опыта) оценка

p
Δ
=

1
n

   n
 
 k=1

xk,
является неслучайной величиной, т.е. реализацией СВ
^
p,
причем такой, что p ≈ p, если n достаточно велико.

Замечание 3.   Одна из основных задач математической статистики состоит в вычислении статистических характеристик изучаемой СВ на основе информации, содержащейся в выборке.

Определение 2.   Если апостериорную выборку x1, ... , xn располагать не в порядке ее получения (нижний индекс), а в порядке возрастания полученных значений (верхний индекс) x(1) x(2) ≤ ... ≤ x(n), то получим упорядоченный ряд апостериорной выборки. Если теперь обозначить через X(k), k = 1,n, случайные величины, которые при каждой реализации zn априорной выборки Zn принимают k-ые (по верхнему номеру) значения x(k), то получим упорядоченную последовательность СВ X(1) ≤ ... ≤ X(n), называемую вариационным рядом выборки.

Определение 3.   Элементы X(k) вариационного ряда называются порядковыми статистиками, а крайние члены вариационного ряда X(1), X(n) - экстремальными порядковыми статистиками.

Определение 4.   Пусть x - произвольная точка на оси Ox, а M(x) - случайное число элементов априорной выборки объема n, попавших не правее точки x. Таким образом, если x(1) ≤ ... ≤ x(i-1) x x(i) ≤ ... ≤ x(n), то реализация СВ M(x) равна m(x) = i-1, где m(x) - конкретное число элементов из реализации x(1), ... , x(n) вариационного ряда, попавших левее точки x. Частота
 ^
Fn
Δ
=

M(x)/n
называется выборочной функцией распределения, а реализация

Fn
Δ
=

m(x)/n
выборочной функции
 ^
Fn(x)
оказывается ступенчатой функцией (рис. 1).

Рисунок 1
Рисунок 1.

Замечание 4.   Выборочная функция распределения
 ^
Fn(x)
в каждой точке x является оценкой соответствующего значения функции распределения F(x) СВ X. В силу усиленного закона больших чисел (теорема Бернулли) при n → +∞ последовательность СВ
 ^
Fn(x)
в каждой точке x О R1 сходится почти наверное к значению функции F(x). Действительно, с каждой СВ Xk, k = 1,n, свяжем два события {Xkx} и {Xk > x}. Так как все СВ Xk имеют одно и то же распределение F(x), то вероятности таких событий равны

p
Δ
=

P{Xk x}
Δ
=

F(x),   q
Δ
=

P{Xk > x} = 1 - F(x).
Если событие {Xk ≤ x} назвать успехом, то M(x) (число элементов выборки левее x) есть число успехов в серии из n независимых испытаний. В рассматриваемом случае СВ
 ^
Fn
Δ
=

M(x)/n
есть частота успехов. Тогда по теореме Бернулли (Л10.Р2.Т5) получаем, что

 ^
Fn
п.н.

F(x).


  2. Гистограмма


Замечание 1.   Рассмотрим процедуру группировки выборки. Для этого разделим точками α0, ... , αj+1 действительную ось R1 = (-∞,+∞) на

L
Δ
=

j+1
непересекающихся полуинтервалов (разрядов) Δk = (αk,αk+1], k = 0,j, таким образом, что -∞ = α0 < α1 < ... < αj < αj+1 = +∞,   α1 < x(1),   αj > x(n). Для каждого k-го разряда Δk, k = 1,j-1, вычислим частоту попадания элементов выборки в этот разряд. Получаем

pk
Δ
=

mk / n,
где mk - число элементов выборки zn, попавших в k-ый разряд.

Определение 1.   Последовательность детерминированных величин pk, k = 1, j-1 , называется статистическим рядом, а его реализация представляется в виде таблицы:
(α1,α2]   ...   (αj-1,αj]
p1   ...   pj-1

Определение 2.   Изобразим графически статистический ряд. На оси Ox отложим разряды и на них, как на основании, построим прямоугольники, имеющие площадь pk. Полученная ступенчатая функция fn называется гистограммой рис.2.

Рисунок 2
Рисунок 2.

Замечание 2.   На интервалах (-∞,α1] и [αj,+∞) построить такие прямоугольники нельзя, так как α1 < x(1), αj < x(n). Необходимость введения разрядов Δ0 и Δj будет ясна из лекции 16.


  3. Выборочные среднее и дисперсия


Определение 1.   Для выборки объема n выборочными начальными и центральными моментами порядка r (r = 1,2,...) называются соответственно СВ
^
νr
Δ
=

1
n

   n
 
 k=1

(Xk)r ,  
^
μr
Δ
=

1
n

   n
 
 k=1

(Xk-
^
ν1

)r .

Определение 2.   Выборочным средним и выборочной дисперсией называются соответственно
 ^
MX
Δ
=
^
ν1
Δ
=

1
n

   n
 
 k=1

Xk ,    
 ^
DX
Δ
=
^
μ2
Δ
=

1
n

   n
 
 k=1

(Xk-
 ^
MX

)2 .

Замечание 1.   При достаточно общих предположениях о виде неизвестной функции распределения F(x) выборочные моменты близки к соответствующим теоретическим характеристикам νr, μr.

 
С в о й с т в а  

 ^        ^
Mx и Dx :


1)  

M[
 ^
MX

] = mX ,
где

mX
Δ
=

M[X].
Действительно, по определению

 M[
 ^
MX]
Δ
=

M[

1
n

   n
 
 k=1

Xk] 
2)mx
  =

 1
 n

M[

   n
 
 k=1

Xk] = mX .

2)  

 D[
 ^
MX

] = dX / n ,
где

dX
Δ
=

D[X].
Имеем:

 D[
 ^
MX]
Δ
=

D[

1
n

   n
 
 k=1

Xk] 
7)mx
  =

 1
 n2

D[

   n
 
 k=1

Xk]
4)M[X]
    =

 1
 n2

   n
 
 k=1

D[Xk] = 

 dX
  n

.

3)  

M[
 ^
DX] = 

n-1
  n

DX .
Действительно:

 M[
 ^
DX]
Δ
=

M[

1
n

   n
 
 k=1

(Xk - 
 ^
MX

)2] 
Δ
=

1
n

M[

   n
 
 k=1

(Xk - 

1
n

   n
 
 i=1

Xi)2]
1)M[X]
    =
= 1
n
   n
 
 k=1
M[(Xk -  1
n
   n
 
 i=1
Xi)2] = 1
n
   n
 
 k=1
M[(Xk - mX - 1
n
   n
 
 i=1
(Xi - mX))2]=

=

1
n

   n
 
 k=1

M[(

n-1
  n

(Xk - mX) -

1
n

 
 
  i≠k

(Xi - mX))2]
4)M[X]
    =
= 1
n
   n
 
 k=1
( (n-1)2
    n2
dX + n-1
  n2
dX) = n-1
  n
dX .

Замечание 2.   Таким образом, МО выборочного среднего совпадает с МО СВ X, а МО выборочной дисперсии
 ^
DX
не совпадает с дисперсией dX СВ X. В этом смысле СВ
 ^
DX
является смещенной оценкой dX. Поэтому часто вместо
 ^
DX
используют несмещенную оценку дисперсии
 ^
SX
Δ
=

  n
n-1
 ^
DX .

Определение 3.   Несмещенной выборочной дисперсией называется СВ:
 ^
SX
Δ
=

  1
n-1

   n
 
 k=1

(Xk-
 ^
MX

)2 = 

  n
n-1
 ^
DX .

4)  

M[
 ^
SX

] = dX .
Действительно,

M[
 ^
SX

] =

  n
n-1

M[
 ^
DX

]
    ^
3)M[X]
    =

dX .




Лекция 14.
Оглавление

Hosted by uCoz