Лекция 15. Статистические оценки |
1. Точечные оценки |
Определение 1. Пусть выборка
Zn | Δ = |
col(X1, ... , Xn) |
F(x,θ) | Δ = |
P{X ≤ x}, |
^ θ(Zn) |
^ θ(zn) |
Определение 2. Оценка
^ θ(Zn) |
M[ |
^ θ(Zn)] = θ. |
Определение 3. Оценка
^ θ(Zn) |
^ θ(Zn) |
P → |
θ при n → ∞. |
Пример 1. Оценка
^ MX |
^ 1)MX), |
^ DX |
M[ |
^ DX] = |
n-1 n |
dX |
^ 3)MX). |
^ SX |
^ MX | Δ = |
1 n |
n ∑ k=1 |
Xk |
Замечание 1. Свойствами состоятельности и несмещенности могут обладать сразу несколько оценок неизвестного параметра θ.
Определение 4. Несмещенная оценка
^ θ |
*(Zn) |
D[ |
^ θ |
*(Zn)] ≤ D[ |
^ θ |
(Zn)] |
^ θ(Zn), |
Замечание 2. Пусть СВ X имеет нормальное распределение N(mX,σX) с неизвестными параметрами
θ1 | Δ = |
mX , θ2 |
Δ = |
σX . |
^ MX |
2. Метод максимального правдоподобия |
Замечание 1. На практике часто удается предсказать вид плотности распределения fX(x,θ1, ... , θs) непрерывной СВ X с точностью до неизвестных параметров θ1, ... , θs (например θ1 = mX, θ2 = dX при s = 2), которые требуется оценить по выборке Zn.
Определение 1. Рассмотрим выборку Zn, соответствующую плотности fX(x,θ1, ... , θs) СВ X. Функцией правдоподобия называется плотность распределения n-мерной СВ Zn с реализацией
zn | Δ = |
col(x1, x2, ... , xn): |
L(zn,θ1, ... , θs) |
Δ = |
fZ |
n |
(zn,θ1, ... , θs) |
Л13.Р1.О1 = |
n ∏ k=1 |
fX(xk,θ1, ... , θs). |
Определение 2. Оценкой максимального правдоподобия (ММП-оценкой), найденной по методу максимального правдоподобия, называется оценка
^ θ(Zn), |
^ θ(Zn) = arg |
max θ |
L(zn,θ), θ |
Δ = |
col(θ1, ... , θs) . |
Замечание 2. Аналогично определяется ММП-оценка θ при неоднородной выборке
Zn | Δ = |
col(X1, ... , Xn), |
Пример 1. Рассмотрим модель линейной регрессии. Пусть СВ Y и W связаны уравнением
Y | Δ = |
ax + b + W, |
Yk | Δ = |
axk + b + Wk , |
zn | Δ = |
col(y1, ... , yn) |
θ1 | Δ = |
a , θ2 |
Δ = |
b, |
L(zn,a,b) | Δ = |
1 (σ√2π)n |
exp{- |
1 2σ2 |
n ∑ k=1 |
(yk - axk - b)2}, |
~ L(zn,a,b) | Δ = |
ln L(zn,a,b) = - |
1 2σ2 |
n ∑ k=1 |
(yk - axk - b)2 - n ln(σ√2π), |
∂ ∂a |
~ L(zn,a,b) = |
1 σ2 |
n ∑ k=1 |
xk(yk - axk - b) = |
= σ-2( | n ∑ k=1 |
xkyk - a | n ∑ k=1 |
xk2 - b | n ∑ k=1 |
xk) = 0, |
∂ ∂b |
~ L(zn,a,b) = |
1 σ2 |
n ∑ k=1 |
(yk - axk - b) = |
= σ-2( | n ∑ k=1 |
yk - a | n ∑ k=1 |
xk - bn) = 0. |
^ a(zn) = |
|
, | ||||||
|
^ b(zn) = |
1 n |
n ∑ k=1 |
yk - |
^ a(zn) n |
n ∑ k=1 |
xk . |
Zn | Δ = |
col(Y1, ... , Yn), |
^ a(Zn), |
^ b(Zn). |
Пример 2. Если, например, СВ Y имеет нормальное распределение N(mY,σY) с неизвестным математическим ожиданием
θ | Δ = |
mY, |
^ MY. |
b | Δ = |
mY, |
^ b(Zn) = |
1 n |
n ∑ k=1 |
Yk |
Δ = |
^ MY. |
Пример 3. Описанная модель линейной регрессии может быть полезной, например, в следующей ситуации. Предположим, нефтедобывающие страны желают спрогнозировать изменение средневзвешенной цены на нефть после планируемого изменения (увеличения или уменьшения) мирового уровня добычи нефти. Пусть xk - ежемесячное изменение мировой добычи нефти, k = 1,n, Yk - ежемесячное изменение цены на нефть. Очевидно, что между Yk и xk имеется некоторая функциональная связь. В первом приближении можно принять ее линейной, т.е. Yk = axk + b + Wk , где Wk - случайная составляющая в цене нефти, отражающая колебание спроса на нефть на мировом рынке. Если по методу максимального правдоподобия, обработав статистику предыдущих лет, вычислить параметры
^ a и |
^ b, |
M[Yk] = |
^ a xk + |
^ b. |
Пример 4. Пусть СВ X имеет равномерное распределение R(m - Δ, m + Δ) с неизвестными параметрами m, Δ. В данном случае
m | Δ = |
M[X] |
L(x1, ... , xn,m,Δ) = | n ∏ i=1 |
f(xi,m,Δ) = ( | 1 2Δ |
)n , |
max i=1,n |
xi - Δ ≤ m ≤ | min i=1,n |
xi + Δ. |
Δ* = |
x(n)-x(1) 2 |
, где x(n) |
Δ = |
max i=1,n |
xi, x(1) |
Δ = |
min i=1,n |
xi, |
m* = | 1 2 |
(x(n)+x(1)). |
^ MX = |
1 n |
n ∑ i=1 |
xi. |
3. Метод наименьших квадратов |
Пример 1. Рассмотрим линейную регрессионную модель из предыдущего раздела, не предполагая, что ошибки Wk имеют нормальное распределение, и, кроме того, считая, что коэффициенты Xk случайны:
Yk | Δ = |
aXk + b + Wk , |
zn |
Δ = |
col(y1, ... , yn, x1, ... , xn) |
Q(zn,a,b) = | 1 n |
n ∑ k=1 |
(yk - axk - b)2 , |
Определение 1. МНК-оценками, полученными по методу наименьших квадратов неизвестных параметров a и b в линейной регрессионной модели
Yk | Δ = |
aXk + b + Wk , |
^ a(Zn) и |
^ b(Zn) , |
Замечание 1. В данном случае видно, что функция Q(zn,a,b) совпадает по форме с точностью до коэффициентов с логарифмической функцией правдоподобия из примера Л15.Р2.П1:
Q(zn,a,b) = -2σ2 |
~ L(zn,a,b) -2σ2n ln(σ√2π). |
^ a и |
^ b , |
~ L(zn,a,b)) |
Замечание 2. Найденные по методу наименьших квадратов оценки
^ a(zn) и |
^ b(zn) |
Пример 2. Вернемся к примеру Л15.Р2.П3 из предыдущего раздела о прогнозировании изменения мировой цены на нефть. Если подобный анализ проводит некоторая нефтеперерабатывающая компания, то ей, как правило, неизвестны планы нефтедобывающих стран по изменению уровня добычи нефти. Поэтому для этой компании ежемесячное изменение мировой добычи нефти естественно считать СВ Xk. Кроме того, статистические свойства колебания Wk спроса на нефть далеко не всегда бывают известны. Поэтому при выборе параметров
^ a и |
^ b |
^ a и |
^ b |
Замечание 3. Исследуем статистические свойства найденных МНК-оценок
^ a(Zn) и |
^ b(Zn) |
Zn |
Δ = |
col(y1, ... , yn, x1, ... , xn) . |
^ a(Zn) и |
^ b(Zn) |
^ MX |
Δ = |
1 n |
n ∑ k=1 |
Xk |
п.н. → |
mX, |
^ MY |
Δ = |
1 n |
n ∑ k=1 |
Yk |
п.н. → |
mY, |
1 n |
n ∑ k=1 |
XkYk |
п.н. → |
M[XY] , |
1 n |
n ∑ k=1 |
Xk2 |
п.н. → |
M[X2] . |
^ a(Zn) |
п.н. → |
a* |
Δ = |
M[XY] - mXmY M[X2] - mX2 |
, |
^ b(Zn) |
п.н. → |
b* |
Δ = |
mY - a*mX . |
kXY |
4)kXY = |
M[XY] = mXmY , σX2 |
6)mX = |
M[X2] - mX2 , rXY |
Δ = |
kXY σXσY |
, |
a* = | σY σX |
rXY . |
Пример 3. Пусть числовые характеристики СВ X и Y известны: mX, σX, mY, σY, rXY, но функциональная связь между СВ X и Y неизвестна. Рассмотрим новую СВ
^ Y | Δ = |
aX + b , |
^ yk | Δ = |
axk + b , |
^ yk |
(a*,b*) = arg |
min a,b |
M[(Y - |
^ Y(X,a,b))2] . |
Q(a,b) | Δ = |
M[(Y - |
^ Y(X,a,b))2] |
Δ = |
M[(Y - aX - b)2] . |
= | || | M[Y - mY] = 0 ; M[(X - mX)(Y - mY)] =
σXσYrXY; M[X - mX] = 0 ; M[(X - mX)2] = σX2 ; M[(Y - mY)2] = σY2 |
|| | = |
^ a(Zn) и |
^ b(Zn) |
Замечание 4. Проанализируем минимальное значение функции Q(a*,b*). По определению Q(a*,b*) = D[Y - a*X - b*] = σY2(1 - rXY2), так как M[Y - a*X - b*] = mY - a*mX - b* = 0. Таким образом, имеем 1 - rXY2 = D[Y - a*X - b*] / σY2, откуда следует, что коэффициент корреляции характеризует относительную (в единицах σY2) величину среднего квадратического отклонения СВ Y от линейной оценки наилучшего приближения
^ Y* | Δ = |
a*X + b* , |
^ y | Δ = |
a*x + b*, |
Пример 4. Проинтерпретируем полезность найденных параметров в
задаче о предсказании
на примере прогнозирования изменения мировой цены на нефть
(пример 2). Если имеется обширная статистика за предыдущие
годы по ценам на нефть и объемам ее добычи, то можно попытаться вычислить
статистические характеристики (выборочные моменты) СВ
Yk и Xk.
В этом случае будет довольно легко спрогнозировать изменение
средней цены на нефть на текущий месяц, не проводя каждый раз громоздкие
вычисления, M[Yk] = a*M[Xk] +
b*.
Замечание 5. Оказывается, что общее решение
задачи о наилучшем приближении СВ Y по наблюдениям за СВ
X тесно связано с
понятием условного МО M[Y|X]. Пусть требуется найти оценку
^ Y | * = φ*(X), |
^ Y | Δ = |
φ(X) |
^ Y | * = M[Y|X] |
Z | Δ = |
col(X,Y) |
^ Y | * = M[Y|X] = mY + |
σYrXY σX |
(X - mX), |
^ Y | * |
^ y* | Δ = |
M[Y|x] |
4. Интервальные оценки |
Замечание 1. Пусть по выборке
Zn | Δ = |
col(X1, ... , Xn) |
^ θ(Zn) |
P{|θ - |
^ θ(Zn)| ≤ y1-p} = 1 - p , |
Y |
Δ = |
|θ - |
^ θ(Zn)|. |
Определение 1. Число
β | Δ = |
1 - p |
Определение 2. Интервал
[ |
^ θ(Zn) - y1-p , |
^ θ(Zn) + y1-p] , |
Замечание 2. Если плотность распределения СВ
Y0 |
Δ = |
^ θ(Zn) - θ |
Y |
Δ = |
|Y0|. |
Замечание 3. Построение доверительных интервалов основано на теореме, сформулированной ниже. Но перед ее формулировкой напомним следующее понятие из линейной алгебры.
Определение 3. Матрица C размерности
n x n с элементами
cij, i = 1,n,
j = 1,n,
называется ортогональной, если CTC =
I,
где I - единичная матрица размерности n
x n, а CT - транспонированная
матрица с элементами cijT = cij,
i = 1,n, j =
1,n.
Замечание 4. Рассмотрим ортогональную матрицу
C
специального вида, у которой первая строка состоит из
элементов c1i = 1/√n,
i = 1,n,
а остальные строки - произвольно допустимые. Такая матрица всегда существует.
Рассмотрим свойства введенной матрицы. 1)  
С в о й с т в а м а т р и ц ы C
n ∑ j=1 |
ckjcij = 0 |
2)  
n ∑ j=1 |
ckj2 = 1 |
3)   Если y = Cx, где y = col(y1, ... , yn) и x = col(x1, ... , xn), то
n ∑ k=1 |
yk2 = | n ∑ k=1 |
xk2. |
n ∑ k=1 |
yk2 = yTy = (Cx)TCx = xTCTCx = xTx = | n ∑ k=1 |
xk2. |
4)  
n ∑ j=1 |
cij = 0 |
n ∑ j=1 |
cij | Зам.4 = |
√n | n ∑ j=1 |
c1jcij = 0. |
Теорема 1 (Фишера). Пусть
Zn | Δ = |
col(X1, ... , Xn) |
^ MX и |
^ DX |
* MX |
Δ = |
( |
^ MX - m)√n / σX |
* DX |
Δ = |
^ DX / σX2 |
o MX |
Δ = |
( |
^ MX - m) |
√ | n - 1 ^ DX |
^ MX и |
^ DX |
Доказательство.
^ MX = |
1 n |
n ∑ i=1 |
Xi |
^ 1)MX |
D[ |
^ MX] = σX2 / n. |
( |
^ MX - mX)√n / σX ~ N(0,1). |
Y = | 1 σX |
CZn, |
Y | Δ = |
col(Y1, ... , Yn), Zn |
Δ = |
col(X1, ... , Xn), |
Yk = | n ∑ j=1 |
ckj σX |
Xj, Y1 = | n ∑ j=1 |
c1j σX |
Xj = | 1 σX√n |
n ∑ j=1 |
Xj | Л13.Р3.О2 = |
√n σX |
^ MX. |
M[Y1] | ^ 1)MX = |
√n σX |
mX, |
M[Yk] = M[ | n ∑ j=1 |
ckj σX |
Xj] = | mX σX |
n ∑ j=1 |
ckj | 4)C = |
0, k = 2,n, |
D[Yk] | 4)M[X] = |
n ∑ j=1 |
ckj2 σX2 |
D[Xj] = | n ∑ j=1 |
ckj2 | 2)C = |
1, k = 1,n. |
σX2KYkYi = σX2M[YkYi] = M[ | n ∑ j=1 |
ckjXj | n ∑ l=1 |
cilXl] = |
= | n ∑ j≠l |
ckjcilM[Yj]M[Yl] + | n ∑ j=1 |
ckjcijM[Yj2] = |
= mX2 | n ∑ j=1 |
ckj | n ∑ j=1 |
cil - mX2 | n ∑ j=1 |
ckjcij + M[X2] | n ∑ j=1 |
ckjcij = 0, |
^ DX, |
^ nDX σX2 |
= |
1 σX2 |
n ∑ j=1 |
(Xj - |
^ MX |
)2 = |
1 σX2 |
n ∑ j=1 |
(Xj2 - 2Xj |
^ MX + |
^ MX2) = |
= |
1 σX2 |
( |
n ∑ j=1 |
Xj2 - 2n |
^ MX2 + n |
^ MX2) = |
1 σX2 |
n ∑ j=1 |
Xj2 - |
n σX2 |
^ MX2 |
3)C = |
= |
n ∑ k=1 |
Yk2 - Y12 = |
n ∑ k=2 |
Yk2, |
* DX |
Δ = |
^ DX / σX2 ~ X2(n-1). |
^ DX = |
σX2 n |
n ∑ j=1 |
Yk2 , |
^ MX = |
σX √n |
Y1, |
^ DX, |
^ MX, |
Y1 |
Δ = |
Y1 - |
√n σX |
mX = |
√n σX |
( |
^ MX - mX), |
M[ |
^ MX] = mX |
Y1 и |
^ DX |
^ DX и |
^ MX, |
T |
Δ = |
Y1 |
√ | n - 1 Y22+...+Yn2 |
= ( |
^ MX - mX) |
√n σX |
√ | (n - 1) σX2 ^ nDX |
Δ = |
o MX . |
o MX ~ S(n - 1). |
Пример 1. Для нормальной выборки Zn требуется построить доверительный интервал для неизвестного МО mX при известной дисперсии σX2. Из теоремы 1 следует, что СВ
^ MX |
o Y = |
^ MX - mX, |
^ MX(Zn) - |
σX √n |
uα ≤ mX ≤ |
^ MX(Zn) + |
σX √n |
uα . |
α |
Δ = |
1 - p / 2 |
p |
Δ = |
2(1 - α), |
Пример 2. Используя замечание 2 и теорему 1 можно построить доверительный интервал для неизвестного mX СВ X, имеющей нормальное распределение N(mX,σX) и в случае, когда величина σX неизвестна:
^ MX(Zn) - |
√ |
^
DX(Zn) n-1 |
tα(n-1) ≤ mX ≤ |
^ MX(Zn) + |
√ |
^
DX(Zn) n-1 |
tα(n-1) , |
α |
Δ = |
1 - p / 2 |
Замечание 5. В отличие от предыдущего случая длина доверительного интервала случайна и зависит от СВ
^ DX . |
Пример 3. Доверительный интервал для неизвестного параметра σX СВ X ~ N(mX,σX) также можно получить, используя теорему 1,
n χα(n-1) |
^ DX(Zn) ≤ σX2 ≤ |
n χ1-α(n-1) |
^ DX(Zn) , |