Лекция 8. Условные распределения |
1. Условная функция распределения |
Замечание 1. Рассмотрим задачу, обратную по отношению к той, которая решается в соответствии со свойствами 6)f(x,y) и 4)F(x,y): как найти закон распределения двумерной СВ
Z | Δ = |
col(X,Y), |
Определение 1. Пусть СВ Y является дискретной с реализациями yj, j = 0,m. Условной функцией распределения СВ X при условии, что СВ Y = yj, называется условная вероятность
Fx( x | yj ) | Δ = |
P{X ≤ x, Y = yj} P{Y = yj} |
, j = 0,m , x О R1 , |
Определение 2. Пусть для всех x О R1 плотности f(x,y) и fY(y) непрерывны в точке y О R1 и fY(y) ≠ 0. Условной функцией распределения СВ X при условии, что СВ Y = y, называется предел при Δy >0 следующей условной вероятности:
Fx( x | y ) | Δ = |
lim Δy→0 |
P{X ≤ x, |Y - y| ≤ Δy} P{|Y - y| ≤ Δy} |
. |
Замечание 2. Аналогично определяется условная функция распределения FY( y | x ) СВ Y при условии, что СВ X = x.
Замечание 3. Убедимся в корректности определения 2. Пусть СВ
Z | Δ = |
col(X,Y), |
FX( x | y) = | 1 fY(y) |
x ∫ -∞ |
f(x,y) dx . |
P(D) | Δ = |
P{ X ≤ x, |Y - y| ≤ Δy} |
P(D) | 16)P = |
P{|Y - y| ≤ Δy}•P{X ≤ x|y - Δy ≤ Y ≤ y + Δy}. |
Рисунок 1.
P{X ≤ x|y - Δy ≤ Y ≤ y + Δy} = | P{X ≤ x , |Y - y| ≤ Δy} P{|Y - y| ≤ Δy} | = |
= |
x ∫ ( -∞ |
y+Δy ∫ y-Δy |
f(x,y) dy) dx |
= |
y+Δy ∫ y-Δy |
fY(y) dy |
= |
| |
по теореме о среднем значении |
| |
= |
1 ≈ fx(y) |
x ∫ -∞ |
f(x, |
~ y |
) dx , |
где |
~ y | и | ≈ y |
- некоторые точки из интервала (y,y+Δy). |
~ y | → y , | ≈ y |
→ y, P{X ≤ x|y - Δy ≤ Y ≤ y + Δy} → Fx(x|y). |
1) Fx( x | y ) определена для всех x О R1. Это следует из определения Fx( x | y ) и замечания 3.
2) Fx( x | y ) О [0,1] для всех x О R1. Условная вероятность принимает значения из интервала [0,1], а значит и ее предел при Δy → 0 также лежит в данном интервале.
3) Fx(-∞|y) = 0 по определению 2 и замечанию 3.
4) Fx(+∞|y) = 1, так как например из определения 2 вытекает
Fx(+∞|y) |
Зам.3 = |
+∞ ∫ -∞ |
f(x,y) dx |
6)f(x,y) = |
fY(y) fY(y) |
= 1 . |
fY(y) |
5) F(x|y) - функция монотонно неубывающая по x О R1 для любого фиксированного y. Например, в случае определения 2 имеем
FX(x + Δx|y) = |
x+Δx ∫ -∞ |
f(x,y) dx |
≥ |
x ∫ -∞ |
f(x,y) dx |
Зам.3 = |
FX(x|y) . |
fY(y) | fY(y) |
Замечание 4. Аналогичные свойства имеет условная функция распределения FY(y|x) СВ Y при условии, что СВ X = x.
2. Условная плотность распределения |
Определение 1. Условной плотностью распределения (вероятности) непрерывной СВ X при условии, что непрерывная СВ Y с плотностью fY(y) ≠ 0 приняла значение y, называется функция
f( x | y) = | f(x, y) fY(y) |
, x О R1 . |
Замечание 1. Аналогично определяется условная плотность вероятности f(y|x) СВ Y при условии, что СВ X = x.
Замечание 2. Для построения двумерной плотности распределения в общем случае требуется знание не только плотностей распределения одномерных СВ, но еще и условных плотностей, например, f(x, y) = fY(y)fX(x|y).
1) fx(x|y) ≥ 0, так как плотности f(x,y) ≥ 0, fY(y) ≥ 0.
2) | Fx(x|y) | Δ = |
x ∫ -∞ |
fX(x|y) dx, |
если плотности f(x,y), fY(y) непрерывны. В этом можно убедиться, сравнивая выражения для условной плотности и условного распределения (см. замечание Л8.Р1.З3).
3) | +∞ ∫ -∞ |
fx(x|y) dx = 1 по свойствам 2)f(x|y), 4)F(x|y). |
4)
fX(x | y) = | ∂FX(x|y) ∂x | , |
fx( x | y) | Δ = |
∂Fx( x | y) ∂x |
= |
1 fY(y) |
∂ ∂x |
x ∫ -∞ |
f(x,y) dx = |
f(x,y) fY(y) | . |
5) Если непрерывные СВ X и Y независимы, то fX(x|y) = fX(x). Согласно свойству 8)f(x,y) для независимых СВ X и Y имеем равенство f(x,y) = fX(x)fY(y), из которого следует по определению условной плотности, что fX(x|y) = fX(x).
6)
P{x1 ≤ X ≤ x2} = |
∞ ∫ -∞ |
fY(y) ( |
x2 ∫ x1 |
fX(x|y) dx ) dy. |
P{x1 ≤ X ≤ x2} = |
x2 ∫ x1 |
fX(x) dx = |
x2 ∫ x1 |
( |
∞ ∫ -∞ |
f(x,y) dy ) dx = |
= |
x2 ∫ x1 |
( |
∞ ∫ -∞ |
fY(y)fX(x|y) dy ) dx = |
∞ ∫ -∞ |
fY(y) ( |
x2 ∫ x1 |
fX(x|y) dx ) dy. |
Замечание 3. Мы видим, что последнее свойство имеет аналогию с формулой полной вероятности в случае дискретных СВ X и Y (см. Л3.Р3.Т1):
P{x1 ≤ X ≤ x2} = | m ∑ j=0 |
P{Y = yj}P{x1 ≤ X ≤ x2|Y = yj}. |
Замечание 4. Аналогичные свойства имеет условная плотность распределения fY(y|x) СВ Y при условии, что СВ X = x.
Пример 1. Пусть f(x,y) = e-x-y , x, y ≥ 0. Такая плотность может описывать, например, опыт, состоящий в фиксации времени появления первого покупателя в магазине в первый и второй дни недели (после соответствующей нормировки СВ). Требуется найти:
F(x,y) = |
y ∫ 0 |
x ∫ 0 |
f(x,y) dx dy = |
y ∫ 0 |
e-y dy | x ∫ 0 |
e-x dx = (1 - e-x)(1 - e-y) ; |
FX(x) |
4)F(x,y) = |
F(x,+∞) = 1 - e-x , FY(y) = 1 - e-y ; |
fX(x) = | dFX(x) dx |
= e-x , fY(y) = | dFY(y) dy |
= e-y ; |
FX(x|y) |
3)F(x,y) = |
1 fY(y) |
x ∫ 0 |
f(x,y) dx = ey |
x ∫ 0 |
e-xe-y dx = 1 - e-x . |
fX(x|y) = | ∂ ∂x |
FX(x|y) = e-x , fY(y|x) = e-y ; |
3. Условное математическое ожидание |
Определение 1. Условным математическим ожиданием непрерывной СВ X при условии, что непрерывная СВ Y приняла значение y, называется в случае абсолютной сходимости интеграла, функция y:
M[X|y] |
Δ = |
+∞ ∫ -∞ |
xfX(x|y) dx . |
Замечание 1. В случае дискретных СВ X и Y условное МО СВ X при условии, что Y = yj, j = 0,m, определяется формулой
M[X|yj] |
Δ = |
n ∑ i=0 |
xi |
pij pj |
, j = 0,m, |
pij | Δ = |
P{X = xi, Y = yj} , pj |
Δ = |
P{Y = yj}. |
Определение 2. Условное математическое ожидание
M[X|y] СВ X как функция параметра
y О R1 называется регрессией X на y. График функции
x = M[X|y] называется кривой регрессии X на y.
Замечание 2. Аналогично определяется условное МО СВ
Z | Δ = |
φ(x) |
M[φ(x)|y] |
Δ = |
+∞ ∫ -∞ |
φ(x)fX(x|y) dx . |
Определение 3. Условным математическим ожиданием СВ X относительно СВ Y называется СВ
Z | Δ = |
φ(Y) |
Δ = |
M[X|Y]. |
Замечание 3. Аналогично можно определить и другие, более высокого порядка, условные моменты СВ.
1) M[φ(Y)|y] = φ(y), где φ(y) -- некоторая функция.
2) M[φ(Y)X|y] = φ(y)M[X|y]. Действительно, например, в случае непрерывных СВ X и Y имеем
M[φ(Y)X|y] |
= |
+∞ ∫ -∞ |
φ(y)xfX(x|y) dx = φ(y)M[X|y]. |
3) M[X + φ(Y)|y] = M[X|y] +
φ(y). Это свойство доказывается аналогично свойству 2)M[X|y].
4) M[X|y] =
M[X], если
X и Y -- независимы. Пусть, например, СВ
X и Y -- непрерывны, тогда
M[X|y] |
Δ = |
+∞ ∫ -∞ |
xfX(x|y) dx |
5)f(x|y) = |
+∞ ∫ -∞ |
xf(x) dx |
Δ = |
M[X]. |
5) M[X] = M[M[X|Y]], т.е. справедлива формула полного математического ожидания. Пусть СВ X и Y непрерывны, тогда
M[X] |
Δ = |
+∞ ∫ -∞ |
xfX(x) dx |
6)f(x,y) = |
+∞ ∫ -∞ |
x( |
+∞ ∫ -∞ |
f(x,y) dy) dx |
Л8.Р2.З2 = |
= |
+∞ ∫ -∞ |
x( |
+∞ ∫ -∞ |
fY(y)fX(x|y) dy) dx = |
+∞ ∫ -∞ |
fY(y)( |
+∞ ∫ -∞ |
xfX(x|y) dx) dy = |
= |
+∞ ∫ -∞ |
fY(y)M[X|y] dy = M[M[X|Y]]. |
Замечание 4. В случае дискретной СВ Y при конечном m формула полного МО приобретает следующий вид
M[X] = |
m ∑ j=0 |
pjM[X|yj], где pj |
Δ = |
P{Y = yj}, j = 0,m. |
Пример 1. Число N радиотехнических приборов (или бытовой техники), сдаваемых покупателями в гарантийную мастерскую в течении дня, является СВ, хорошо описываемой распределением Пуассона Π(a) с параметром a, который является средним числом радиоприборов, сданных за день. Вероятность того, что сданные приборы потребуют длительного ремонта, равна p. Найдем среднее число сданных приборов, требующих длительного ремонта. Так как при фиксированном числе n поступивших приборов число приборов, требующих капитального ремонта, представляет собой СВ X с биномиальным распределением Bi(n,p), то M[X|n] = np, n = 0,1,2,...(см. Л5.Р1.З2). Так как СВ X имеет распределение Пуассона Π(a), то M[N] = a (см. Л5.Р3.З2). Тогда по формуле полного МО:
4. Корреляционная зависимость |
Определение 1. Ковариацией (корреляционным моментом) kXY непрерывных СВ X и Y называется второй центральный смешанный момент
kXY | Δ = |
M[(X - mX)(Y - mY)] = |
+∞ ∫ -∞ |
+∞ ∫ -∞ |
(x - mX)(y - mY)f(x,y) dx dy . |
Замечание 1. Корреляционный момент kXY дискретных СВ X и Y с конечными числами возможных значений равен:
kXY | Δ = |
n ∑ i=0 |
n ∑ j=0 |
(xi - mX)(yj - mY)pij. |
Замечание 2. Величина kXY зависит от единиц измерения СВ X и Y. Во избежание этого неудобства ковариацию часто вычисляют не для X и Y , а для соответствующих им нормированных СВ
* X | Δ = |
X-mX σx |
, |
* Y | Δ = |
Y-mY σY |
. |
Определение 2. Ковариация нормированных СВ
* X и |
* Y |
rXY | Δ = |
k | * * XY |
Δ = |
M[ |
* * XY |
] |
2)mx = |
M[(X - mX)(Y - mY)] σXσY |
Δ = |
kXY σXσY |
. |
Определение 3. СВ X и Y называют коррелированными, если rXY ≠ 0 (kXY ≠ 0) и некоррелированными, если rXY = 0 (kXY = 0).
Определение 4. Корреляция между СВ X и Y называется положительной, если rXY > 0 и отрицательной, если rXY < 0.
Пример 1. Пусть случайный вектор
Z | Δ = |
col(X,Y), |
f(x,y) = | { | 1 / (πR2) 0 |
, , |
x2 + y2 ≤ R2,
x2 + y2 > R2. |
fX(x) = | +∞ ∫ -∞ |
f(x,y) dy = | 1 πR2 |
_____ √ R2-x2 ∫ _____ -√ R2-x2 |
dy = | 2 πR2 |
_____ √ R2-x2. |
mX = | 2 πR2 |
R ∫ -R |
x | _____ √ R2-x2 |
dx = - | 2 3πR2 |
(R2 - x2)3/2 | | | R -R |
= 0. |
fY(y) = | 2 πR2 |
√ |
_____ |
R2-y2 |
kXY = | +∞ ∫ -∞ |
+∞ ∫ -∞ |
xyf(x,y) dx dy = | 1 πR2 |
R ∫ -R |
x | ( | _____ √ R2-x2 ∫ _____ -√ R2-x2 |
y dy | ) | dx = 0 , |
1) |rXY| ≤ 0 , т.е. |kXY| ≤ σxσY. Это свойство доказано ниже для более общего случая (см. свойство 5)M[X] в лекции 9).
2) Если
Y | Δ = |
aX + b, где a и b - постоянные, то |rXY| = 1. Действительно, |
mY | Δ = |
M[Y] = M[aX + b] = aM[X] + b = amX + b , |
D[Y] | Δ = |
M[(Y - mY)2] = a2dX, σY = |
___ √dY |
= |a| |
___ √dX |
= σX, |
kXY | Δ = |
M[(X - mX)(Y - mY)] = M[a(X - mx)2] |
Δ = |
aD[X] = aσX2 , |
rXY | Δ = |
kXY σXσY |
= |
aσX2 σX2|a| |
= |
a |a| |
, т.е. |rXY| = 1 . |
3) Из независимости СВ X и Y следует их некоррелированность:
kXY | Δ = |
M[(X - mX)(Y - mY)] |
8)f(x,y) = |
= |
+∞ ∫ -∞ |
(x - mX)fX(x) dx |
+∞ ∫ -∞ |
(y - mY)fY(y) dy |
Δ = |
M[ |
o X |
]M[ |
o Y |
] = 0 . |
4) kXY = M[XY] - mXmY , т.к.
kXY | Δ = |
M[(X - mX)(Y - mY)] = M[XY] + mXmY - 2mXmY = M[XY] - mXmY . |
5. Двумерное нормальное распределение |
Определение 1. Плотность двумерной нормально распределенной СВ Z при
__________ √c11c22 - c122 > 0 |
f(x,y) = |
__________ √c11c22 - c122 2π |
exp{- |
1 2 |
[c11(x - a)2 + 2c12(x - a)(y - b) + c22(y - b)2]}. |
Замечание 1. В соответствии со свойством 6)f(x,y) можно найти
fX(x) = |
√ |
__________ c11c22 - c122 2πc22 |
exp{- |
1 2 |
c11c22 - c122 c22 |
(x - a)2}. |
mX = a, D[X] | Δ = |
(σX)2 = | c22 c11c22 - c122 |
. |
fY(y) = |
√ |
__________ c11c22 - c122 2πc22 |
exp{- |
1 2 |
c11c22 - c122 c11 |
(y - b)2}, |
mY = b, D[Y] | Δ = |
(σY)2 = | c11 c11c22 - c122 |
. |
Замечание 2. Следуя определению коэффициента корреляции, можно установить, что
rXY | Δ = |
1 σXσY |
+∞ ∫ -∞ |
+∞ ∫ -∞ |
(x - mX)(y - mY)f(x,y) dx dy = - | c12 c12c22 - c122 |
. |
Замечание 3. Найдем условную плотность
fX(x|y) |
Δ = |
f(x,y) fY(y) |
= |
√ |
___ c11 2π |
exp{- |
1 2 |
c11[x - a + |
c12 c11 |
(y - b)]2}. |
M[X|y] = a - |
c12 c11 |
(y - b), D[X|y] = |
1 c22 |
. |
M[X|y] = M[X] - |
rXY σXσY |
(y - M[Y]), |
Замечание 4. Пусть СВ X и Y независимы. Тогда
f(x,y) |
8)f(x,y) = |
fX(x)fY(y) = |
1 √2πσX |
exp{- |
(x - mX)2 2 |
} |
1 √2πσY |
exp{- |
(y - mY)2 2 |
}. |
Замечание 5. Пусть теперь СВ X и Y некоррелированы, т.е. rXY = c12 = 0. Тогда из замечания 1 следует, что (σX)2 = 1 / c11, (σY)2 = 1 / c22. Поэтому, согласно замечанию 3, fX(x|y) = fX(x), откуда вытекает, что f(x,y) = fX(x)fY(y). Таким образом, в случае нормального распределения из некоррелированности СВ X и Y следует их независимость. При этом M[X|y] = M[X].
Пример 1. Двумерное нормальное распределение хорошо описывает, например, скорость ветра в районе аэропорта, прогнозируемые координаты падения метеорита на поверхность Земли и тому подобное.