Лекция 8. Условные распределения


  1. Условная функция распределения


Замечание 1.   Рассмотрим задачу, обратную по отношению к той, которая решается в соответствии со свойствами 6)f(x,y) и 4)F(x,y): как найти закон распределения двумерной СВ

Z
Δ
=

col(X,Y),
зная закон распределения двух одномерных СВ X и Y. Оказывается, что в общем случае эту задачу решить нельзя, так как необходимо знание зависимости между СВ X и Y, которая характеризуется условным распределением.

Определение 1.   Пусть СВ Y является дискретной с реализациями yj, j = 0,m. Условной функцией распределения СВ X при условии, что СВ Y = yj, называется условная вероятность

Fx( x | yj )
Δ
=

P{X ≤ x, Y = yj}
     P{Y = yj}

,   j = 0,m , x О R1 ,
которая определена согласно Л2.Р2.О4, если P{Y = yj} ≠ 0.

Определение 2.   Пусть для всех x О R1 плотности f(x,y) и fY(y) непрерывны в точке y О R1 и fY(y) ≠ 0. Условной функцией распределения СВ X при условии, что СВ Y = y, называется предел при Δy >0 следующей условной вероятности:

Fx( x | y )
Δ
=


  lim
Δy→0

P{X ≤ x, |Y - y| ≤ Δy}
      P{|Y - y| ≤ Δy}

.

Замечание 2.   Аналогично определяется условная функция распределения FY( y | x ) СВ Y при условии, что СВ X = x.

Замечание 3.   Убедимся в корректности определения 2. Пусть СВ

Z
Δ
=

col(X,Y),
непрерывна, причем плотности f(x,y), fY(y) непрерывны в точке y для всех x О R1 и fY(y) ≠ 0. Покажем, что в этом случае предел в определении 2 существует и он равен
FX( x | y) =   1
fY(y) 
  x
 
-∞
f(x,y) dx .
Рассмотрим вероятность

P(D)
Δ
=

P{ X ≤ x, |Y - y| ≤ Δy}
попадания СВ Z в полуполосу D (см. рис.1):

P(D)
16)P
  =

P{|Y - y| ≤ Δy}•P{X ≤ x|y - Δy ≤ Y ≤ y + Δy}.

Рисунок 1
Рисунок 1.

Тогда, из свойств 2)f(x,y), 3)fX(x) вытекает, что
P{X ≤ x|y - Δy ≤ Y ≤ y + Δy} = P{X ≤ x , |Y - y| ≤ Δy}
    P{|Y - y| ≤ Δy}
=


=

   x
  ∫ (
 -∞

  yy
   
  yy

f(x,y) dy) dx


=

  yy
 
 yy
fY(y) dy


=

|

по теореме
о среднем
значении

|


=



  1
     ≈
fx(y)
 


  x
 
-∞


f(x,

~
y


) dx ,

где
~
y

и

y

- некоторые точки из интервала (y,yy).
Учитывая непрерывность f(x,y) и f(y) и переходя к пределу при Δy → 0, имеем
~
y

y ,

y

y, P{X ≤ x|y - Δy ≤ Y ≤ y + Δy} → Fx(x|y).
Отсюда следует требуемая формула, которая определяет условную функцию распределения через плотности распределения двумерной СВ и одномерной СВ.

С в о й с т в а   F( x | y ) :


1)   Fx( x | y ) определена для всех x О R1. Это следует из определения Fx( x | y ) и замечания 3.

2)   Fx( x | y ) О [0,1] для всех x О R1. Условная вероятность принимает значения из интервала [0,1], а значит и ее предел при Δy → 0 также лежит в данном интервале.

3)   Fx(-∞|y) = 0 по определению 2 и замечанию 3.

4)   Fx(+∞|y) = 1, так как например из определения 2 вытекает




Fx(+∞|y)



Зам.3
   =

  +∞
   ∫
  -∞

f(x,y) dx



6)f(x,y)
    =




fY(y)
fY(y)




= 1 .

fY(y)

5)   F(x|y) - функция монотонно неубывающая по x О R1 для любого фиксированного y. Например, в случае определения 2 имеем




FX(x + Δx|y) =

  xx
   ∫
  -∞

f(x,y) dx




  ≥  

   x
 
 -∞

f(x,y) dx



Зам.3
   =




FX(x|y) .


fY(y)fY(y)

Замечание 4.   Аналогичные свойства имеет условная функция распределения FY(y|x) СВ Y при условии, что СВ X = x.



  2. Условная плотность распределения


Определение 1.   Условной плотностью распределения (вероятности) непрерывной СВ X при условии, что непрерывная СВ Y с плотностью fY(y) ≠ 0 приняла значение y, называется функция
f( x | y) = f(x, y)
 fY(y)
,   x О R1 .

Замечание 1.   Аналогично определяется условная плотность вероятности f(y|x) СВ Y при условии, что СВ X = x.

Замечание 2.   Для построения двумерной плотности распределения в общем случае требуется знание не только плотностей распределения одномерных СВ, но еще и условных плотностей, например, f(x, y) = fY(y)fX(x|y).

С в о й с т в а   f ( x | y ) :


1)   fx(x|y) ≥ 0, так как плотности f(x,y) ≥ 0, fY(y) ≥ 0.

       2)   Fx(x|y) Δ
=
  x
 
-∞
fX(x|y) dx,




если плотности f(x,y), fY(y) непрерывны. В этом можно убедиться, сравнивая выражения для условной плотности и условного распределения (см. замечание Л8.Р1.З3).

       3)   +∞
 
-∞
fx(x|y) dx = 1   по свойствам 2)f(x|y), 4)F(x|y).




4)
fX(x | y) = FX(x|y) 
    ∂x
,
если плотности
f(x,y), fY(y) непрерывны. Действительно, по замечанию Л8.Р1.З3 имеем

fx( x | y)
Δ
=

Fx( x | y)
    ∂x 

  =

  1 
fY(y) 

  ∂
x

  x
 
-∞

f(x,y) dx =

f(x,y) 
fY(y) 
.

5)   Если непрерывные СВ X и Y независимы, то fX(x|y) = fX(x). Согласно свойству 8)f(x,y) для независимых СВ X и Y имеем равенство f(x,y) = fX(x)fY(y), из которого следует по определению условной плотности, что fX(x|y) = fX(x).

6)  

P{x1 X x2} =

 ∞
 ∫
-∞

fY(y) (

x2

x1

fX(x|y) dx ) dy.
Действительно, по свойствам
3)f(x), 6)f(x,y) и определению условной плотности имеем

P{x1 X x2} =

x2

x1

fX(x) dx =

x2

x1

(

 ∞
 ∫
-∞

f(x,y) dy ) dx =

=

x2

x1

(

 ∞
 ∫
-∞

fY(y)fX(x|y) dy ) dx =

 ∞
 ∫
-∞

fY(y) (

x2

x1

fX(x|y) dx ) dy.

Замечание 3.   Мы видим, что последнее свойство имеет аналогию с формулой полной вероятности в случае дискретных СВ X и Y (см. Л3.Р3.Т1):
P{x1 X x2} = m

j=0
P{Y = yj}P{x1 X x2|Y = yj}.

Замечание 4.   Аналогичные свойства имеет условная плотность распределения fY(y|x) СВ Y при условии, что СВ X = x.

Пример 1.   Пусть f(x,y) = e-x-y ,   x, y ≥ 0. Такая плотность может описывать, например, опыт, состоящий в фиксации времени появления первого покупателя в магазине в первый и второй дни недели (после соответствующей нормировки СВ). Требуется найти:

  1. F(x,y) ;
  2. FX(x) , FY(y) ;
  3. fX(x) , fY(y) ;
  4. FX(x|y) , FY(y|x) ;
  5. fX(x|y) , fY(y|x) ;
  6. Ответить на вопрос: зависимы ли СВ X и Y ?
Получим решение.
  1.

F(x,y) =

y

0

x

0

f(x,y) dx dy =

y

0
e-y dy
x

0
e-x dx = (1 - e-x)(1 - e-y) ;
  2.

FX(x)
4)F(x,y)
    =

F(x,+∞) = 1 - e-x , FY(y) = 1 - e-y ;
  3.
fX(x) = dFX(x)
   dx
= e-xfY(y) = dFY(y)
   dy
= e-y ;
  4.

FX(x|y)
3)F(x,y)
    =

  1 
fY(y) 

x

0

 f(x,y) dx = ey

x

0

e-xe-y dx = 1 - e-x .
Аналогично можно получить FY(y|x) = 1 - e-y ;
  5.
fX(x|y) =  ∂
x
FX(x|y) = e-x , fY(y|x) = e-y ;
  6. Так как fX(x|y) = fx(x) = e-x и fY(y|x) = fY(y) = e-y , то f(x,y) = fX(x)fY(y). Поэтому СВ X и Y независимы. Это означает, что появление первого покупателя во второй день не зависит от того, когда пришел первый покупатель в первый день.



  3. Условное математическое ожидание


Определение 1.   Условным математическим ожиданием непрерывной СВ X при условии, что непрерывная СВ Y приняла значение y, называется в случае абсолютной сходимости интеграла, функция y:

M[X|y]
Δ
=

+∞
 
-∞

xfX(x|y) dx .

Замечание 1.   В случае дискретных СВ X и Y условное МО СВ X при условии, что Y = yj, j = 0,m, определяется формулой

M[X|yj]
Δ
=

 n

i=0

xi

pij
pj

, j = 0,m,
где

pij
Δ
=

P{X = xi, Y = yj} , pj
Δ
=

P{Y = yj}.

Определение 2.   Условное математическое ожидание M[X|y] СВ X как функция параметра y О R1 называется регрессией X на y. График функции x = M[X|y] называется кривой регрессии X на y.

Замечание 2.   Аналогично определяется условное МО СВ

Z
Δ
=

φ(x)
при условии, что Y = y. Например, для непрерывных X и Y:

M[φ(x)|y]
Δ
=

+∞
 
-∞

φ(x)fX(x|y) dx .

Определение 3.   Условным математическим ожиданием СВ X относительно СВ Y называется СВ

Z
Δ
=

φ(Y)
Δ
=

M[X|Y].

Замечание 3.   Аналогично можно определить и другие, более высокого порядка, условные моменты СВ.

С в о й с т в а   M[X | y] :


1)   M[φ(Y)|y] = φ(y), где φ(y) -- некоторая функция.

2)   M[φ(Y)X|y] = φ(y)M[X|y]. Действительно, например, в случае непрерывных СВ X и Y имеем

M[φ(Y)X|y]

=

+∞
 
-∞

φ(y)xfX(x|y) dx = φ(y)M[X|y].

3)   M[X + φ(Y)|y] = M[X|y] + φ(y). Это свойство доказывается аналогично свойству 2)M[X|y].

4)   M[X|y] = M[X], если X и Y -- независимы. Пусть, например, СВ X и Y -- непрерывны, тогда

M[X|y]
Δ
=

+∞
 
-∞

xfX(x|y) dx
5)f(x|y)
    =

+∞
 
-∞

xf(x) dx
Δ
=

M[X].

5)   M[X] = M[M[X|Y]], т.е. справедлива формула полного математического ожидания. Пусть СВ X и Y непрерывны, тогда

M[X]
Δ
=

+∞
 
-∞

xfX(x) dx
6)f(x,y)
    =

+∞
 
-∞

x(

+∞
 
-∞

f(x,y) dy) dx
Л8.Р2.З2
    =

=

+∞
 
-∞

x(

+∞
 
-∞

fY(y)fX(x|y) dy) dx =

+∞
 
-∞

fY(y)(

+∞
 
-∞

xfX(x|y) dx) dy =

=

+∞
 
-∞

fY(y)M[X|y] dy = M[M[X|Y]].

Замечание 4.   В случае дискретной СВ Y при конечном m формула полного МО приобретает следующий вид

M[X] =

 m

j=0

pjM[X|yj], где pj
Δ
=

P{Y = yj}, j = 0,m.

Пример 1.   Число N радиотехнических приборов (или бытовой техники), сдаваемых покупателями в гарантийную мастерскую в течении дня, является СВ, хорошо описываемой распределением Пуассона Π(a) с параметром a, который является средним числом радиоприборов, сданных за день. Вероятность того, что сданные приборы потребуют длительного ремонта, равна p. Найдем среднее число сданных приборов, требующих длительного ремонта. Так как при фиксированном числе n поступивших приборов число приборов, требующих капитального ремонта, представляет собой СВ X с биномиальным распределением Bi(n,p), то M[X|n] = np, n = 0,1,2,...(см. Л5.Р1.З2). Так как СВ X имеет распределение Пуассона Π(a), то M[N] = a (см. Л5.Р3.З2). Тогда по формуле полного МО:

M[X] = M[M[X|N]] = M[pN] = pM[N] = pa.


  4. Корреляционная зависимость


Определение 1.   Ковариацией (корреляционным моментом) kXY непрерывных СВ X и Y называется второй центральный смешанный момент

kXY
Δ
=

M[(X - mX)(Y - mY)] =

+∞
 
-∞

+∞
 
-∞

(x - mX)(y - mY)f(x,y) dx dy .

Замечание 1.   Корреляционный момент kXY дискретных СВ X и Y с конечными числами возможных значений равен:

kXY
Δ
=

 n

i=0

 n

j=0

(xi - mX)(yj - mY)pij.

Замечание 2.   Величина kXY зависит от единиц измерения СВ X и Y. Во избежание этого неудобства ковариацию часто вычисляют не для X и Y , а для соответствующих им нормированных СВ
 *
X
Δ
=

X-mX
  σx

  ,  
 *
Y
Δ
=

Y-mY
  σY

.

Определение 2.   Ковариация нормированных СВ
 *
X и
 *
Y



называется коэффициентом корреляции, т.е.

rXY
Δ
=

k



* *
XY
Δ
=

M[
 * *
XY

]
2)mx
  =

M[(X - mX)(Y - mY)]
            σXσY
Δ
=

 kXY
σXσY

.

Определение 3.   СВ X и Y называют коррелированными, если rXY ≠ 0 (kXY ≠ 0) и некоррелированными, если rXY = 0 (kXY = 0).

Определение 4.   Корреляция между СВ X и Y называется положительной, если rXY > 0 и отрицательной, если rXY < 0.

Пример 1.   Пусть случайный вектор

Z
Δ
=

col(X,Y),
равномерно распределен в круге радиуса R:
f(x,y) = { 1 / (πR2)
  0
,
,
x2 + y2 R2,
x2 + y2 > R2.
Требуется найти
kXY и rXY. Из симметрии плотности вероятности следует mX = mY = 0. Действительно, из свойства 6)f(x,y) находим fX(x) = 0, если |x| > R, а в случае |x| ≤ R получаем
fX(x) = +∞
 
-∞
f(x,y) dy =   1
πR2
   _____
R2-x2

   
    _____
- R2-x2
dy =   2
πR2
   _____
R2-x2
.
 
Исходя из этого,
mX =   2
πR2
  R
 
-R
x    _____
R2-x2

 
dx = -    2
3πR2
(R2 - x2)3/2 | R

-R
= 0.
Аналогично можно показать, что fY(y) = 0, если |y| > R, и
fY(y) =    2
πR2


 
_____
R2-y2
 
если |y| ≤ R, поэтому mY = 0. Таким образом, имеем
kXY = +∞
 
-∞
+∞
 
-∞
xyf(x,y) dx dy =   1
πR2
 R
 
-R
x(    _____
R2-x2

   
    _____
- R2-x2
y dy ) dx = 0 ,
т.е. kXY = rXY = 0. Следовательно, СВ X и Y некоррелированы. При этом СВ X и Y зависимы, т.к. плотность f(x,y) нельзя представить в данном случае в виде произведения f(x,y) = fX(x)fY(y).

С в о й с т в а   kXY :


1)   |rXY| ≤ 0 , т.е. |kXY| ≤ σxσY. Это свойство доказано ниже для более общего случая (см. свойство 5)M[X] в лекции 9).

2)   Если

Y
Δ
=

aX + b,   где a и b - постоянные, то |rXY| = 1. Действительно,

mY
Δ
=

M[Y] = M[aX + b] = aM[X] + b = amX + b ,

D[Y]
Δ
=

M[(Y - mY)2] = a2dX,   σY =
  ___
dY

= |a|
  ___
dX

= σX,

kXY
Δ
=

M[(X - mX)(Y - mY)] = M[a(X - mx)2]
Δ
=

aD[X] = aσX2 ,

rXY
Δ
=

kXY
σXσY

=

X2
σX2|a|

=

a
|a|

,   т.е. |rXY| = 1 .
Следовательно, если a > 0, то rXY = 1 и, если a < 0, то rXY = -1. Таким образом, по величине rXY можно судить о связи между
СВ X и Y: если rXY = 1, то большим значениям x СВ X соответствуют большие значения y СВ Y, а если rXY = -1, то наоборот.

3)   Из независимости СВ X и Y следует их некоррелированность:

kXY
Δ
=

M[(X - mX)(Y - mY)]
8)f(x,y)
    =

=

+∞
 
-∞

(x - mX)fX(x) dx

+∞
 
-∞

(y - mY)fY(y) dy
Δ
=

M[
 o
X

]M[
 o
Y

] = 0 .

4)   kXY = M[XY] - mXmY , т.к.

kXY
Δ
=

M[(X - mX)(Y - mY)] = M[XY] + mXmY - 2mXmY = M[XY] - mXmY .



  5. Двумерное нормальное распределение


Определение 1.   Плотность двумерной нормально распределенной СВ Z при
   __________
c11c22 - c122 > 0
определяется формулой

f(x,y) =
   __________
c11c22 - c122
          2π

exp{-

1
2

[c11(x - a)2 + 2c12(x - a)(y - b) + c22(y - b)2]}.

Замечание 1.   В соответствии со свойством 6)f(x,y) можно найти

fX(x) =

__________
c11c22 - c122
      2πc22

exp{-

1
2

c11c22 - c122
        c22

(x - a)2}.
Сравнивая эту формулу с определением Л6.Р3.О1, заключаем, что СВ X имеет нормальное распределение N(mX,σX) с параметрами
mX = a, D[X] Δ
=
 
(σX)2 =        c22
c11c22 - c122
.
Из соображения симметрии можно получить плотность СВ Y:

fY(y) =

__________
c11c22 - c122
      2πc22

exp{-

1
2

c11c22 - c122
        c11

(y - b)2},
т.е. Y ~ N(mY,σY), где
mY = b, D[Y] Δ
=
 
(σY)2 =        c11
c11c22 - c122
.

Замечание 2.   Следуя определению коэффициента корреляции, можно установить, что
rXY Δ
=
 
   1
σXσY
+∞
 
-∞
+∞
 
-∞
(x - mX)(y - mY)f(x,y) dx dy = -        c12
c12c22 - c122
.

Замечание 3.   Найдем условную плотность

fX(x|y)
Δ
=

f(x,y)
fY(y)

=

___
c11
2π

exp{-

1
2

c11[x - a +

c12
c11

(y - b)]2}. 
Сравнивая эту формулу с определением Л6.Р3.О1, приходим к выводу, что fX(x|y) является нормальной плотностью, причем

M[X|y] = a -

c12
c11

(y - b), D[X|y] =

  1
c22

.
Используя выражения, полученные в замечаниях 1 и 2 для σX, σY , rXY, условное МО M[X|y] можно представить в виде соотношения

M[X|y] = M[X] -

  rXY
σXσY

(y - M[Y]),
которое называется теоремой о нормальной корреляции.

Замечание 4.   Пусть СВ X и Y независимы. Тогда

f(x,y)
8)f(x,y)
    =

fX(x)fY(y) =

    1 
2πσX

exp{-

(x - mX)2
      2 

}

    1 
2πσY

exp{-

(y - mY)2
      2 

}.

Замечание 5.   Пусть теперь СВ X и Y некоррелированы, т.е. rXY = c12 = 0. Тогда из замечания 1 следует, что (σX)2 = 1 / c11, (σY)2 = 1 / c22. Поэтому, согласно замечанию 3, fX(x|y) = fX(x), откуда вытекает, что f(x,y) = fX(x)fY(y). Таким образом, в случае нормального распределения из некоррелированности СВ X и Y следует их независимость. При этом M[X|y] = M[X].

Пример 1.   Двумерное нормальное распределение хорошо описывает, например, скорость ветра в районе аэропорта, прогнозируемые координаты падения метеорита на поверхность Земли и тому подобное.



Лекция 9.
Оглавление

Hosted by uCoz