Лекция 6
Многомерно нормално разпределение

Тази лекция съдържа факти от теория на вероятностите, необходими за строгото обосноваване на многомерните статистически процедури. Резултатите ще бъдат изложени тук като следствия от свойствата на нормалното разпределение.

Сведенията от тази лекция могат да бъдат намерени без особени затруднения във всяка книга по математическа статистика или теория на вероятностите.

6.1  Нормално Разпределение

Определение 1 Плътността на стандартното нормално разпределение в Rn има вида:

f(x) = 1
(2p)n/2
e-||x||2/2,
(6.1)
където x О Rn.

gauss2.gif
Фигура 6.1: N(0,I) в R2

От определението се вижда, че тази плътност зависи само от нормата на вектора x и, следователно, е инвариантна относно всякакви ортогонални трансформации - те запазват нормата и имат якобиян равен на 1. Също така е ясно, че тя може да се представи като произведение на n едномерни стандартни нормални плътности (виж фиг.6.1).

До края на тази лекция ще предполагаме, че случайната величина x има стандартно нормално разпределение в Rn. Плътността на многомерното нормално разпределение от по - общ вид N(m,C) в Rn има вида:

f(x,m,C) = 1
(2p)n/2(det(C))1/2
e-(x-m)ўC-1(x-m)/2,
(6.2)
където x О Rn,       m О Rn е средната стойност, а C - ковариационната матрица. На фиг.6.2 е показана линия на постоянно ниво на двумерна гаусова плътност - тя е елипса.

И тук както в едномерния случай имаме връзка между параметрите на закона и моментите на сл.в.:

Теорема 1 Ако h О N(m,C), то

E h = m,       E (h-m)(h-m)ў = C .

Теоремата може да се докаже с проста смяна на променливите или като следствие на следната по - обща теорема.

Теорема 2 Случайната величина h = Tx+ a, където T е неизроден линеен оператор от Rn в Rk (n і k), има разпределение N(a, TTў) в Rk.

От тази теорема следва, че всички маргинални разпределения (или проекции в произволна размерност) са нормални. Следва също, че произволна линейна функция от (зависими или независисми) нормални сл.в. е нормална сл.в.

ellips.gif
Фигура 6.2: Линия на ниво

Верно е също, че и условните разпределения (при линейни ограничения от типа на равенството) са гаусови.

Доказателство: Ще разгледаме само случая h = Tx. В случая операторът T се представя просто като матрица с k Ј n реда и n колони и трябва да притежава пълен ранг k. Това означава, че нейните редове са линейно независими вектори в Rn. Нека означим с S подпространството от линейните им комбинации. То очевидно има размерност k. Нека допълним редовете на T с n-k ортогонални помежду си и на S единични вектори и означим така получената матрица с [(T)\tilde]. Тогава по формулата за смяна на променливите [(h)\tilde] = [(T)\tilde]x ще има разпределение с плътност:

f(x) = 1
(2p)n/2 det( ~
T
 
)
e-1/2xў([(T)\tilde][(T)\tilde]ў)-1x.
Но det([(T)\tilde]) = det(T) и матрицата [(T)\tilde][(T)\tilde]ў е блочно диагонална. Такава е и нейната обратна. Следователно, разпределението се разпада в произведение на две плътности:
f(x) = f1(x1)f2(x2) = 1
(2p)k/2det(T)
e-1/2 x1ў(TўT)-1x1    1
(2p)[(n-k)/ 2]
e-1/2||x2||2.
Тук разлагането x = {x1,x2} = x1+x2 представя вектора в неговите проекции (координати) в подпространството S и неговото ортогонално допълнение. От тук лесно следва твърдението на теоремата. Q.E.D.

6.2  Теорема на Кокрън

Определение 2 Случайната величина c2n = xўx има разпределение c2(n) с n степени на свобода.

chi2.gif
Фигура 6.3: c2 разпределение

Теорема 3 Случайната величина c2n има плътност:

f(x,n) = C(n) xn/2-1 e[(-x)/ 2].
(6.3)
Тук C(n) = (1/2)n/2G(n/2) е нормираща константа.

Веднага се вижда, че това е гама-разпределение G(n/2,1/2) и изводът може да се направи по индукция от n = 1 и възпроизводящите свойства на гама-разпределението: G(a,l)+G(b,l) = G(a+b,l).

Средната стойност на c2n = xўx е очевидно n, а дисперсията лесно се пресмята и е равна на 2n. От следната проста лема непосредствено се вижда, че разпределението c2n = xўx не може да се получи от друга квадратична форма на n гаусови сл.в., освен тривиалната.

Лема 1 Нека xi,i = 1,...,n са независими сл.в. с еднаква дисперсия и li,i = 1,...,n са такива, че еi = 1nli = 1. Тогава сл.в. h = еi = 1nlixi има минимална дисперсия, когато li = 1/n,i = 1,2,...,n.

Доказателство:  Да предположим, че D(xi) = 1. Тогава D(h) = еi = 1nli2. В сила е обаче неравенството:

( n
е
i = 1 
li )2 Ј n n
е
i = 1 
li2.
При това, равенство се достига тогава и само тогава, когато li = C. Q.E.D.

Лема 2 Ако дадена квадратична форма Q има ранг q и сл.в. xўQx има разпределение е c2q, то Q е проектор.

Доказателство:  Да напомним, че проекторите са неотрицателно - определени оператори (т.е. са самоспрегнати Pў = P), а освен това са и иденпотенти (P2 = P ). Това значи, че собствените им числа могат да бъдат само 0 или 1. Естествено, броят на ненулевите собствени числа е равен на ранга.

За доказателството е достатъчно да сравним дисперсиите на двете разпределения и да се възползуваме от лема 6.1. Ние обаче ше го изведем директно - така ще пресметнем и дисперсията на c2q разпределение.

Действително, Q е неотрицателно определена и значи може да се представи като Q = UDUў, където U е ортогонална матрица, а D - диагонална. Тогава сл.в. xўQx и xўDx имат едно и също c2(q) разпределение.

D (xўDx) = E [( n
е
i = 1 
di(x2 - 1))2] = 2 е
di2 і 2 n.
Тъй като tr(Q) = еni = 1 di = n = tr(I), последното неравенство става равенство само когато di = 1,i = 1,2,...,n. Q.E.D.

Теорема 4 Теорема на Кокрън. Нека Q,R,S са неотрицателно определени матрици с рангове q,r,s съответно, Q = R + S и случайната величина xўQx има разпределение c2(q). Случайните величини xўR x и xўS x са независими и имат разпределения c2(r) и c2(s) тогава и само тогава, когато q = r+s.

Доказателство:  Първо да отбележим, че съгласно лема 6.2 матрицата Q е проектор и можем да се ограничим в пространство с размерност q, когато Q = I.

Достатъчност. Имаме: I = R+S = U(DR+DS)Uў. Следователно, I = DR+DS. Ако q = r+s, то DR и DS имат съотвения брой ненулеви елементи, значи R и S са проектори и RS = SR = 0. За доказателството на независимостта използуваме равенството: ||Qx||2 = ||x||2 = ||Rx||2 +||Sx||2 за всяко x и xўRўRx = ||Rx||2 = xўRx. Остава да приложим теорема 6.2 за операторите R и S и определението на хи-квадрат разпределение.

Необходимост. Равенството q = r+s следва директно от лема 6.2. Q.E.D.

Частен случай от теоремата на Кокрън е независимостта на [`(x)] = 1/nеxi и S2 = е(xi-[`(x)])2. Наистина,

||x||2 = n
x
 
2
 
+ S2 = xўBx+ xў(I-B)x.
Но тогава и съответните квадратични форми са породени от ортогонални проектори. Т.е. Bx^(I-B)x. Тук

B = ||
1/n
1/n
...
1/n
1/n
1/n
...
1/n
...
...
...
...
1/n
1/n
...
1/n
||.

Пример 1 Условно математическо очакване и коефициент на корелация.

Нека случайната величина x О R2 и има разпределение N(m,S). Тогава условното математическо очакване и коефициентът на корелация се получават по формулите: E (x2|x1) = a x1 + b, r(x1,x2) = a /S22, където b = m2 - a m1, a = S12 (S22/S11)1/2. С Sij сме означили елементите на ковариационната матрица на двумерната сл.в. x. В частност S22 = s2(x2).

Проверете тези формули.


Начало на лекцията | Съдържание | Индекс


File translated from TEX by TTH, version 2.10.
On 5 Apr 1999, 17:47.