Лекция 6
Многомерно нормално разпределение

Тази лекция съдържа факти от теория на вероятностите, необходими за строгото обосноваване на многомерните статистически процедури. Резултатите ще бъдат изложени тук като следствия от свойствата на нормалното разпределение.

Сведенията от тази лекция могат да бъдат намерени без особени затруднения във всяка книга по математическа статистика или теория на вероятностите.

6.1 Нормално Разпределение

Определение 1 Плътността на стандартното нормално разпределение в Rⁿ има вида:

f(x) =

(2p)^n/2

e^-||x||²/2,

(6.1)

където x О Rⁿ.

Фигура 6.1: N(0,I) в R²

От определението се вижда, че тази плътност зависи само от нормата на вектора x и, следователно, е инвариантна относно всякакви ортогонални трансформации - те запазват нормата и имат якобиян равен на 1. Също така е ясно, че тя може да се представи като произведение на n едномерни стандартни нормални плътности (виж фиг.6.1).

До края на тази лекция ще предполагаме, че случайната величина x има стандартно нормално разпределение в Rⁿ. Плътността на многомерното нормално разпределение от по - общ вид N(m,C) в Rⁿ има вида:

f(x,m,C) =

(2p)^ⁿ/₂(det(C))^¹/₂

e^{-(x-m)ўC^-1(x-m)/2},

(6.2)

където x О Rⁿ, m О Rⁿ е средната стойност, а C - ковариационната матрица. На фиг.6.2 е показана линия на постоянно ниво на двумерна гаусова плътност - тя е елипса.

И тук както в едномерния случай имаме връзка между параметрите на закона и моментите на сл.в.:

Теорема 1 Ако h О N(m,C), то

E h = m, E (h-m)(h-m)ў = C .

Теоремата може да се докаже с проста смяна на променливите или като следствие на следната по - обща теорема.

Теорема 2 Случайната величина h = Tx+ a, където T е неизроден линеен оператор от Rⁿ в R^k (n і k), има разпределение N(a, TTў) в R^k.

От тази теорема следва, че всички маргинални разпределения (или проекции в произволна размерност) са нормални. Следва също, че произволна линейна функция от (зависими или независисми) нормални сл.в. е нормална сл.в.

Фигура 6.2: Линия на ниво

Верно е също, че и условните разпределения (при линейни ограничения от типа на равенството) са гаусови.

Доказателство: Ще разгледаме само случая h = Tx. В случая операторът T се представя просто като матрица с k Ј n реда и n колони и трябва да притежава пълен ранг k. Това означава, че нейните редове са линейно независими вектори в Rⁿ. Нека означим с S подпространството от линейните им комбинации. То очевидно има размерност k. Нека допълним редовете на T с n-k ортогонални помежду си и на S единични вектори и означим така получената матрица с [(T)\tilde]. Тогава по формулата за смяна на променливите [(h)\tilde] = [(T)\tilde]x ще има разпределение с плътност:

f(x) =

(2p)^n/2 det(

~
T

)

e^{-¹/₂xў([(T)\tilde][(T)\tilde]ў)^-1x}.

Но det([(T)\tilde]) = det(T) и матрицата [(T)\tilde][(T)\tilde]ў е блочно диагонална. Такава е и нейната обратна. Следователно, разпределението се разпада в произведение на две плътности:

f(x) = f₁(x₁)f₂(x₂) =

(2p)^{^k/₂}det(T)

e^{-¹/₂ x₁ў(TўT)^-1x₁}

(2p)^{[(n-k)/ 2]}

e^{-¹/₂||x₂||²}.

Тук разлагането x = {x₁,x₂} = x₁+x₂ представя вектора в неговите проекции (координати) в подпространството S и неговото ортогонално допълнение. От тук лесно следва твърдението на теоремата. Q.E.D.

6.2 Теорема на Кокрън

Определение 2 Случайната величина c²_n = xўx има разпределение c²(n) с n степени на свобода.

Фигура 6.3: c² разпределение

Теорема 3 Случайната величина c²_n има плътност:

f(x,n) = C(n) x^n/2-1 e^{[(-x)/ 2]}.

(6.3)

Тук C(n) = (¹/₂)^n/2G(ⁿ/₂) е нормираща константа.

Веднага се вижда, че това е гама-разпределение G(ⁿ/₂,¹/₂) и изводът може да се направи по индукция от n = 1 и възпроизводящите свойства на гама-разпределението: G(a,l)+G(b,l) = G(a+b,l).

Средната стойност на c²_n = xўx е очевидно n, а дисперсията лесно се пресмята и е равна на 2n. От следната проста лема непосредствено се вижда, че разпределението c²_n = xўx не може да се получи от друга квадратична форма на n гаусови сл.в., освен тривиалната.

Лема 1 Нека x_i,i = 1,...,n са независими сл.в. с еднаква дисперсия и l_i,i = 1,...,n са такива, че е_{i = 1}ⁿl_i = 1. Тогава сл.в. h = е_{i = 1}ⁿl_ix_i има минимална дисперсия, когато l_i = 1/n,i = 1,2,...,n.

Доказателство: Да предположим, че D(x_i) = 1. Тогава D(h) = е_{i = 1}ⁿl_i². В сила е обаче неравенството:

(

n
е
i = 1

l_i )² Ј n

n
е
i = 1

l_i².

При това, равенство се достига тогава и само тогава, когато l_i = C. Q.E.D.

Лема 2 Ако дадена квадратична форма Q има ранг q и сл.в. xўQx има разпределение е c²_q, то Q е проектор.

Доказателство: Да напомним, че проекторите са неотрицателно - определени оператори (т.е. са самоспрегнати Pў = P), а освен това са и иденпотенти (P² = P ). Това значи, че собствените им числа могат да бъдат само 0 или 1. Естествено, броят на ненулевите собствени числа е равен на ранга.

За доказателството е достатъчно да сравним дисперсиите на двете разпределения и да се възползуваме от лема 6.1. Ние обаче ше го изведем директно - така ще пресметнем и дисперсията на c²_q разпределение.

Действително, Q е неотрицателно определена и значи може да се представи като Q = UDUў, където U е ортогонална матрица, а D - диагонална. Тогава сл.в. xўQx и xўDx имат едно и също c²(q) разпределение.

D (xўDx) = E [(

n
е
i = 1

d_i(x² - 1))²] = 2

d_i² і 2 n.

Тъй като tr(Q) = еⁿ_{i = 1} d_i = n = tr(I), последното неравенство става равенство само когато d_i = 1,i = 1,2,...,n. Q.E.D.

Теорема 4 Теорема на Кокрън. Нека Q,R,S са неотрицателно определени матрици с рангове q,r,s съответно, Q = R + S и случайната величина xўQx има разпределение c²(q). Случайните величини xўR x и xўS x са независими и имат разпределения c²(r) и c²(s) тогава и само тогава, когато q = r+s.

Доказателство: Първо да отбележим, че съгласно лема 6.2 матрицата Q е проектор и можем да се ограничим в пространство с размерност q, когато Q = I.

Достатъчност. Имаме: I = R+S = U(D_R+D_S)Uў. Следователно, I = D_R+D_S. Ако q = r+s, то D_R и D_S имат съотвения брой ненулеви елементи, значи R и S са проектори и RS = SR = 0. За доказателството на независимостта използуваме равенството: ||Qx||² = ||x||² = ||Rx||² +||Sx||² за всяко x и xўRўRx = ||Rx||² = xўRx. Остава да приложим теорема 6.2 за операторите R и S и определението на хи-квадрат разпределение.

Необходимост. Равенството q = r+s следва директно от лема 6.2. Q.E.D.

Частен случай от теоремата на Кокрън е независимостта на [`(x)] = 1/nеx_i и S² = е(x_i-[`(x)])². Наистина,

||x||² = n

+ S² = xўBx+ xў(I-B)x.

Но тогава и съответните квадратични форми са породени от ортогонални проектори. Т.е. Bx^(I-B)x. Тук

B = ||

1/n

...

1/n

...

1/n

...

1/n

...

1/n

||.

Пример 1 Условно математическо очакване и коефициент на корелация.

Нека случайната величина x О R² и има разпределение N(m,S). Тогава условното математическо очакване и коефициентът на корелация се получават по формулите: E (x₂|x₁) = a x₁ + b, r(x₁,x₂) = a /S₂₂, където b = m₂ - a m₁, a = S₁₂ (S₂₂/S₁₁)^1/2. С S_ij сме означили елементите на ковариационната матрица на двумерната сл.в. x. В частност S₂₂ = s²(x₂).

Проверете тези формули.

Начало на лекцията | Съдържание | Индекс

File translated from T_EX by T_TH, version 2.10.
On 5 Apr 1999, 17:47.

Лекция 6 Многомерно нормално разпределение

6.1 Нормално Разпределение

6.2 Теорема на Кокрън

Начало на лекцията | Съдържание | Индекс

Лекция 6
Многомерно нормално разпределение