Лекция 8
Непараметрични основи

Те са основани изцяло на свойствата на извадъчното разпределение. В тази лекция

8.1  Вероятностни мерки в Rn

Тъй като ще разглеждаме редици от вероятностни мерки, определени на бореловата s-алгебра в Rn, е редно да въведем някои определения за разстояния (метрики) и видове сходимости. Полезна допълнителна информация по въпроса може да се намери у [Биллингсли, 1977].

Нека F е семейство от измерими (борелови) подмножества в Rn. Да означим с

rF(m,n) =
sup
B О F 
|m(B)-n(B)|.
(8.1)

Теорема 1 rF удовлетворява неравенството на триъгълника. Ако N е фиксирано и FN е семейство, породено F с помощта на ограничен брой ( Ј N ) булеви операции, то метриките rF и rFN са еквивалентни. Ако s(F) = B, то rF става истинско разстояние.

Доказателство: 1. За да докажем че rF е метрика е достатъчно е да забележим, че всяка мярка е нещо като вектор с координати - стойностите си върху F.
2. |m(A+B)-n(A+B)| Ј |m(A)-n(A)|+|m(B)-n(B)| или rF2 Ј 2*rF. Обратното неравенство: rF Ј rF2 е очевидно.
3. Ако s(F) = B, то всяка m се възстановява однозначно по стойностите си на F (теорема на Каратеодори). Q.E.D.

Определение 1 Казваме, че редицата от вероятностни мерки mn клони слабо към m, ако за всяка ограничена непрекъсната функция f е в сила сходимостта: тRn f(x) dmn(x) ® тRn f(x) dm(x).

Слабата сходимост в сепарабелно метрично пространство X се метризира с т.н. метрика на Леви - Прохоров.

Определение 2 Да означим с F клас от подмножества на X и означим S(F,e) = {x:$y О F,    ||x-y|| Ј e} e-обвивката на множеството F. За всеки две вероятностни мерки m и n е определено числото:

D(m,n) =
inf
e 
{e:m(F) Ј n(S(F,e)) + e,   "F О F}.
Метриката на Леви - Прохоров се определя L(m,n) = LF(m,n) = max(D(m,n),D(n,m)), когато класът от подмножества F съвпада с всички затворени подмножества на X.

Връзката между метриките rF и LF се дава от следното очевидно неравенство:

rF і LF.
(8.2)

Това означава, че ако една редица е сходяща в разстоянието r, то тя е сходяща и в разстоянието на Леви L. Разбира се тук се подразбира един и същ клас F. В сепарабелните метрични пространства е достатъчно да се вземе изброим клас множества. Например, това могат да бъдат всички сфери с рационален радиус и центрове в навсякъде плътно подмножество на X.

Пример 1 В разстоянието на Леви редицата от гаусови разпределения N(0,1/n) е сходяща към изродената мярка в т. 0.

8.2  Извадъчно разпределение

Нека в резултат на статистическото изследване сме получили наблюденията xn = {x1,x2,...,xn} . Най-често за тях се предполага, че са независими наблюдения на сл.в. x със стойности в множеството X. В тези лекции винаги ще предполагаме, че X М Rn и е борелово - X О B.

Нека означим с mx вероятностната мярка породена от сл.в. x на измеримото пространство (X,B) по формулата: mx(B) = P (x О B).

Определение 3 Извадъчно разпределение на наблюдението xn наричаме вероятностната мярка mn на (X,B), определена по формулата: mn(B) = 1/n еni = 1 I{xi О B}.

Когато разглеждаме xn като сл.в., тази вероятностна мярка е също сл.в. За да подчертаваме това \'и свойство, понякога ще добавяме нов индекс w. Следното твърдение е очевидно:

Теорема 2 За "B О B сл.в. nmn(B) има биномно разпределение B(n,mx(B)).

Когато се интересуваме от асимптотичните свойства на извадъчното разпределение, т.е. когато n®Ґ, ще е удобно да разглеждаме т.н. безкрайна извадка. Безкрайномерната сл.в. xҐ сега ще приема своите стойности в декартовото произведение XҐ = XxXxX...xX..., където нейното разпределние е произведение на маргиналните разпределения. Съгласно теоремата на Колмогоров вероятностното пространство (XҐ,B,Pmi) е добре определено (т.е.w = xҐ ). В математическата статистика е прието именно това пространство да бъде основно. За извадка от Rm ще използуваме маргиналната проекция на w.

Така съгласно определение 8.3 редицата mn(B) се подчинява на силния закон за големите числа и mn(B) ® m(B).

8.3  Теорема на Гливенко-Кантели

Когато X = R1 получаваме добре известното представяне на разпределения с т.н. функции на разпределение.

Определение 4 Наредените по големина стойности на x1,x2,...,xn се наричат вариационен ред x(1) Ј x(2) Ј ј Ј x(n), а елементите на реда - порядкови статистики.

Така първата порядкова статистика е x(1) = minI(xi), а последната - x(n) = maxI(xi). От това определение се вижда, че вариационният ред е векторна случайна величина - функция от вектора x1,x2,...,xn. При това е ясно, че тя е достатъчна статистика (за които и да е параметър на ) F(x).

Определение 5 Извадъчна функция на разпределение наричаме случайната функция:

Fn(x,w) = м
п
п
п
н
п
п
п
о
0
x < x(1)
k
n
x(k-1) Ј x < x(k)
1
x(n) Ј x

Обикновено е прието вторият аргумент да се изпуска. Извадъчната функция на разпределение Fn(x) е сума от независими сл.в. и има просто разпределение при фиксирана стойност на x. Ако x е точка на непрекъснатост на F(x), то n Fn(x) е биномна сл.в., т.е. n Fn(x) О B(n,F(x)). Имаме E Fn(x) = F(x), D Fn(x) = F(x)(1-F(x))/n. Следователно, Fn(x) клони п.с. към теоретичната F(x) за всяко фиксирано x.

Имаме EFn(x) = F(x),       D Fn(x) = F(x)(1-F(x))/n. Следователно, Fn(x) клони п.с. към теоретичната F(x) за всяко фиксирано x. Верно е обаче по - силното твърдение на Гливенко - Кантели:

Теорема 3 Теорема на Гливенко-Кантели в R1.

P (
lim
n®Ґ 

sup
x 
|Fn(x)-F(x)| = 0) = 1
(8.3)

Доказателство: Виж лекциите по статистика. Q.E.D.

Сега да разгледаме смисълът на тази теорема в термини на извадъчни разпределения в Rn. Нека означим с F класът от интервали (-Ґ, x). Тогава можем да преформулираме теоремата така:

rF(mn,m) п.с.
®
 
0.
(8.4)

Останалата конструкция в този параграф е от [Боровков (1984)]. За да я докажем в Rm ще въведем следното:

Определение 6 Класът от множества S М Bn наричаме крайно апроксимируем относно разпределението m, ако "e съществува крайно множество от подмножества Se М Bn такова, че "A О S,$A1,A2 О Se, A1 М A М A2 и m(A2\A1) < e.

Теорема 4 Клас от множества, получен чрез булеви операции от крайно апроксимируеми относно m класове, е крайно апроксимируем.

Доказателство: Следва от неравенствата:

m(A2ЗB2)-m(A1ЗB1) = m(A2ЗB2\A1ЗB1) Ј m(A2\A1)-m(B2\B1) Ј 2e;
m(A2ИB2)-m(A1ИB1) Ј m(A2\A1)-m(B2\B1) Ј 2e.
Q.E.D.

Теорема 5 За всеки крайно-апроксимируем клас множества F е изпълнено твърдението на теоремата на Гливенко - Кантели, т.е. сходимостта (8.4).

Доказателство: Нека A О F и Fe се състои от множествата: A1,A2,...,AN .

mn(A)-m(A) Ј mn(A2)-m(A1) Ј mn(A2)-m(A2)+e
mn(A)-m(A) і mn(A1)-m(A2) і mn(A1)-m(A1)-e
Затова
N
З
1 
{|mn(Ai) - m(Ai)| < e} М {
sup
A О F 
|mn(A)-m(A)| < 2e}.
Тъй като за всяко от N-те множества е изпълнено mn(Aj) ® m(Aj) от горните неравенства следва твърдението на теоремата. Q.E.D.

Следствие 1 Класът от ъгли: F = {Зi = 1m (-Ґ,xi) } е крайно апроксимируем за всяко разпределение m. Наистина, в R1 нека разгледаме точките zk, k = 0,1,2,...,N, z0 = -Ґ, zN = Ґ такива, че F(zk+1) - F(zk+0) Ј e и всички скокове на F с големина по-голяма от e/2. Нека означим с Fe класът от интервали (-Ґ, zk), (-Ґ, zk], k = 0,1,2,...,N. Така получаваме крайно апроксимируем клас за всяка от проекциите на m. Остава да се възползуваме от теорема 8.4. Q.E.D.

Да означим с KM кубът Зi = 1m {|xi| Ј M}, с (A) - топологическата граница на A, с m мярката на Лебег.

Определение 7 Казваме, че един клас от множества F в Rm е с пренебрежими граници, ако съществува такава функция f(M,e)® 0, e® 0, че "A О F m(S((AЗKM),e)) Ј f(M,e) .

Теорема 6 Ако m е абсолютно непрекъсната по отношение на лебеговата мярка m в Rn и класът от множества F е с пренебрежими граници, то той е крайно апроксимируем и, следователно, е изпълнено твърдението (8.4).

Доказателство: Първо да отбележим, че задачата може да се разглежда в достатъчно голям куб KM. Нека M О F. Ще определим Fe като крайни обединения на затворени кубчета със страна d и с върхове jd. Те са краен брой и покриват KM. Нека A1,A2 О Fe и A1 М B М A2. Тогава съгласно условията получаваме.

A2\A1 М S((B), 2dЦm),
Значи, избирайки d можем да намалим достатъчно m(A2\A2) Ј f((B), 2dЦm) . Остава да използуваме абсолютната непрекъснатост на m. "e > 0$g = g(e) > 0: m(A) < e за "A: m(a) < g. Значи пак посредством избора на d можем да направим f Ј g(e) и, следователно, m(A2\A2) < e. Q.E.D.

Следствие 2 Класът от изпъкнали множества е с пренебрежими граници и, следователно, за абсолютно непрекъснатите разпределения е е изпълнено твърдението (8.4). Наистина, границата на всяко изпъкнало множество се мажорира от границата на куба, който го съдържа.

m(S((AЗKM),e)) Ј m(S((KM),e)) Ј 2M(2M)s-1 e
.




Начало на лекцията | Съдържание | Индекс


File translated from TEX by TTH, version 2.10.
On 4 Jun 1999, 15:57.