Нашата цел е да покажем, че много асимптотични резултати в непараметричната статистика следват от свойствата на брауновия мост.
Нека с W(t), (0 Ј t) означим стандартния винеров процес. Това е гаусов процес с независими нараствания, E W(t) = 0, D W(t) = t. Лесно се извеждат крайномерните разпределения на този процес - всички те са гаусови. Съгласно теоремата на Колмогоров съществува вероятностна мярка в пространството RT от всички функции определени на интервала [0,T]. Мярката на подпространството от непрекъснати функции C[0,Т] е 1, така че траекторите на процеса лежат в него с вероятност 1, Затова обикновено се казва, че той е процес с непрекъснати траектории.
Определение 1 Браунов мост наричаме процеса: w(t) = W(t)-W(1)*t, 0 Ј t Ј 1.
Определение 2 Да означим с Fn(t) извадъчната функция на разпределение, построена по n независими наблюдения над равномерно разпределена сл.в. в интервала (0,1). Извадъчен браунов мост наричаме процеса: wn(t) = Цn(Fn(t)-t), 0 Ј t Ј 1.
Траекториите на този процес естествено са непрекъснати от ляво и лежат в пространството D[0,1] на непрекъснати от ляво и ограничени функции с краен брой точки на прекъсване.
Да разгледаме едномерния случай.
Да означим с b(k,p) следната функция на векторите k, p О Rs (n = еi = 1s ki, ki і 0, ki - цели числа, еi = 1s pi = 1, pi > 0):
| (9.1) |
Нека t0 < t1 < t2 < ... < ts са фиксирани числа в интервала (0,1), t0 = 0, ts = 1. Да разгледаме съвместното разпределение на бройките попадения в интервалите Di = [ti-1,ti) на n независими еднакво разпределени равномерни сл.в. Това, разбира се, е добре известното полиномно разпределение, което се задава с формулата (9.1). За разпределенията на извадъчната функция на разпределение можем да използуваме този резултат по следния начин:
Нека сега t0 < t1 < t2 < ... < ts, i = 1,2,...,s са фиксирани числа в интервала [0,T], t0 = 0, ts = T. Да разгледаме поасонов случаен процес p(t), p(0) = 0 с интензивност l зададен на реалната полуправа - t О R+. Ще го разгледаме в интервала [0,T) Неговите съвместни разпределения в точките t0 = 0 < t1 < t2 < , ..., < ts = T се определят от (съвместните разпределения на) независимите нараствания на процеса в интервалите: Di = p(ti)-p(ti-1). Имаме, че li = l(ti - ti-1) и, следователно:
| (9.2) |
|
Нека p(u), u О [0,1] е еднороден поасонов процес с параметър l. Предполага се, че траекториите му са непрекъснати отляво. Да разгледаме трансформирания поасонов процес h(t) = p(F(t)). Така получаваме следната теорема:
Теорема 1 Ако ф.р. F е непрекъсната, то разпределението на процеса n Fn(t) съвпада с условното разпределение на поасоновия процес h(t) = p(F(t)) при условието h(Ґ) = n, (p(1) = n).
Доказателство: Наистина, ако F(t) = t (t О (0,1)), теоремата е доказана. Нека разгледаме произволна непрекъсната (без скокове) F и x е такава, че P (x < x) = F(x). Тогава разпределението на сл.в. h = F(x) е равномерно в интервала (0,1). Q.E.D.
Следователно, за непрекъснатите ф.р. можем да се съсредоточим върху разглеждането на тези крайно-мерни разпределения.
Теорема 2 Крайномерните разпределения на wn клонят към крайномерните разпределения на w.
Доказателство: Доказателството е почти очевидно. Да означим с Dk = tk-tk-1, U = еsk = 1 ukDk и разгледаме лог-характеристичната функция на нарастванията wn:
|
|
От тази теорема, разбира се, следва сходимост по разпределение на произволни ограничени функции зависещи от краен брой стойности на процеса в фиксирани точки по времето. За по-общи функционали това не е достатъчно.
Определение 3
Модул на непрекъснатост CD(y) О D[0,1] наричаме
функцията:
CD(y) =
sup
0 Ј t Ј 1 -D
sup
0 < h < D
|y(t)-y(t+h)|
Ще докажем едно вспомагателно твърдение за модула на непрекъснатост CD(wn) .
Лема 1
lim
D® 0
limsup
n®Ґ
P (CD(wn) > e) = 0
Доказателство: Да разгледаме двоично-рационални D = 2-l, l > 3. Имаме при l < m
|
|
|
Сега (9.3) можем да препишем във формата
| (9.4) |
Да се заемем с втората част на (9.4). Събитието {sup|wn([(k)/( 2m)])-wn(u)| > e} под знака на вероятността означава (при фиксираното m: 2m = n3), че в интервала ([(k)/( n3)],[(k+1)/( n3)]) е изпълнено |n(Fn(u)-u) -Fn([(k)/( n3)])| > Цne. Тъй като при достатъчно голямо n имаме Цne і 3, значи в интервала са се случили поне две събития: Sn і 2. P (Sn і 2) = O(n2 p2) . Тъй като p = n-3 от това следва,че n3 O(n-4) = O(n-1) ® 0. Q.E.D.
Тази лема е основното оръжие при изучаването на близостта на извадъчния Браунов мост към теоретичния. Сега лесно следва теоремата.
Теорема 3 Нека F е функционал определен на D[0,1] и F(wn) и F(w) са сл.в. Нека F е непрекъснат в метриката на C[0,1] в всяка точка на D[0,1] . Тогава F(wn) ® F(w)
Доказателство: Да означим за всяко x О D[0,1]:
|
Ако сега разгледаме непрекъснатата частично линейна функция през точките (kD, x(kD) и я означим с xD(t) , ще видим, че
| (9.5) |
Твърдението на теоремата лесно следва (ref3) от връзките:
(wn - wnD ) (по разпределение и п.с.);
(wnD - wD) - (вж. теорема 9.2);
(w - wD) (по разпределение и п.с.)
и разпределенията на стохастично наредените
F-e, F , F+e върху тях.
Q.E.D.
Сега можем да сумираме знанията си по непараметрична статистика. Разглеждат се два основни типа статистики свързани с извадъчното разпределение.
Определение 4
Статистика от интегрален тип наричаме:
S(mn) = h(
у
х
g(x) dmn(x))
Лесно се вижда, че за изучаването на граничното поведение на тези статистики е достатъчно да се изучава сходимостта по разпределние. При това интегралния (сумиращ) характер на функционала води до асимптотично нормално поведение. Това остава верно и при произволна размерност на елемента на извадката. Ще цитираме една теорема от този тип. Втората и част позволява лесно да се изучава асимптотичното поведение на максимално- правдоподобните оценки и самото правдоподобие в точката на максимума.
Теорема 4
Нека функцията h(x):Rs® R1 е диференцируема в т.a = тg(x) dm(x) О Rs и матрицата от втори моменти:
s2 = т(g(x)-a)(g(x)-a)ўdm(x) е крайна.
Тук x = {x1,x,...,xs}ў О N(0,s2) . (Допускат се
и изродени разпределения.)
(S(mn) - h(x0))Цn
d
®
1
2
xT hў(а) =
1
2
s
е
j = 1
xj
¶h(a)
¶tj
. (9.6)
(S(mn) - h(x0))n
d
®
1
2
xT hўў(а) =
1
2
s
е
i,j = 1
xj
¶2 h(a)
¶ti ¶tj
. (9.7)
Определение 5
Статистика от точков тип наричаме:
S = F(mn)
За изучаването на граничното поведение на общи функционали от този тип вече не стига слабата сходимост. Налага се да се използуват теореми от типа на Гливенко-Кантели и Брауновия мост (виж теорема 9.4).
Двата класа, разбира се, имат непразно сечение.