Имаме EFn(x) = F(x), D Fn(x) = F(x)(1-F(x))/n. Следователно, Fn(x) клони п.с. към теоретичната F(x) за всяко фиксирано x. Верно е обаче по - силното твърдение на Гливенко - Кантели:
Теорема 1
P (
lim
n®Ґ
sup
x
|Fn(x)-F(x)| = 0) = 1 (13.1)
Доказателство: Първо да отбележим, че без намаление на общността можем да считаме F(x) строго растяща функция. Ще докажем теоремата при допълнителното ограничение, че тя няма скокове - т.е. е непрекъсната. Тогава тя притежава обратна функция F-1(u), определена на интервала (0,1).
Сега твърдението на теоремата може да се препише в следната форма:
|
На фигура 13.1 е показан един такъв интервал. С удебелена линия е отбелязана ''целевата'' функция u. Границите на интервалите да означим с ui = i/r. Тъй като във всяка от точките ui Gn(ui) клони п.с. към ui, можем да подберем N така, че "n > N да е изпълнено неравенството:
|
Сега остава да отбележим, че Gn е монотонна, и ако в краищата на интервала |Gn(ui) - ui| Ј e, то вътре в интервала |Gn(u) - u| Ј 2e.
Така получаваме:
|
Така с помощта на тази теорема получаваме лесно силна състоятелност на много статистически оценки.
Една от основните задачи на статистиката е проверката на съответствие на теоретичното разпределение с извадката. Това е нещо като проверка на адекватността на модела - нашите предположения за разпределението. Следната теорема ни дава средства за това:
Теорема 2
(Колмогоров - Смирнов)
За всяка непрекъсната функция на разпределение F(x) е
в сила съотношението:
P ( Цn Dn < x) ®K(x),
K(x) =
Ґ
е
k = -Ґ
(-1)k e-2 k2x2, 0 < x.
Доказателство: Виж например [Янев, Димитров (1990)].Q.E.D.
Функцията е K(x) табулирана и това прави използуването на критерия сравнително леко. От таблицата се извлича квантила ka: K(ka) = 1 - a за необходимото критично ниво a. От данните и теоретичната ф.р. F(x) се пресмята статистиката ЦnDn и се сравнява с ka. Ако я надхвърли, хипотезата за съгласие се отхвърля.
Нека ни е зададена някаква теоретична плътност p(x) и имаме за задача да проверим съгласуваността й с извадката. Нека разполагаме с n наблюдения. Разделяме множеството от стойности на сл.в. (или носителя на плътността) на k интервала Hi, така че pi = тHi p(x)dx > 0 и npi > 5. Това изискване е важно. Понякога се налага някои интервали да се обединяват, за да може то да се удовлетвори. Съществува и вариант на хистограмата (и критерия), когато интервалите се избират равновероятни, т.е. pi = pj. Нека означим с ni броя на наблюденията попаднали в Hi. Пресмятаме статистиката
| (13.2) |
Теорема 3 (Пирсън) Статистиката h има асимптотично (при n®Ґ) разпределение c2 с k-1 степени на свобода.
Доказателство: Строгото доказателство е твърде трудоемко. Затова тук ще покажем само идеята. Всяко от събираемите в (13.2) представлява квадрата на центрирана асимптотично нормална сл.в. Действително, npi = E ni. За съжаление, тези величини са зависими - еni = n. Оказва се, че условното разпределение на сл. гаусов вектор x О N(0,I) в Rn при условие (x, 1) = 0 е същото като асимптотичното съвместно разпределение на сл.в. ni, съответно центрирани и нормирани. Q.E.D.