Лекция 13
Критерии за съгласие

Тези методи са основани изцяло на свойствата на порядковите статистики и извадъчната функция на разпределение. В тази лекция ще се заемем по - подробно със свойствата на тези статистики, по специално:

13.1  Теорема на Гливенко-Кантели

Имаме EFn(x) = F(x),       D Fn(x) = F(x)(1-F(x))/n. Следователно, Fn(x) клони п.с. към теоретичната F(x) за всяко фиксирано x. Верно е обаче по - силното твърдение на Гливенко - Кантели:

Теорема 1

P (
lim
n®Ґ 

sup
x 
|Fn(x)-F(x)| = 0) = 1
(13.1)

Доказателство:  Първо да отбележим, че без намаление на общността можем да считаме F(x) строго растяща функция. Ще докажем теоремата при допълнителното ограничение, че тя няма скокове - т.е. е непрекъсната. Тогава тя притежава обратна функция F-1(u), определена на интервала (0,1).

Сега твърдението на теоремата може да се препише в следната форма:

Dn =
sup
u 
|Gn(u) - u| п.с.
®
 
0,
където Gn(u) = Fn(F-1(u)). Да фиксираме e = 1/r и разделим интервала (0,1) на r равни части.

gk.gif
Фигура 13.1: Един интервал

На фигура 13.1 е показан един такъв интервал. С удебелена линия е отбелязана ''целевата'' функция u. Границите на интервалите да означим с ui = i/r. Тъй като във всяка от точките ui Gn(ui) клони п.с. към ui, можем да подберем N така, че "n > N да е изпълнено неравенството:

P (
sup
i 
|Gn(ui) - ui| > e) < e.

Сега остава да отбележим, че Gn е монотонна, и ако в краищата на интервала |Gn(ui) - ui| Ј e, то вътре в интервала |Gn(u) - u| Ј 2e.

Така получаваме:

P (
sup
u 
|Gn(u) - u| > 2 e) < e,    "n > N.
Това означава, че редицата Dn® 0. Q.E.D.

Така с помощта на тази теорема получаваме лесно силна състоятелност на много статистически оценки.

13.2  Критерий на Колмогоров - Смирнов

От доказателството на теорема 13.1 е ясна пълната независимост на поведението на редицата Dn от вида на функцията на разпределение F(x), стига да е непрекъсната. Твърдения от този вид се наричат свободни от разпределение (distribution free). С тяхна помощ се строят редица статистически критерии.

Една от основните задачи на статистиката е проверката на съответствие на теоретичното разпределение с извадката. Това е нещо като проверка на адекватността на модела - нашите предположения за разпределението. Следната теорема ни дава средства за това:

Теорема 2 (Колмогоров - Смирнов) За всяка непрекъсната функция на разпределение F(x) е в сила съотношението:

P ( Цn Dn < x) ®K(x),
където функцията на разпределение се представя във вида:
K(x) = Ґ
е
k = -Ґ 
(-1)k e-2 k2x2,    0 < x.

Доказателство: Виж например [Янев, Димитров (1990)].Q.E.D.

Функцията е K(x) табулирана и това прави използуването на критерия сравнително леко. От таблицата се извлича квантила ka: K(ka) = 1 - a за необходимото критично ниво a. От данните и теоретичната ф.р. F(x) се пресмята статистиката ЦnDn и се сравнява с ka. Ако я надхвърли, хипотезата за съгласие се отхвърля.

13.3  c2-критерий

В много случаи данните са представени във вид на хистограма или са групирани в определени категории - така, например, те се дават в статистическия годишник на Република България. За да можем и за такива данни да проверяваме съгласие с дадено теоретично разпределение се използува т.н. c2-критерий.

histo.gif
Фигура 13.2: Една хистограма

Нека ни е зададена някаква теоретична плътност p(x) и имаме за задача да проверим съгласуваността й с извадката. Нека разполагаме с n наблюдения. Разделяме множеството от стойности на сл.в. (или носителя на плътността) на k интервала Hi, така че pi = тHi p(x)dx > 0 и npi > 5. Това изискване е важно. Понякога се налага някои интервали да се обединяват, за да може то да се удовлетвори. Съществува и вариант на хистограмата (и критерия), когато интервалите се избират равновероятни, т.е. pi = pj. Нека означим с ni броя на наблюденията попаднали в Hi. Пресмятаме статистиката

h = k
е
i = 1 
(npi - ni)2
n pi
.
(13.2)

Теорема 3 (Пирсън) Статистиката h има асимптотично (при n®Ґ) разпределение c2 с k-1 степени на свобода.

Доказателство: Строгото доказателство е твърде трудоемко. Затова тук ще покажем само идеята. Всяко от събираемите в (13.2) представлява квадрата на центрирана асимптотично нормална сл.в. Действително, npi = E ni. За съжаление, тези величини са зависими - еni = n. Оказва се, че условното разпределение на сл. гаусов вектор x О N(0,I) в Rn при условие (x, 1) = 0 е същото като асимптотичното съвместно разпределение на сл.в. ni, съответно центрирани и нормирани. Q.E.D.




Начало на лекцията | Съдържание | Индекс


File translated from TEX by TTH, version 2.10.
On 5 Apr 1999, 17:47.