В тази лекция ще продължим разглеждането на основните методи на математическата статистика.
Теорема 1
P(
lim
n®Ґ
sup
x
|Fn(x)-F(x)| = 0) = 1. (5.1)
Веднага от тази теорема следва, че всички линейни комбинации от порядкови статистики, зададени във формата
| (5.2) |
Пример 1 Оценка на моментите.
В частност,
|
Нека разгледаме сл.в., за която съществува E|x|r < Ґ . Нека неизвестния параметър q = f(E x,E x2,...,E xr), където f(.) е непрекъсната функция. Тогава
|
Това е най - популярния метод за конструиране на точкови оценки в теоретичната статистика. Неговата популярност се дължи на две неща:
Нека предположим, че разпределението в генералната съвкупност има плътност f(x,q) (по отношение на лебеговата мярка) известна с точност до неизвестен едномерен или многомерен параметър q О Q. Тогава извадката {x1,x2,...,xn} като вектор от независими сл.в. ще има плътност в извадъчното пространство Rn от вида Ln([(x)\vec],q) = Хi = 1n f(xi,q), която наричаме функция на правдоподобие.
Определение 1
Казваме, че оценката [^(q)](x) удовлетворява принципа на максимално
правдоподобие, ако
Ln(
®
x
,
^
q
(x)) =
max
q
Ln(
®
x
,q) (5.3)
Всъщност достатъчно е в случая да се разглежда лебегова мярка, но само там където някоя от плътностите притежава положителни стойности. Максимум на правдоподобието Ln се достига в същата точка и за логаритъма LLn([(x)\vec],q) = logLn([(x)\vec],q). Затова е удобно при намирането му да решаваме ''уравненията на правдоподобие'':
| (5.4) |
Определение 2 Наричаме оценката максимално-правдоподобна, ако функцията на првдоподобие е диференцируема и оценката удовлетворяава уравненията на правдоподобие (5.4).
Пример 2 Нека x О N(m,s2). Нека сме направили n наблюдения. Да намерим максимално - правдоподобните оценки.
Решение. Определяме Q = R1 xR1+. Логаритъмът на правдоподобие има вида:
|
|
|
Теорема 2 Ако са изпълнени условията на неравенството на Рао - Крамер и съществува ефективна оценка, то тя съвпада с оценката по метода на максимално правдоподобие.
Доказателство: Наистина, условието за ефективност (равенството 4.2) изглежда така:
| (5.5) |
Теорема 3
Ако плътността f(x,q),q О Q М Rm удовлетворява
следните условия:
то асимптотичното разпределение на [^(q)] при n ®Ґ
е нормално със средна стойност q и ковариационна матрица
1/n C-1.
ci,j = E (
¶logf(q)
¶qi
¶logf(q)
¶qj
)
Доказателство: Ще докажем тази теорема за едномерен параметър. Поради състоятелността можем да напишем разложението на производната на функцията на правдоподобие в ред на Тейлър около истинския параметър:
| (5.6) |
|
|
Значи трябва да нормираме първия член като разделим цялото равенство с (n C)1/2. Така първия член клони към N(0,1).
Вторият член разделяме на два съмножителя: първият (n C)1/2([^(q)]-q) е, което ни трябва, а вторият по закона на големите числа клони п.с. към 1:
|
Последният член очевидно клони към нула:
|
|
В този параграф отново ще се върнем към проверката на статистически хипотези.
В много случаи не сме в състояние да формулираме просто както хипотезата си, така и алтернативата. В този слуай директното използуване на лемата на Нейман-Пирсън е затруднително. Това се получава, например, при сложна алтернатива, както видяхме в предната лекция.
Нека формулираме нашата обща постановка така. Нека Q0 М Q.
Нека определим следното отношение на правдоподобия:
|
Ясно е, че l(x) Ј 1. Определяме си критичната област по правилото W = {x: l(x) Ј c}. Особено удачно този тип критерии работи при нормалната теория на регресията, където ще видим и много примери за използуването им.