Предишна тема Съдържание Следваща тема

Тема 5   Числови характеристики на сл.в.



В миналата лекция се запознахме с разпределенията на сл.в. Сега ще разгледаме някои числови характеристики, които се пресмятат само по разпределението. Първо ще определим най - популярната числова характеристика математическото очакване (м.о.) и ще изведем основните му свойства.

5.1   Математическо очакване.

Определение 5.1   Математическо очакване E x на простата сл.в. x приемаща стойности x1,x2,...,xn върху събитията от пълната група (H1,H2,...,Hn) определяме като E x = Sk=1n xk P (Hk).
От това определение се вижда веднага, че числото E x зависи само от стойностите на x и вероятностите, с които те се приемат, а не зависи от това за кои точно елементарни събития и каква пълна група това става. Т.е. то не зависи от това в какво вероятностно пространство е реализирана сл.в.

Теорема 5.1   За прости сл.в. математическото очакване притежава следните свойства:
  1. монотонност - Ако x < h, то E x < E h;
  2. линейност - E  (ax+bh)=aE x+bE h;
  3. мултипликативност - Ако x ^ h, то E xh=E x E h;

Доказателство: Ще използуваме означенията на теорема 4.1. Нека пълната група събития (H1,H2,...,Hn) съответствува на сл.в. x, пълната група събития (G1,G2,...,Gm) на сл.в. h, а техните стойности са съответно {x1,x2,... xn} и {y1,y2,... ym}. Тогава
E  xh=
 
S
i,j
xi yjP  (HiGj)=
 
S
i,j
xi yjP (Hi)P  (Gj)=
 
S
i
xi P  (Hi)
 
S
j
yjP (Gj)=E xE h.

Тези свойства на математическото очакване и особено неговата монотонност позволяват то лесно да се разпространи за произволни неотрицателни сл.в. Може обаче да се окаже, че то е безкрайно.

Математическото очакване на непрекъснатата сл.в. x се пресмята като интеграла: E x = т x f(x) dx, а това на дискретна като сумата E  x = Si xi pi, когато това е възможно. Тези две формули могат да се обединят в една с помощта на интеграла на Лебег-Стилтес: E x = т x dF(x). Той съществува (и е краен), когато е краен интегралът E x = т |x| dF(x)<Ґ.

Определение 5.2   Момент от ред k на сл.в.x наричаме следната числова величина (когато съществува): обикновен - E  xk , абсолютен - E |x|k , централен - E  (x-E x)k .

5.2   Числови характеристики.

Локация

М.о. е най - важната характеристика за положението на стойностите на сл.в. върху числовата ос. За съжаление, както видяхме, тя е определена не за всички сл.в..

Определение 5.3   Медиана се определя като решение на уравнението: F(µ)=1/2.

Тя описва положението на средата на разпределението върху числовата ос. Когато решението не е единствено, се взима средата на интервала от решения. В много случаи се използува и положението на други характерни точки от разпределението.

Определение 5.4   Квантил с ниво a на дадено разпределение F се определя като решение на уравнението:
F(q
 
a
)=a.

В статистиката квантилите на вероятности кратни на 1/4 се наричат квартили, тези - на 1/10 - децили, а на 1/100 - процентили. Така µ = q1/2 е втори квартил, пети децил, петдесети процентил.

Определение 5.5   Мода се определя като най - вероятното число за дискретни сл.в., а за непрекъснати ---като координатата на максимума на плътността.
Естествено, разпределенията могат и да не притежават единствена мода. За симетрични разпределения, очевидно трите характеристики: мода (ако има такава), медиана и м.о. съвпадат.

Мащаб

Определение 5.6   Дисперсия на сл.в. x се определя като числото D  x=E (x-E x)2. Дисперсията може да се окаже и безкрайна.

Дисперсията е най - важната характеристика на разсейване на стойностите на сл.в. За дискретни и непрекъснати разпределения тя се пресмята по формулите:
D  x = у
х
(x-E x)2 f(x) dx,   D
 x =
 
S
i
(xi-E  x )2 pi.     (5.1)
Фактически вместо дисперсията, както в числовите, така и в аналитичните сметки, се използува стандартно отклонение. Това е:
s(x)=( D  x )1/2 =(E (x -E  x )2)1/2.     (5.2)
Тази характеристика се мери в същите физически единици, като x и може да бъде съответно интерпретирана. Тук са показани плътности от нормалното семейство с различни стандартни отклонения.
Фигура 5.1: Различни дисперсии

Колкото по - малка е дисперсията или стандартното отклонение, толкова по - сгъстени са стойностите и по - вероятни са те в центъра на разпределението. За това, когато искаме да се отървем от размерността, например за да сравним разпределенията на две различни сл.в., прилагаме т.н. центриране и нормиране. Вместо величината x разглеждаме центрираната и нормирана величина
~
x
 
=
x - E x
s(x)
.     (5.3)

Когато дисперсията е безкрайна за ''определяне'' на мащаба се използува т.н. интерквартилен размах.
Определение 5.7   Наричаме интерквартилен размах r разликата между третия и първия квартили: r = q3/4 - q1/4.

Форма

Следните две характеристики на разпределенията не зависят от мерните единици, с които са отчитани съответните сл.в., както и от условните начала на скалите. С други думи, те са безразмерни. Те отразяват различията във формата на разпределенията, но не зависят от мащаба и локацията.

Определение 5.8   Ще наричаме асиметрия на x числото (когато съществува):
Ass(x)=
E (x-E x)3
s3(x)
= E  
~
x
 
3.     (5.4)
На тази фигура е дадено сравнение на положително асиметрична плътност с плътността на стандартния нормален закон, която е симетрична и има асиметрия 0. Положителната асиметрия се характеризира с ''по - тежка'' дясна опашка на разпределението.
Фигура 5.2: Положителна асиметрия

При асиметричните разпределения се променят обикновено и взаимните положения на модата, медианата и математическото очакване. За разпределения с положителна асиметрия те се нареждат в посочения ред, а за тези с отрицателна --- в обратния. Това правило, разбира се, е верно само за унимодални разпределения с проста аналитична форма на плътността. Вижте също семейството на Бета - разпределенията 11.3.

Определение 5.9   Ще наричаме ексцес на x числото (когато съществува):
Ex(x)=
E (x-E x)4
s4(x)
-3=E  
~
x
 
4 - 3.     (5.5)
Тук е представено разпределение с положителен ексцес. То има по - дълги и тежки опашки от нормалното (с ексцес 0). Разпределенията с отрицателен ексцес може изобщо да нямат опашки --- например, такова е равномерното в краен интервал.
Фигура 5.3: Положителен ексцес

Изобщо казано, двата параметъра асиметрия и ексцес дават достатъчно пълна картина за формата на разпределението, когато то е унимодално и гладко. Всъщност такива разпределения обикновено принадлежат на семейство, описвано с няколко параметъра.

Особено място сред тези фамилии заема двупараметричната фамилия на нормалните разпределения (вж. определение 7.1), с която скоро ще се запознаем. За всички нормални разпределения и асиметрията и ексцеса са равни на 0. Така тези две характеристики за форма придобиват смисъл на характеристики за отклонение от нормалността.

5.3   Неравенства

Ще започнем с някои прости свойства на дисперсията.
  D x і 0;     (5.6)
D x = 0 Ы P (x = const)=0;     (5.7)
D x= E x2 - (E x)2;       (5.8)
D ax=a2D x; D (x+c)=Dx  
D (x+h)=Dx + Dh, ако x^h.

Доказателство:

Неравенство на Чебишов

Следното знаменито неравенство се използува много често. За всички r > 0 и e>0 е в сила неравенството:
P (|x| > e) <
E  |x|r
er
    (5.9)

Доказателство: Да означим с IA сл.в. (индикатор на събитието A)
E  |x|r= E   |x|rI
 
|x| > e
+ E   |x|rI
 
|x| Ј e
і er E   I
 
|x| > e
= er P (|x| > e).
От това неравенство следва Ю на твърдение (5.7):
0=P (|x-E x|>1/n)Ю P (x=E x)=1.

Неравенства за моментите

От уравненията (5.6) и (5.8) веднага следва следното неравенство за моментите:
(E x)2 Ј E  x2,     (5.10)
което е частен случай на по - общото:
(E |x|r)1/r Ј (E |x|k)1/k,  при всички r < k.     (5.11)

От това неравенство следва, че ако съществува (т.е. е краен) моментът от ред k на една сл.в., то съществуват моментите от всеки ред r<k.

5.4   *Линейни пространства сл.в.

М.о. може, разбира се, да се определи и абстрактно. Всяка неотрицателна сл.в. x+ може да се представи като граница на монотонно нарастваща редица от прости сл.в. x+=limn xn=­ xn. Следователно, винаги съществува границата E x=lim E  xn, възможно равна на Ґ . Всяка сл.в. x може да се представи като сума x=x+ + x-. Така, ако и двете м.о. са крайни, можем спокойно да определим E x=E x+ + E x-.

Класовете еквивалентни с вероятност 1 сл.в. (к.е.сл.в.), зададени на дадено фиксирано вероятностно пространство (W, A,P ) образуват линейно пространство. Нека го означим с M= M(W, A,P ). Да разгледаме подмножествата LrМ M, (1Ј r ЈҐ) от сл.в. с краен r-ти абсолютен момент. Тъй като в тях работи същото отношение на еквивалентност, к.е.сл.в. от съответните множества образуват пълни линейни нормирани пространства, ако за норма във всяко от тях служи: || x ||r = (E  |x|r)1/r. При това е от неравенството (5.11) следва включването:

L
Ґ
 
М LrМ LpМ L1М M,   1<p<r<Ґ.

Особен интерес представлява пространството L2 от сл.в. с крайна дисперсия. То е Хилбертово и скаларното произведение в него е (x,h)=E  xh . Така центрираните сл.в., ако са независими, са ортогонални в L2 . Обратното твърдение не винаги е верно.

Нека FМ A и разделянето, което й съответствува е g. Да разгледаме подмножеството на L2 от сл.в., такива, че AxМ F. Те очевидно образуват линейно подпространство на L2. Проекторът върху това подпространство да означим с E g. Ще го наричаме условно м.о. при условие разделянето g, или s-алгебрата, която му съответствува. В частност, ако означим с e разделянето, което съответствува на A и n={,W}, то E e= I, E n= E  . Условното м.о. на всяка сл.в. x при условие крайното разделяне g е проста сл.в. с константни стойности върху елементите му. Условните м.о. удовлетворяват всички свойства на ортогоналните проектори в Хилбертово пространство. Ако g^d, то E g и E d комутират.



Д.Въндев -Теория на вероятностите - January 9, 2002
Предишна тема Съдържание Следваща тема