Статистика

Димитър Л. Въндев

Записки,     1999


Съдържание

Предговор
1  Основни методи на статистиката
    1.1  Събиране на данни
    1.2  Дескриптивна статистика
    1.3  Математическа статистика.
2  Прости непараметрични методи
    2.1  Тест на знаците
    2.2  Доверителен интервал за медиана
    2.3  Тест на Ман-Уитни или Уилкоксън
3  Методи на математическата статистика
    3.1  Изводи и хипотези
    3.2  Доверителни интервали
    3.3  Статистики
4  Оценяване на параметри
    4.1  Определения
    4.2  Н.О.М.Д.
    4.3  Неравенство на Рао - Крамер
5  Методи за построяване на оценки
    5.1  Метод на моментите
    5.2  Максималното правдоподобие
    5.3  Отношение на правдоподобия
6  Многомерно нормално разпределение
    6.1  Нормално Разпределение
    6.2  Теорема на Кокрън
7  Тестове на Стюдент и Фишер
    7.1  Доверителен интервал за дисперсия
    7.2  Разпределение на Фишер
    7.3  Разпределение на Стюдент
8  Регресионен анализ
    8.1  Линейни модели
    8.2  Нормална линейна регресия
9  Хипотези в регресията
    9.1  Коефициент на детерминация
    9.2  Равенство на нула
    9.3  Прогнозирана стойност
    9.4  Адекватност
10  Полиномна регресия
    10.1  Населението на САЩ
    10.2  Ортогонални полиноми
    10.3  Оптимална степен
11  Дисперсионен и ковариационен анализи
    11.1  Основен модел
    11.2  Множествени сравнения
    11.3  Двуфакторен анализ
    11.4  Примери
    11.5  Ковариационен анализ
12  Дискриминантен анализ
    12.1  Основни понятия
    12.2  Вероятностна формулировка
    12.3  Стъпков дискриминантен анализ
13  Критерии за съгласие
    13.1  Теорема на Гливенко-Кантели
    13.2  Критерий на Колмогоров - Смирнов
    13.3  c2-критерий
14  Оценка на плътности
    14.1  Криви на Пирсън
    14.2  Изглаждане на хистограми
    14.3  Ядра на Розенблат - Парзен
А  Таблици
Означения
Списък на Фигурите
Списък на таблиците


Увод



Названието Статистика цели да обхване, както стандартно преподаваните в ФМИ методи на математическата статистика, така и да даде някаква представа на студентите на популярните статистически процедури и техните изчислителни варианти.

Цел на тези записки е да се даде едно допълнително пособие на студентите по математика и информатика, което да ги снабди със сведенията, отсъствуващи или трудно откриваеми в стандартните български учебници.

Първата лекция, която има обзорен характер за методите на статистиката, би могла чудесно да бъде допълнена с достъпното и леко за четене ръководство [Проданова (1998)] по количествени методи.

Тези части, които са отразени в учебника [Янев, Димитров (1990)] са дадени в максимално съкратен вид. В частност това е теорията на точковото оценяване. Полезен и достатъчно пълен набор от задачи по тези лекции има в [Янев, Танушев (1989)].

Книгата [Уилкс (1967)] ще си позволим да препоръчаме като най - представителен справочник по математическа статистика. Широк спектър от статистически методи е представен в [Дрейпер, Смит (1973)]. Материалът по дискриминантен и дисперсионен анализи е почти преписан от книжката [Въндев, Матеев (1988)].

Основният материал е използуван във Факултета по Математика и Информатика при четене на курсове и за специалностите Информатика и Приложна математика.

Това е текущ вариант на записките. Той все още съдържа много непълноти и постоянно се променя.

Авторът е много благодарен на колегите си от катедра Вероятности и Статистика, които си направиха труда да прочетат внимателно първия вариант на записките и да отбележат многобройните грешки.




A, B,...,Z-множества,събития.
(елементи на A) или матрици.
P (.),P q(.)-Вероятност определена на A
x,h,...,z- случайни величини (сл.в.)
A ЗB-сечение на множествата A и B;
сбъдват се и двете събития.
A ИB-обединение на множествата A и B;
сбъдва се поне едното събитие.
A+B-обединение на несъвместими събития;
сума на матрици.
AB-сечение на множествата A и B;
призведение на матрици.
A ^B, x^h -независими събития и сл.в.
E , D -Математическо очакване (м.о.) и дисперсия.
R - реалната числова права.
R+- неотрицателните реални числа.
Rn- n-мерно евклидово пространство.
x = (x1 , ... , xn)ў- n-мерен вектор (точка в) Rn.
||x|| - норма на x О Rn.
xўy - скаларно произведение на вектори.
[`(x)]-(1/n)еi = 1n xi
s2(x)-(1/(n-1))еi = 1n (xi-[`(x)])2
п.с. -почти сигурно, с вероятност 1
f(x,q)-функция на правдоподобие,
плътност на наблюдавана сл.в.
LL(x,q)-logf(x,q) .


Литература

[Янев, Димитров (1990)]
Б.Димитров, Н.Янев, Теория на вероятностите и математическа статистика, С.1990.

[Янев, Танушев (1989)]
Н.Янев, М.Танушев Ръководство за упражнения по математическа статистика, С., Софийски Университет ''Кл.Охридски'', 1989.

[Уилкс (1967)]
Уилкс С., Математическая статистика, М., Наука, 1967.

[Поллард (1967)]
Дж. Поллард, Справочник по вычислительным методам статистики, М., Финансы и статистика, 1982.

[Въндев, Матеев (1988)]
Въндев Д., Матеев П., Статистика с Правец, Наука и изкуство, С., 1988.

[Проданова (1998)]
К. Проданова Въведение в статистическите методи, Част Първа - Количествени методи, Сиела, София, 1998.

[Себер (1976)]
Себер Дж., Линейный регресионный анализ, Мир, М., 1976.

[Dempster (1969)]
Dempster A.P.(1969) Elements of Continuous Multivariate Analysis, San Francisco, Addison - Wesley.

[BMDP (1981)]
BMDP Statistical Software - 81, University of California, Los Angeles.

[Дрейпер, Смит (1973)]
Дрейпер Н., Смит Г., Прикладной регресионный анализ, Статистика, М., 1973.

[Шеффе (1963)]
Г. Шеффе, Дисперсионный анализ. ГИЗ Физ.Мат.Лит., М., 1963.

[Афифи (1982)]
А. Афифи, С. Айзен, Статистический анализ. Подход с использованием ЭВМ., Мир, М., 1982.

[Кокс, Снелл (1984)]
Кокс Д., Снелл Э., Прикладная статистика. Принципы и примеры, М., Мир, 1984, стр. 183 - 185.

[Митропольский, (1964)]
Митропольский Техника статистических вычислений, М., 1964.

[Dunn, Clark(1974)]
Dunn O.J., Clark V.A., Applied Statistics. Analysis of variance and regression. John Wiley & S.Inc., 1974.

[Hartley(1966)]
Hartley H.O. and Pearson E.S., Biometricca Tables for Statisticians. vol.I, 3rd Edition, 1966 vol.II, 1973, Cambridge University Press, Cambridge.


Списък на Фигурите

    1.1  Съдържания на апатит
    1.2  Кумулативно представяне
    1.3  Секторна диаграма
    3.1  Лема на Нейман-Пирсън
    3.2  Едностранен критерий
    3.3  Двустранен критерий
    3.4  Доверителен интервал
    6.1  N(0,I) в R2
    6.2  Линия на ниво
    6.3  c2 разпределение
    7.1  Разпределение на Фишер - Снедекор
    7.2  Разпределение на Стюдент
    9.1  Проста линейна регресия
    10.1  Криволинейни данни
    10.2  САЩ 1900 - 1980
    11.1  Връзки между моделите
    12.1  Класификационни области
    13.1  Извадъчна ф.р. на 30 наблюдения
    13.2  Един интервал
    13.3  Хистограма на 100 нормални наблюдения
    14.1  Изгладена хистограма

Списък на таблиците

    10.1  Матрица X на полиномна регресия
    10.2  Стойности на ортогоналните полиноми
    10.3  Коефициенти на ортогоналните полиноми
    10.4  Оптимална степен
    11.1  Данни за торенето - ANOVA1
    11.2  Данни за торене - ANOVA2
    11.3  ANOVA2 -таблица
    14.1  Криви на Пирсън
    А.1  Хи-квадрат разпределение (квантили)
    А.2  Нормално разпределение
    А.3  Разпределение на Стюдент (квантили)