Xreferat.com » Рефераты по математике » Методы математической статистики

Сколько стоит написать твою работу?

Работа уже оценивается. Ответ придет письмом на почту и смс на телефон.

?Для уточнения нюансов.
Мы не рассылаем рекламу и спам.
Нажимая на кнопку, вы даёте согласие на обработку персональных данных и соглашаетесь с политикой конфиденциальности

Спасибо, вам отправлено письмо. Проверьте почту .

Если в течение 5 минут не придет письмо, возможно, допущена ошибка в адресе.
В таком случае, пожалуйста, повторите заявку.

Спасибо, вам отправлено письмо. Проверьте почту .

Если в течение 5 минут не придет письмо, пожалуйста, повторите заявку.
Хотите промокод на скидку 15%?
Успешно!
Отправить на другой номер
?Сообщите промокод во время разговора с менеджером.
Промокод можно применить один раз при первом заказе.
Тип работы промокода - "дипломная работа".

Методы математической статистики

Размещено на /


Методы математической статистики


1. Введение


Математической статистикой называется наука, занимающаяся разработкой методов получения, описания и обработки опытных данных с целью изучения закономерностей случайных массовых явлений.

В математической статистике можно выделить два направления: описательную статистику и индуктивную статистику (статистический вывод). Описательная статистика занимается накоплением, систематизацией и представлением опытных данных в удобной форме. Индуктивная статистика на основе этих данных позволяет сделать определенные выводы относительно объектов, о которых собраны данные, или оценки их параметров.

Типичными направлениями математической статистики являются:

теория выборок;

теория оценок;

проверка статистических гипотез;

регрессионный анализ;

дисперсионный анализ.

В основе математической статистики лежит ряд исходных понятий без которых невозможно изучение современных методов обработки опытных данных. В ряд первых из них можно поставить понятие генеральной совокупности и выборки.

При массовом промышленном производстве часто нужно без проверки каждого выпускаемого изделия установить, соответствует ли качество продукции стандартам. Так как количество выпускаемой продукции очень велико или проверка продукции связана с приведением ее в негодность, то проверяется небольшое количество изделий. На основе этой проверки нужно дать заключение о всей серии изделий. Конечно нельзя утверждать, что все транзисторы из партии в 1 млн. штук годны или негодны, проверив один из них. С другой стороны, поскольку процесс отбора образцов для испытаний и сами испытания могут оказаться длительными по времени и привести к большим затратам, то объем проверки изделий должен быть таким, чтобы он смог дать достоверное представление о всей партии изделий, будучи минимальных размеров. С этой целью введем ряд понятий.

Вся совокупность изучаемых объектов или экспериментальных данных называется генеральной совокупностью. Будем обозначать через N число объектов или количество данных, составляющих генеральную совокупность. Величину N называют объемом генеральной совокупности. Если N>>1, то есть N очень велико, то обычно считают N = Ґ.

Случайной выборкой или просто выборкой называют часть генеральной совокупности, наугад отобранную из нее. Слово "наугад" означает, что вероятности выбора любого объекта из генеральной совокупности одинакова. Это важное предположение, однако, часто трудно это проверить на практике.

Объемом выборки называют число объектов или количество данных, составляющих выборку, и обозначают n. В дальнейшем будем считать, что элементам выборки можно приписать соответственно числовые значения х1, х2, ... хn. Например, в процессе контроля качества производимых биполярных транзисторов это могут быть измерения их коэффициента усиления по постоянному току.


2. Числовые характеристики выборки


2.1 Выборочное среднее


Для конкретной выборки объема n ее выборочное среднее Методы математической статистики определяется соотношением


Методы математической статистики


где хi – значение элементов выборки. Обычно требуется описать статистические свойства произвольных случайных выборок, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как случайные величины Хi, принимающие значения хi с плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной Методы математической статистики равной


Методы математической статистики


Как и ранее будем обозначать случайные величины прописными буквами, а значения случайных величин – строчными.

Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать mx. Можно ожидать, что если объем выборки значителен, то выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, для нее можно найти математическое ожидание:

Методы математической статистики


Таким образом, математическое ожидание выборочного среднего равно генеральному среднему. В этом случае говорят, что выборочное среднее является несмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N (n << N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = Ґ. Тогда


Методы математической статистики


Случайные величины Хi и Xj (i№j) можно считать независимыми, следовательно,

Методы математической статистики

Подставим полученный результат в формулу для дисперсии:


Методы математической статистики


где s2 – дисперсия генеральной совокупности.

Из этой формулы следует, что с увеличением объема выборки флуктуации среднего выборочного около среднего генерального уменьшаются как s2/n. Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией соответственно равными mx = 10, s2 = 9.

Отсчеты сигнала берутся в равноотстоящие моменты времени t1, t2, ... ,


Методы математической статистикиМетоды математической статистикиМетоды математической статистики X(t)

Методы математической статистикиМетоды математической статистики

Методы математической статистикиМетоды математической статистики X1


Методы математической статистики

t1 t2 . . . tn t


Так как отсчеты являются случайными величинами, то будем их обозначать X(t1), X(t2), . . . , X(tn).

Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку mx = 10, то нужно, чтобы Методы математической статистики С другой стороны Методы математической статистики поэтому Методы математической статистики или Методы математической статистики Отсюда получаем, что n і 900 отсчетов.


Выборочная дисперсия


По выборочным данным важно знать не только выборочное среднее, но и разброс выборочных значений около выборочного среднего. Если выборочное среднее является оценкой генерального среднего, то выборочная дисперсия должна быть оценкой генеральной дисперсии. Выборочная дисперсия Методы математической статистики для выборки, состоящей из случайных величин Методы математической статистики определяется следующим образом


Методы математической статистики


Используя это представление выборочной дисперсии, найдем ее математическое ожидание


Методы математической статистики

Методы математической статистикиМетоды математической статистики

Методы математической статистики


Таким образом мы получили, что Методы математической статистики Это значит, что выборочная дисперсия является смещенной оценкой генеральной дисперсии. Чтобы получить несмещенную оценку, нужно величину Методы математической статистики умножить на Методы математической статистики тогда выборочная дисперсия имеет вид


Методы математической статистики


Итак мы получили следующий результат. Если в результате n независимых измерений случайной величины Х с неизвестным математическим ожиданием и дисперсией нам нужно по полученным данным определить эти параметры, то следует пользоваться следующими приближенными оценками


Методы математической статистики


В случае, если известно математическое ожидание генеральной совокупности mx, то выборочную дисперсию следует вычислять по формуле


Методы математической статистики


которая также является несмещенной оценкой.


Статистический ряд. Статистическая функция распределения


Пусть имеются результаты измерения случайной величины Х с неизвестным законом распределения, которые представлены в виде таблицы:


i 1 2 . . . n
xi x1 x2 . . . xn

Такую таблицу называют статистическим рядом. Статистический ряд представляет собой первичную форму записи статистического материала и он может быть обработан различными способами. Одним из таких способов обработки является построение статистической функции распределения случайной величины Х.

Статистической (эмпирической) функцией распределения F*(x) называется закон изменения частоты события X < x в данном статистическом материале, то есть


Методы математической статистики


Для того, чтобы найти значение статистической функции распределения при данном х, надо подсчитать число опытов, в которых случайная величина Х приняла значения меньше, чем х, и разделить на общее число произведенных опытов. Полученная таким образом статистическая функция распределения является очень грубым приближением функции распределения F(x) случайной величины Х и в таком виде не используется на практике. Она носит в каком-то смысле качественный характер, из которого можно выдвинуть гипотезу о законе распределения случайной величины Х. При увеличении числа опытов (n ®Ґ) F*(x) по вероятности сходится к F(x). Однако, с увеличением n построение F*(x) становится очень трудоемкой операцией. Поэтому на практике часто бывает удобно пользоваться статистической характеристикой, которая приближается к плотности распределения.


Статистическая совокупность. Гистограмма


При большом числе наблюдений представление данных в виде статистического ряда бывает затруднительным, а при решении ряда задач и нецелесообразным. В таких случаях производится подсчет результатов наблюдения по группам и составляют таблицу, в которой указываются группы и частоты полученные в результате наблюдения в каждой группе. Совокупность групп, на которые разбиваются результаты наблюдений и частоты, полученные в каждой группе, составляют статистическую совокупность, которая представлена ниже.


Группа DХ DХ1 DХ2 . . . DХn
Частота относительная w1 w2 . . . wn

Методы математической статистики


Графическое представление статистической совокупности носит название гистограммы. Гистограмма строится следующим образом. По оси абсцисс откладываются интервалы, соответствующие группам совокупности, и на каждой из них строится прямоугольник, площадь которого равна частоте данной группы. Из построения следует, что площадь суммы всех прямоугольников равна единице. Очевидно, что если плавно соединить точки гистограммы, то эта кривая будет первым приближением к плотности распределения случайной величине Х.

Если число опытов увеличивать и выбирать более мелкие группы (на рисунке маленькие интервалы) в статистической совокупности, то полученная гистограмма все более будет приближаться к плотности распределения случайной величины Х. Статистическую совокупность можно использовать и для построения приближенной функции распределения F*(x), выбрав в качестве значений случайной величины граничные значения групп.

Методы математической статистики Pi*

Методы математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистикиМетоды математической статистики


X

DX1 DX2 . . . DXn


5. Метод наибольшего правдоподобия для нахождения оценок параметров плотности распределения


Метод наибольшего правдоподобия основывается на представлении выборки объема n как n-мерной случайной величине (Х1, Х2, ..., Хn), где Методы математической статистики рассматриваются как независимые случайные величины с одинаковой плотностью распределения f(x). Плотность распределения такой n-мерной случайной величины называется функцией правдоподобия L(x1, x2, ..., xn), которая в силу независимости случайных величин Методы математической статистики равна произведению плотностей распределения случайных величин Х1, Х2, ..., Хn:

L(x1, x2, ..., xn) = f(x1) f(x2)... f(xn).

Отсюда следует, что всякую функцию у=у(x1, x2, ..., xn) выборочных значений x1, x2, ..., xn, называемую статистикой, можно представить как случайную величину, распределение которой однозначно определяется функцией правдоподобия.

Рассмотрим метод отыскания оценок параметров по опытным данным, который использует функцию правдоподобия.

Пусть f(x;а) – плотность распределения случайной величины Х (генеральной совокупности), зависящей от параметра а. Функция правдоподобия также будет зависеть от параметра а и иметь вид

Методы математической статистики

Сущность метода наибольшего правдоподобия заключается в том, чтобы найти такое значение параметра а, при котором функция правдоподобия L(x1, x2, ..., xn, а) была бы максимальной. Для этого необходимо решить уравнение


Методы математической статистики

и найти то значение а, при котором функция L(x1, x2, ..., xn, а) достигает максимума. С целью упрощения вычисления обычно максимизируют натуральный логарифм функции правдоподобия, пользуясь тем, что


Методы математической статистики


Если неизвестными являются несколько параметров а1, а2, ... , аm, то функция правдоподобия зависит от m переменных L = L(x1, x2, ..., xn; а1, а2, ... , аm) и решаются m уравнений


Методы математической статистики


Пример. Пусть на вход приемного устройства поступает сумма двух сигналов: Y(t) = X + Z(t), где Х – неизвестный не зависящий от времени сигнал, а Z(t) – случайная помеха. В моменты времени t1, t2, ... , tn производятся измерения величины Y(t). На основании опытных данных (выборки) y1 = y(t1), y2 = y(t2), ... , yn=y(tn) нужно найти приближенное значение сигнала Х.

Решение. Пусть Z(t1), Z(t2), ... , Z(tn) – независимые случайные величины распределены по нормальному закону с математическим ожиданием mZ = 0 и дисперсией D(Z) = s2. Тогда случайные величины Методы математической статистики также независимы, нормально распределены с неизвестным математическим ожиданием а и с той же дисперсией s2. Плотность распределения случайных величин Y(t1), Y(t2), ... , Y(tn) имеет, таким образом, вид


Методы математической статистики

Запишем функцию правдоподобия для n-мерной случайной величины (Y1, Y2, ... , Yn):

Методы математической статистики


Tак как

Методы математической статистики

то из уравнения


Методы математической статистики


Имеем Методы математической статистики


Значит


Методы математической статистики


Нетрудно показать, что функция правдоподобия L = L(y1, y2, ..., yn; а) при этом а достигает своего максимума. Таким образом мы показали, что оценка математического ожидания неизвестного сигнала Х по методу наибольшего правдоподобия в предположении нормального распределения аддитивной помехи является средним арифметическим измерений y1, y2, ..., yn:

Методы математической статистики

Метод наибольшего правдоподобия обладает важным свойством: он всегда приводит к состоятельным, хотя иногда и к смещенным, и эффективным оценкам.

На практике использование метода наибольшего правдоподобия часто приводит к необходимости решать достаточно сложные системы уравнений.


Метод наименьших квадратов

математическая статистика метод распределение выборка

Применим метод наибольшего правдоподобия для обработки экспериментальных данных. Предположим, что между физической величиной t (например, временем) и измеряемой y (сигналом) существует функциональная зависимость: y = j (t).

Вид этой зависимости необходимо определить из опыта. Положим, что в результате опыта мы получили ряд экспериментальных точек и построили график зависимости у от t. Экспериментальные точки всегда имеют ошибки измерения. Возникает вопрос, как по экспериментальным данным наилучшим образом воспроизвести зависимость у от t? Если провести интерполяционную кривую, то есть кривую, точно проходящую через экспериментальные точки, то это в силу ошибок измерения будет не самым лучшим решением. В случае, когда известна тенденция этой зависимости, другими словами вид кривой, то задача упрощается. Тогда возникает задача

Напишем реферат в Подарок!
Оставьте заявку, и в течение 5 минут на почту вам станут поступать предложения!
Мы дарим вам 100 рублей на первый заказ!