Xreferat.com » Рефераты по бухгалтерскому учету и аудиту » Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

“Якутский государственный университет им. М.К. Аммосова”

Технический институт (филиал) в г. Нерюнгри

Педагогический факультет

Кафедра Математики и Информатики


КУРСОВАЯ РАБОТА

по дисциплине «Теория вероятностей и математическая статистика»

на тему: «Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса»


Студентка:

Копотева К. Г., гр. ПМ-04

Руководитель:

Преподаватель:

доцент кафедры к.ф.–м.н.

Попова А.М.


Оценка курсовой работы:__________________

Принял:_______________ Дата _____________


Нерюнгри 2007

Содержание


Введение

Теоретическая часть

Однофакторный дисперсионный анализ

Линейный множественный регрессионный анализ

Множественный корреляционный анализ

Аналитическая часть

Сбор и первичная обработка данных

Дисперсионный анализ

Построение уравнения множественной регрессии

Исключение незначимых факторов

Заключение

Список литературы

Приложение

Введение


Анализируя данные, о смертности населения за 2004-2006 год, полученные в Нерюнгринской городской больнице (см. таблицу 1), можно сделать вывод о том, что общий коэффициент смертности, то есть число умерших от всех причин на 1000 человек населения, увеличивается (рис.1).


Показатель смертности на 1000 человек населения

Таблица 1

2004 год 2005 год 2006 год
7.3 7.8 8.1

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Рисунок 1


Несмотря на повышение рождаемости, демографическая ситуация в Нерюнгринском улусе характеризуется уменьшением численности населения. Главной причиной демографического кризиса является преобладание смертности над рождаемостью. Именно поэтому, чтобы снизить показатель смертности необходимо более детально изучить все причины и факторы, приводящие к ее увеличению. Несомненно, в изучении причин, важно исследование значимости отдельных нозологических форм заболеваний. Зная, какие заболевания приводят чаще всего к летальному исходу, можно разработать программу профилактических работ направленную на уменьшение числа данных заболеваний и предотвращения их дальнейшего развития на раннем этапе.

Цель: определение видов заболеваний оказывающих наибольшее влияние на показатели летальности, основываясь на статистике смертности населения Нерюнгринского улуса по классам болезней и возрастам за 2006 год.

Задачи:

сбор статистических данных необходимых для определения закономерности изменения смертности по причинам заболеваний;

проведение однофакторного дисперсионного анализа, с целью определения влияния различных болезней на общее количество смертности населения;

исключение отдельных факторов, оказывающих незначительное влияние;

построение уравнения множественной регрессии, отражающего соотношение между смертностью и различными классами заболеваний.

1. Теоретическая часть


Однофакторный дисперсионный анализ

Дисперсионный анализ (от латинского Dispersio - рассеивание) - статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.

Целью дисперсионного анализа является проверка значимости различия между средними с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.

Пусть генеральные совокупности Х1, Х2,…, Хр распределены нормально и имеют одинаковую, хотя и неизвестную дисперсию. Математические ожидания которых известны и могут быть различны при заданном уровне значимости α. Проверим при заданном уровне значимости нулевую гипотезу Н0: М(Х1) = М(Х2) = … = М(Хр) о равенстве всех математических ожиданий. Это означает, что мы устанавливаем значимо или нет, различаются выборочные средние.

На практике дисперсионный анализ применяют, чтобы установить оказывает ли существенное влияние качественный фактор F, имеющий p уровней: F1, F2, …, Fp , на изучаемую величину.

Основная идея дисперсионного анализа состоит в сравнение «факторной дисперсии», то есть рассеяние, порождаемое изменением уровня фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если их различие значимо, то фактор существенно влияет на Х и при изменении его уровня групповые средние различаются значимо. Если установили, что фактор существенно влияет на Х, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производим попарное сравнение средних. Дисперсионный анализ также применяется для установления однородности нескольких совокупностей (если математические ожидания одинаковы, то совокупности однородны). В более сложных случаях исследуют воздействие нескольких факторов на различные постоянные или различные уровни и выясняют влияние отдельных уровней и их комбинацию (многоуровневый анализ).

Будем считать, что количество наблюдений на каждом уровне фактора одинаково и равно q. Оформим результаты наблюдений в виде таблицы:


Номер

испытания

Уровни фактора Fj

F1 F2 Fp

1

2

q

x11

x21

xq1

x12

x22

xq2

x1p

x2p

xqp

Групповое

среднее

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса


Сумму квадратов отклонения можно определить по формулам:

Общая сумма квадратов отклонений наблюдаемых значений от общего среднего Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (1)

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса характеризует влияние фактора F и случайных причин на Х.

Факторная сумма отклонений групповых средних от общей средней, характеризующая рассеяние между группами [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (2)

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса характеризует воздействие фактора F на величину Х.

Остаточная сумма квадратов отклонений наблюдаемых значений группы от своего группового среднего, характеризующая рассеяние внутри групп [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (3)

Дисперсионный анализ показателей смертностей населения Нерюнгринского улусаДисперсионный анализ показателей смертностей населения Нерюнгринского улуса отображает влияние случайных причин на Х.

Вводя обозначения [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (4)

получим формулы, более удобные для расчетов [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (5)

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса . (6)

Разделив суммы квадратов на соответствующее число степеней свободы, получим общую, факторную и остаточную дисперсии [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса . (7)

Если справедлива гипотеза Н0, то все эти дисперсии являются несмещенными оценками генеральной дисперсии.

Вычисляем Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса и сравниваем с Fкр (критерий Фишера - Снедекора) [1]:

Fкр (α; n-1; nk-(k-1)),

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (8)

где α – уровень значимости; n – количество факторов; k – количество испытаний.

Если Fнабл < Fкр, то гипотеза о равенстве дисперсий будет принята.

Если число испытаний на разных уровнях различно (q1 испытаний на уровне F 1, q 2 – на уровне F 2 , …, qр - на уровне F р ), то [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (9)

где Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса сумма квадратов наблюдавшихся значений признака на уровне Fj,

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса сумма наблюдавшихся значений признака на уровне Fj .

При этом объем выборки, или общее число испытаний, равен Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. Факторная сумма квадратов отклонений вычисляется по формуле [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса . (10)

Остальные вычисления проводятся так же, как в случае одинакового числа испытаний [1]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (11)


1.2. Линейный множественный регрессионный анализ


Регрессионный анализ, по-видимому, наиболее широко используемый метод многомерного статистического анализа. Термин ''множественная регрессия'' объясняется тем, что анализу подвергается зависимость одного признака (результирующего) от набора независимых (факторных) признаков. Разделение признаков на результирующий и факторные осуществляется исследователем на основе содержательных представлений об изучаемом явлении (процессе). Все признаки должны быть количественными (хотя допускается и использование дихотомических признаков, принимающих лишь два значения, например 0 и 1).При поведении экспериментов в множественной ситуации исследователь записывает показания приборов о состоянии функции отклика (y) и всех факторов, от которых она зависит (xi).

При построении регрессионных моделей, прежде всего, возникает вопрос о виде функциональной зависимости, характеризующей взаимосвязи между результирующим признаком и несколькими признаками-факторами. Выбор формы связи должен основываться на качественном, теоретическом и логическом анализе сущности изучаемых явлений. Чаще всего ограничиваются линейной регрессией, т.е. зависимостью вида [2]:

Y=a0+a1x1+a2x2+…+anxn (12)

где Y - результирующий признак; x1, …, xn - факторные признаки; a1,…,an - коэффициенты регрессии; а0 - свободный член уравнения. ai находим методом наименьших квадратов, для этого рассматривается функции [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса (13)

Находим частные производные по неизвестным переменным, приравниваем к нулю и получаем систему уравнений. Решая систему, можем найти наименьшее значение функции.

Так как запись множественной регрессии (линейной) в матричной форме имеет вид [2]:

Y=X*A, (14)

где Y - это вектор-столбец опытных значений изучаемой характеристики; X –матрица всех значений всех рассматриваемых факторов, полученных при проведении измерений или наблюдений; А – вектор-столбец искомых коэффициентов аппроксимирующего полинома (12) [2]:

Y=Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса ; (15)

X=Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса; (16)

Y=Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса; (17)

Тогда функционал F метода наименьших квадратов имеет вид [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса (18)

Для оценки адекватности рассчитанной регрессионной модели вычисляется коэффициент детерминации, он показывает, какая часть дисперсии функции отклика объясняется вариацией линейной комбинации выбранных факторов x1, x2 ,…, xj, xn [2]:

, (19)

где Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса- прогнозные значения

и множественный коэффициент корреляции [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (20)

Значение коэффициента множественной корреляции оценивается с помощью таблицы 2 [1]:


Таблица Чеддока Таблица 2

диапазон измерения характер тесноты

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

слабая

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

умеренная

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

заметная

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

высокая

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса

весьма высокая

1.3. Множественный корреляционный анализ


Расчеты обычно начинают с вычисления парных коэффициентов корреляции, характеризующих тесноту связи между двумя величинами. В множественной ситуации вычисляют два типа парных коэффициентов корреляции:

1. Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - коэффициенты, определяющие тесноту связи между функцией отклика y и одним из факторов Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улусаДисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (21)

2. Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - коэффициенты, показывающие тесноту связи между одним из факторов xi и фактором xm (i, m=Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса) [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса (22)

.

Значение парного коэффициента изменяется, как указывалось выше, изменяется от -1 до +1. Если, например, коэффициент Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - величина отрицательная, то это значит, что xi уменьшается с увеличением y. Если Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса положителен, то xi увеличивается с увеличением y.

Значимость парных коэффициентов корреляции можно проверить двумя способами:

сравнение с табличным значениями Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (23)

2) по t-критерию Стьюдента [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (24)

Где Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - среднеквадратическая погрешность выборочного парного коэффициента корреляции [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (25)

Здесь Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса определяется по таблице с числом степеней свободы Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса.

Доверительный интервал для парных коэффициентов корреляции [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (26)

где Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - парный коэффициент корреляции в генеральной совокупности.

Если один из коэффициентов Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса окажется равным 1, то это означает, что факторы xi и xm функционально (не вероятностно) связаны между собой и тогда целесообразно один из них исключить из рассмотрения, причем оставляют тот фактор, у которого коэффициент Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса больше.

После вычисления всех парных коэффициентов корреляции и исключения из рассмотрения того или иного фактора можно построить матрицу коэффициентов корреляции вида [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса. (27)

Используя матрицу (23) можно вычислить частные коэффициенты, которые показывают степень влияния одного из факторов xi на функцию отклика y при условии, что все остальные факторы закреплены на постоянном уровне. Формула для вычисления частных коэффициентов корреляции такова [2]:

Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, (28)

где Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса - определитель матрицы, образованной из матрицы (27) вычеркиванием 1-й строки, i-го столбца. Определители Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса, Дисперсионный анализ показателей смертностей населения Нерюнгринского улуса вычисляются аналогично. Как и парные коэффициенты, частные коэффициенты корреляции изменяются от -1 до +1.

2. Аналитическая часть


2.1. Сбор и первичная обработка данных


В ходе сбора материалов исследования, определенных выбранной темой, были получены статистические данные по динамике смертности всего населения Нерюнгринского улуса по классам болезней и возрастам. Классы заболеваний, в исходных данных имеют следующую классификацию:

I. Некоторые инфекционные и паразитарные заболевания;

II. Новообразования;

III. Болезни крови, кроветворных органов и отдельные нарушения, вовлекшие иммунный механизм;

IV. Болезни эндокринной системы, расстройства питания и нарушения обмена веществ;

V. Психические расстройства и расстройства поведения;

VI. Болезни нервной системы;

VII. Болезни глаза и его придаточного аппарата;

VIII. Болезни уха и сосцевидного отростка;

IX. Болезни системы кровообращения;

X. Болезни органов дыхания;

XI. Болезни органов пищеварения;

XII. Болезни кожи и подкожной клетчатки;

XIII. Болезни костно–мышечной системы и соединительной ткани;

XIV. Болезни мочеполовой системы;

XV. Беременность, роды и послеродовый период;

XVI. Отдельные состояния, возникающие в перинатальном периоде;

XVII. Врожденные аномалии (пороки развития), деформации и хромосомные нарушения;

XVIII. Симптомы, признаки и отклонения от нормы, выявленные при клинических и лабораторных исследованиях, не классифицированные в других рубриках;

XIX. Травмы, отравления и некоторые другие последствия воздействия внешних причин;

XX. Внешние причины заболеваемости и смертности.

После обработки этих данных была получена таблица 1 [см. Приложение], в которой представлено количественное изменение смертности по причинам различных заболеваний. В эту таблицу вошли следующие классы болезней: некоторые инфекционные и паразитарные заболевания, новообразования, болезни эндокринной системы, расстройства питания и нарушения обмена веществ, психические расстройства и расстройства поведения, болезни нервной системы, болезни системы кровообращения, болезни органов дыхания, болезни органов пищеварения, болезни костно–мышечной системы и соединительной ткани, болезни мочеполовой системы, беременность, роды и послеродовый период, врожденные аномалии (пороки развития), деформации и хромосомные нарушения, симптомы, признаки и отклонения от нормы, выявленные при клинических и лабораторных исследованиях, не классифицированные в других рубриках, травмы, отравления и некоторые другие последствия воздействия внешних причин, внешние причины заболеваемости и смертности.

Таким образом, функцией отклика является смертность населения в конкретной возрастной группе, а факторами, влияющими на ее изменение, являются

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Похожие рефераты: