Xreferat.com » Рефераты по науке и технике » Лекции по статистике

Лекции по статистике

имеет весь суммарный доход. В промежуточных случаях между этими экстремальными графиками кривая Лоренца описывает увеличение концентрации дохода в руках небольшой части семей при приближении ее графика к кривой ОАВ, при уменьшении концентрации ее график располагается ближе к прямой ОВ. Концентрация определяется площадью области ОСВ, чем больше величина площади, тем сильнее концентрация. Площадь S можно найти по формуле средних прямоугольников. В качестве меры концентрации используется коэффициент Джини: Лекции по статистике

пример.

4.ДИАГРАММЫ.

Диаграмма ( от греческого diagramma - изображение, чертеж, рисунок) - это графическое изображение, наглядно показывающее соотношение между сравниваемыми величинами. Диаграммы бывают различных видов: полосовые (ленточные), столбиковые, квадратные, круговые, секторные, фигурные, радиальные, знак Варзара.

Полосовые - особенно наглядны при сравнении величин, связанных между собой в единое целое. Ширина полос должна быть одинаковой. По длине полосы разбиваются на части, пропорциональные изображаемым величинам.

пример 1.

Данные по классификации безработных в США (средние по месяцам)

Год

ищут работу

частично занятые

нет работы

1989

6.5

4.9

0.9

1990

6.9

5.1

0.8

1991

8.4

6.0

1.1

Основным видом столбиковых диаграмм являются гистограммы.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основанием которых служат частотные интервалы длины h, а высоты равны отношению Mi/h - плотность частоты. Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними на расстоянии Mi/h проводят отрезки параллельные основанию. Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основанием которых случат частичные интервалы длиной h, а высоты равны Wi/h.

Гистограмма относительных частот - аналог плотности распределения непрерывной случайной величины. Иногда высоты прямоугольников в гистограмме не делят на h, но указывают над столбиками значение высоты и над осью ординат пишут, что ее значение надо делить на h. Такую гистограмму называют масштабированной.

пример.

при построении квадратных и круговых диаграмм площади квадратов или кругов выражают изображаемые величины.

пример. Сравнение грузооборота. В СНГ в 1990 г. грузооборот железнодорожного транспорта составил 3505,2 тыс. т, морского - 853.9, автомобильного - 458.9. (Вычислить корни квадратные - сторона квадрата)

Круговые секторные диаграммы применяют для графического изображения составных частей целого. Для из построения необходимо изображаемые данные выразить в градусах, т.к. 1% составляет 3,6 градусов, то соответствующие показатели для определения центральных улов надо умножить на 3.6. Чтобы легче различать сектора используют различную раскраску или штриховку. радиальные - они строятся в полярной системе координат и используются для изображения признаков, периодически изменяющихся во времени (в большинстве своем сезонных колебаний). Вычисляется среднее арифметическое, затем строится окружность радиуса равного среднему арифметическому. Данная окружность делится на нужное число секторов (обычно 12) и на каждом радиальном направлении откладываются точки в соответствии со значениями Xi. фигурные диаграммы строятся 2 основными способами: данные изображаются либо фигурами различных размеров, либо разной численностью фигур одинакового размера. Второй способ чаще используется, каждая фигура содержит определенное число единиц признака и сравнение осуществляется по числу фигурок. При этом допускается дробление знака до половины. Stem & leaf- данные можно представить в виде десятков и единиц, где десятки - это стебли, единицы - лепестки. Диаграмма "знак Варзара" названа в честь русского статистика. С помощью данной диаграммы можно изображать многомерные признаки на плоскости посредством прямоугольников с разным соотношением между основанием и высотой. Одна из компонент признака изображается основанием прямоугольника, вторая его высотой, третья - равная произведению двух других размером получившейся площади.

примеры.

Тема 4. Числовые характеристики одномерных признаков.

С целью обеспечения обработки частотных распределений и свертки информации, заключенной в статистических данных, вариационные ряды описывают с помощью определенных числовых характеристик. Такими характеристиками для одномерных статистических рядов являются следующие:

характеристики положения характеристики рассеяния характеристики формы; 5. СРЕДНИЕ ВЕЛИЧИНЫ. СТЕПЕННЫЕ СРЕДНИЕ.

Схематично средние величины можно представить следующим образом:

Лекции по статистике

Степенная средняя Лекции по статистике

Эта формула задает не взвешенную или простую среднюю степенную. Она применяется для не сгруппированных данных. Для сгруппированных данных применяется следующая формула

Лекции по статистике

Рассмотрим различные значения q.

q =-1 получаем среднее гармоническое

q =0 среднее геометрическое

q = 1 среднее арифметическое

q = 2 среднее квадратичное

Справедливо следующее неравенство для средних величин

Лекции по статистике

Рассмотрим среднее арифметическое:

Лекции по статистике

Отметим наиболее важные свойства среднего арифметического:

если из всех значений признака вычесть некоторую константу С, Лекции по статистике

если все значения признака умножить на с, то и среднее умножается на С. пусть исходные данные представлены следующим образом Лекции по статистике , т.е. данные разбиты на q групп . Взвешенное среднее арифметическое из групповых или частотных средних будет равняться общей средней.

Лекции по статистике

сумма взвешенных отклонений значений признака от общей средней арифметической равна 0: Лекции по статистике сумма квадратов взвешенных отклонений значений признака от Лекции по статистике меньше аналогичной суммы от любой другой меры положения

Лекции по статистикеЛекции по статистике, разность между этими суммами равна Лекции по статистике.

Рассмотрим среднее гармоническое q=-1.

Лекции по статистике

Свойства среднего гармонического:

взвешенная гармоническая из групповых гармонических равна общей гармонической Лекции по статистике

Применение того или иного вида весов зависит от представления значений признака.

Примеры.

Таким образом, если между показателями существует обратная зависимость как например между числом изготовленных деталей и затратами времени на одно изделие, то надо использовать среднее гармоническое. А если между показателями существует прямая зависимость, например между индивидуальными зарплатами и фондом зарплат, то применяется среднее арифметическое.

Рассмотрим геометрическое среднее:

Лекции по статистике

Лекции по статистике

Вычислим предел:

Лекции по статистике

Лекции по статистике

6. Свойства среднего геометрического: общее среднее геометрическое может быть найдено по формуле Лекции по статистике. если кроме признака х рассмотреть признак у со значениями у(1), у(2),......,Лекции по статистике, то имеем Лекции по статистике если есть несколько совокупностей Лекции по статистике , то имеем Лекции по статистике

Среднее геометрическое применяется для расчета среднего коэффициента или среднего темпа роста

Лекции по статистике

пример.

Пусть известно, что за 5 лет выпуск промышленной продукции предприятия вырос в 1.5 раза, тогда средний ежегодный коэффициент роста Лекции по статистике, т.е. 108,4 %, а средний ежегодный прирост равен 8,4%.

Среднее квадратическое q=2.

Лекции по статистике

Обычно применяются, если в качестве Лекции по статистике берутся отклонения значений признака от среднеарифметических Лекции по статистике.

Если n<=30, то применяется исправленное среднеквадратичное отклонение Лекции по статистике.

7.Структурные (порядковые) характеристики.

Квантили - порядковые характеристики, то есть значения признака, занимающие определенное место в ранжированной совокупности (упорядоченной).

Медиана.

Медиана - значение изучаемого признака, приходящееся на середину ранжированной совокупности.

Лекции по статистике

При вычислении медианы интервального вариационного ряда, сначала находят медианный интервал Лекции по статистике, где h - длина медианного интервала. Для этого можно использовать кумулятивное распределение частот или относительных частот. Медианному интервалу соответствует тот, в котором содержится накопленная равная 1/2.

Внутри найденного интервала расчет медианы производится по формуле:

Лекции по статистике, где Лекции по статистике - кумулятивная частота интервала, предшествующего медианному, Лекции по статистике - относительная частота медианного инетрвала.

Лекции по статистике

Сумма взвешенных абсолютных отклонений вариант от медианы меньше аналогичной суммы отклонений вариант от любой другой меры положения вариационного ряда.

Это свойство можно использовать при проектировании оптимального (в некотором смысле) расположения остановок общественного транспорта, складских помещений, бензозаправок и т.д.

пример.

Прибыль компаний: Ме=500 +500*(50-44)/(76-44)=593.75 млн. Это означает, что 50% компаний имеет прибыль меньше 593.75 млн.

Оценки студентов: Ме=4

Квартили.

Квартили - порядковые характеристики, отделяющие четверти ранжированных совокупностей.

1 квартиль или нижний отделяет четверть ранжированной совокупности снизу и вычисляется по формуле:

Лекции по статистике (для интервального)

Медиану можно рассматривать как второй квартиль.

Верхний квартиль Лекции по статистике

Мода.

Мода - наиболее часто встречающееся в совокупности значение признака. Для дискретного вариационного ряда мода определяется по частотам вариант и соответствует варианте с максимальной частотой. При определении моды обычно применяют следующие соглашения:

если все значения вариационного ряда имеют одинаковую частоту, то говорят, что этот вариационный ряд не имеет моды. если две соседних варианты имеют одинаковую доминирующую частоту, что мода вычисляется как среднее арифметическое этих вариант. если две не соседних варианты имеют одинаковую доминирующую частоту, то такой вариационный ряд называется бимодальным. если таких вариант более двух, то ряд - полимодальный.

В случае интервального вариационного ряда с равными интервалами модальный интервал определяется по наибольшей частоте, а при неравных интервалах - по наибольшей плотности.

При равных интервалах мода внутри модального интервала может определяться по следующей формуле:

Лекции по статистике

Данная формула получена исходя из допущения, что в модальном и двух соседних интервалах кривая распределения представляет собой параболу второго порядка. Тогда мода находится как вершина параболы. Для графического определения моды используют 3 соседних столбца гистограммы (самый высокий и 2 прилегающих к нему).

При вычислении моды в формуле можно иcпользовать не только относительные, но и другие частоты.

Лекции по статистике

пример.

Прибыль 100 компаний - Мо=0+500*(41-1)/(41-1+41-32)=408.16 млн.

Оказывается, по расположению средней арифметической, моды и медианы можно судить о форме распределения. Если оно симметричное, то все три величины равны.

В практике мода и медиана иногда используются вместо средней арифметической или вместе с ней. Фиксируя средние цены товаров или продуктов на рынке записывают наиболее часто встречающуюся цену на рынке (моду цены).

Робастные характеристики для оценки среднего арифметического.

В ряде случаев в изучаемой совокупности имеется небольшое число элементов с чрезвычайно большим или чрезмерно малым значением исследуемого признака.

В этих случаях в дополнение к среднему арифметическому целесообразно вычислить моду и медиану, которые в отличие от среднего не зависят от крайних, не характерных для совокупности значений признака. Мода и медиана относятся к классу так называемых "робастных характеристик", т.е. не чувствительных к аномальным значениям признака. Рассмотрим робастные характеристики, применяемые для оценки среднего арифметического:

усеченное среднее арифметическое порядка Лекции по статистикеЛекции по статистике

Пусть имеем ряд значений признака, упорядоченный в возрастающем порядке

Лекции по статистике, упорядоченный в возрастающем порядке. Пусть первые x(1),...,x(m) - аномально маленькие, x(n-m+1),...,x(n) - аномально большие.

Лекции по статистике- указывает долю отбрасываемых значений признака.

среднее по Виндору

Отличается от усеченного тем, что аномальные значения признака не отбрасываются, а полагаются крайним значениям, принимаемым на обработку.

x(1)=x(2)...=x(m)=x(m+1)

x(n)=x(n-1)=...=x(n-m+1)=x(n-m)

Лекции по статистике

примеры.

8.Характеристики рассеяния.

Средняя величина признака, а также его мода и медиана в двух совокупностях могут быть одинаковыми. но в одном случае значения признака могут мало отличаться от среднего, а в другом эти значения могут быть велики.

пример.

Пусть имеются данные о стаже работы в 2 бригадах.

стаж

1

2

3

4

5

6

7

8

9

10

средн.

1 бр.

1

2

3

3

4

9

10

12

13

15

7.2

2 бр.

6

6

7

7

7

7

8

8

18

8

7.2

Простейшим из показателей является вариационный размах R=Xmax-Xmin. Размах выборки дает лишь самое общее представление о размерах вариации, так как показывает насколько отчаются друг от друга крайние значения, но не указывают насколько велики отклонения вариант друг от друга внутри этого промежутка. Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины.

Выделяют среднее линейное отклонение Лекции по статистике, либо среднеквадратичное отклонение Лекции по статистике.

Если объем выборки невелик, то в качестве оценки дисперсии рассматривают Лекции по статистикеЛекции
    <!--<div class=

Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.
Подробнее

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
-->

Похожие рефераты: