Статистика

/>

Доля стандартной обуви /

Комбинированная выборка – это сочетание группового и индивидуального отбора единиц наблюдения. Чаще всего сочетается серийный и собственно случайный отбор.

Ошибка выборки комбинированного отбора складывается из ошибок выборки ожидаемых по каждому способу отбора, входящему в комбинацию. Обычно применяют бесповторную комбинированную выборку, хотя теоретически возможен повторный комбинированный отбор. Комбинированная выборка по своей природе является многоступенчатой. Несмотря на простоту методологии многоступенчатого отбора, расчет его ошибки достаточно сложен и определяется по формуле:

для равночисленного отбора на каждой ступени.

- средние ошибки выборок на каждой из ступеней отбора;

- численность ступеней отбора.



8. Способ моментных наблюдений.

Метод моментных (мгновенных) наблюдений разработан в 1938 году английским статистиком Типлетом для выборочного изучения производственного процесса. Метод применяется для групповых фотографий затрат рабочего времени и времени работы оборудования, когда наблюдатель периодически обходя рабочие места по заранее установленному маршруту регистрирует в специальном бланке, чем занят рабочий в конкретный момент времени, работает он в данный момент или отдыхает.

Метод моментных наблюдений – это выборка во времени, где генеральной совокупностью является фонд рабочего времени объекта наблюдения, то есть коллектива работников или группы единиц оборудования. Выборочная совокупность складывается из периодов времени регистрации состояния объекта исследования.

Групповые фотографии обеспечивают многократное снижение затрат по сравнению с индивидуальными фотографиями, так как не требуют постоянного присутствия наблюдателя на каждом рабочем месте в течении всего рабочего дня. Метод эффективен для оценки труда коллектива работников, выполняющих однородные операции.

Первым этапом организации мгновенных наблюдений является определение численности выборки, то есть необходимого числа момента регистрации.

- доверительный коэффициент;

- выборочная доля единиц, обладающих изучаемым признаком;

- предельная ошибка выборки, выраженная в процентах.


Пример: для изучения использования рабочего времени 20 официантов методом мгновенных наблюдений проводится групповая фотография рабочего времени. По норме время работы должно составлять 8/10 установленной продолжительности рабочего дня (). Допустимый предел отклонений . Вероятностная надежность 0,954. Надо определить доверительный интервал доли времени работы в установленной продолжительности рабочего дня.

№ рабочего места Порядковые номера обходов Итоги регистрации
1 2 3 4 13 14 Работал Не работал
1 Н Н Н



10 4
2 Н Н Р



12 2
3 Р Р Р



11 3
4











19 Н Н Р





20 Н Н






Всего

Работал

2 4 9



210
Не работал 18 16 11




70

Доля рабочего времени по данным обследования .

Средняя ошибка выборки .

Предельная ошибка с вероятностью 0,954 .

Доля времени работы по данным исследований


Статистическое исследование взаимосвязей.

  1. Виды взаимосвязей и цели их статистического изучения.

  2. Классификация методов исследования взаимосвязей.

  3. Парная регрессия.

  4. Измерения тесноты взаимосвязи.

  5. Множественная корреляция и регрессия.


  1. Виды взаимосвязей и цели их статистического изучения.

Изучение причинно-следственных зависимостей между фактами – важнейшая задача анализа социально-экономических явлений. Это необходимо для принятия обоснованных управленческих решений. Изучение зависимостей – это сложнейшая задача, поскольку социально-экономические явления сами по себе сложны и многообразны. Кроме того, полученные выводы носят вероятностный характер, так как они делаются на основе данных, представляющих собой выборку во времени или пространстве.

Статистические методы изучения зависимости построены с учетом особенностей изучаемых закономерностей. Статистика изучает преимущественно стохастические связи, когда одному значению признака-фактора соответствует группа значений результативного признака. Если с изменением значений признака-фактора изменяются среднегрупповые значения результативного признака, то такие связи называют корреляционными. Не всякая стохастическая зависимость является корреляционной. Если каждому значению факторного признака соответствует строго определенное значение результативного признака, то такая зависимость функциональная. Ее называют еще полной корреляцией. Неоднозначные корреляционные зависимости называют неполной корреляцией.

По механизму взаимодействия различают:

    • Непосредственные связи – когда причина прямо влияет на следствие;

    • Косвенные связи – когда между причиной и следствием существуют ряд промежуточных признаков (например, влияние возраста на заработок).

По направлениям различают:

  • Прямые связи – когда значение факторного и результативного признаков изменяются в одном направлении;

  • Обратные связи – когда значения факторного и результативного признаков изменяются в разных направлениях.

Бывают:

  • Прямолинейные (линейные) связи – выражены прямой линией;

  • Криволинейные связи – выражены параболой, гиперболой.

По числу взаимосвязанных признаков различают:

  • Парные связи – когда анализируется взаимосвязь двух признаков (факторного и результативного);

  • Множественные связи – характеризуют влияние нескольких признаков на один результативный.

По силе взаимодействия различают:

  • Слабые (заметные) связи;

  • Сильные (тесные) связи.

Задача статистики определить наличие, направление, форму и тесноту взаимосвязи.


  1. Классификация методов исследования взаимосвязей.

Для изучения зависимости применяются различные статистические методы. Поскольку зависимости в статистике проявляются через вариацию признаков, то и методы в основном измеряют и сопоставляют вариацию факторного и результативного признаков.

Для изучения функциональных зависимостей в статистке применяют балансовый и индексный методы. Сущность балансового метода выражается формулой:

Данная форма может характеризовать движение материальных, денежных средств, ценностей.

Индексный метод применяется для анализа динамики и сравнения обобщающих показателей, а так же факторов, влияющих на изменение уровней этих показателей.

Изучение неполной корреляции осуществляется двумя группами методов, которые можно определить, как нематематические и математические. Нематематические методы:

  • Метод параллельных рядов;

  • Метод аналитических группировок;

  • Графический метод.

Метод параллельных рядов применяется для определения наличия и направления взаимосвязи при немногочисленных совокупностях (15-20 единиц). При этом методе значение факторного признака располагается в порядке возрастания или убывания и параллельно с ними отражаются соответствующие значения результативного признака. Сопоставляя ряды значений, устанавливается зависимость.

Метод аналитической группировки применяется в случаях, когда совокупность достаточно велика и параллельные ряды не позволяют обнаружить зависимость. Этот метод – это разбиение исходных данных на группы в соответствии со значением признака фактора и расчет для каждой группы соответствующего среднегруппового значения результативного признака с тем, чтобы обнаружить взаимосвязь. Аналитические группировки обычно используются для однородных совокупностей, поэтому в них применяются чаще всего равные интервалы.


Пример: зависимость между суммой товарооборота магазина и уровнем издержек обращения.


Группы магазинов с товарооборотом, тыс. руб. Количество магазинов Уровень издержек обращения в процентах к итогу
До 20 (10) 3 35,2
20,1 – 40 (30) 5 32,4
40,1 – 60 (50) 8 25,2
Свыше 60 (70) 2 21,3

Группировка показывает, что с ростом товарооборота падает значение результативного признака. Налицо обратная зависимость. Если изобразить результаты группировки на графике, получим эмпирическую линию регрессии. Интервалы значений факторного признака заменяются средними групповыми показателями.

Эмпирическая линия регрессии показывает примерную форму и направление взаимосвязи.

При построении аналитической группировки надежность ее результатов зависит от того, какое число групп мы можем выделить, не натолкнувшись ни на одно исключение в предполагаемом характере взаимосвязи.

Помимо эмпирической линии регрессии, непосредственно определяющей форму и направление взаимосвязей, существует корреляционное поле, на котором отражаются параметрические данные. По корреляционному полю так же можно судить о характере взаимосвязи. Если точки сконцентрированы около диагонали идущей слева направо, снизу вверх – то связь прямая. Если около другой диагонали – обратная. Если точки рассеяны по всему полю графика – связь отсутствует.

При построении аналитической группировки важно правильно определить величину интервала. Если в результате первичной группировки связь не проявляется отчетливо, можно укрупнить интервал. Однако, укрупняя интервалы, можно иногда обнаружить связь даже там, где ее нет. Поэтому при построении аналитической группировки руководствуются правилом: чем больше групп мы можем выделить, не натолкнувшись ни на одно исключение, тем надежнее наша гипотеза о наличии и форме связи.

Нематематические методы дают приближенную оценку о наличии, формы и направлении связи. Более глубокий анализ осуществляется с помощью математических методов, которые развились на базе методов, применяемых статистиками - нематематиками:

  • Регрессионный анализ, позволяющий выразить с помощью уравнения форму взаимосвязи.

  • Корреляционный анализ используется для определения тесноты или силы взаимосвязи признаков. Корреляционные методы делят:

    • Параметрические методы, которые дают оценку тесноты связи непосредственно на базе значений факторного и результативного признаков;

    • Непараметрические методы – дают оценку на основе условных оценок признаков.

Оценка тесноты криволинейных зависимостей дается после расчета параметра уравнения регрессии. Поэтому такой метод называется корреляционно-регрессивным.

Если анализируется зависимость одного факторного и результативного признаков, то в этом случае имеем дело с парной корреляцией и регрессией. Если анализируются несколько факторных и результативных признаков – это множественная корреляция и регрессия.


  1. Парная регрессия.

Регрессия – это линия, характеризующая наиболее общую тенденцию во взаимосвязи факторного и результативного признаков.

Предполагается, что аналитическое уравнение выражает подлинную форму зависимости, а все отклонения от этой функции обусловлены действием различных случайных причин. Так как изучаются корреляционные связи, изменению факторного признака соответствует изменение среднего уровня результативного признака. При построении аналитических группировок мы рассматривали эмпирическую линию регрессии. Однако, эта линия не пригодна для экономического моделирования и ее форма зависит от произвола исследователя. Теоретически линия регрессии в меньшей степени зависит от субъективизма исследователя, однако, здесь так же может быть произвол при выборе формы или функции взаимосвязи. Считается, что выбор функции должен опираться на глубокое знание специфики предмета исследования.

На практике чаще всего применяются следующие формы регрессионных моделей:

  • Линейная ;

  • Полулогарифметическая кривая ;

  • Гипербола ;

  • Парабола второго порядка ;

  • Показательная функция ;

  • Степенная функция .

Помимо содержательного подхода существует формальная оценка адекватности подобранной регрессионной модели. Лучшей из них считается та, которая наименее удалена от исходных данных.

Данное свойство средней, гласящее, что сумма квадратов отклонений всех вариантов ряда от средней арифметической меньше суммы квадратов их отклонений от любого другого числа, положено в основу метода наименьших квадратов, позволяющего рассчитать параметры избранного уравнения регрессии таким образом, чтобы линия регрессии была в среднем наименее удалена от эмпирических данных.

Пример: данная система двух уравнений с двумя неизвестными а0 и а1 позволяет определить точное значение коэффициентов линейной регрессии.

Анализ формы и параметров взаимосвязи между ценой килограмма репчатого лука и объемом его продаж.

Цена 1 кг

лука, руб.

Объем продаж,

кг

Товарооборот,

руб.

3 175 525 9 -107,73 205,68 -30,68 941,26 30625
3,5 200 700 12,25 -125,69 187,73 12,28 150,68 40000
4 180 720 16 -143,64 169,77 10,23 104,65 32400
4,5 150 675 20,25 -161,60 151,82 -1,815 3,29 22500
5 160 800 25 -179,55 133,86 26,14 683,30 25600
5,5 120 660 30,25 -197,51 115,91 4,09 16,77 14400
6 85 510 36 -215,46 97,95 -12,95 167,70 7225
6,5 90 585 42,25 -233,42 80,00 10,00 100,10 8100
7 50 350 49 -251,37 62,04 -12,04 144,96 2500
7,5 40 300 56,25 -269,33 44,09 -4,09 16,69 1600
8 25 200 64 -287,28 26,13 -1,13 1,28 625
60,5 1275 6025 360,25 -2172,56 1274,96 0,045 2330,68 185575

Предположим, что связь между ценой и объемом реализации лука линейная. Тогда для расчета параметров а0 и а1 необходимо решить систему уравнений

,

подставляя расчетные значения в систему нормальных уравнений и решая ее. Одним из методов получим коэффициенты уравнения линейной регрессии.

- уравнение регрессии или функция, характеризующая теоретическую зависимость объемов продаж лука от цены на него. Знак минус указывает на обратную зависимость.

Параметр а0 характеризует условное значение результативного признака при нулевом значении факторного признака (условный объем продаж лука при нулевой цене на него).

Параметры уравнения регрессии оцениваются на вероятностную надежность. Для этого величина каждого из параметров сравнивается с соответствующей средней ошибкой выборки, то есть , где - расчетное значение критерия Стьюдента, а - остаточное среднеквадратическое отклонение, характеризующее вариацию эмпирических значений результативного признака относительно соответствующих им теоретических значений (вариацию около линии регрессии).

Расчетное значение t критерия сравнивается с табличным значением для степеней свободы и заданной вероятности. Если p=0,95 то табличное значение равно t=2,262, то есть , следовательно, параметр а0 с вероятностью 0,95 надежен. Параметр а1 оценивается по формуле:

, где - это показатель вариации факторного признака.

В нашем примере удобнее всего рассчитывать по формуле:

Параметры уравнения регрессии надежны, следовательно, с вероятностью 0,95 можно утверждать, что полученное уравнение регрессии объективно отражает форму зависимости между ценой и объемом продаж лука.

По данным регрессионного анализа можно рассчитать коэффициент эластичности, характеризующий пропорцию взаимосвязи между вариацией факторного и результативного признаков.

Коэффициент эластичности показывает, что с ростом цены на 1%, объем реализации лука снижается на 1,7%.


  1. Измерения тесноты связи.

Методы измерения тесноты взаимосвязи условно делятся на непараметрические и параметрические.

Непараметрические методы применяются для измерения тесноты связи качественных и альтернативных признаков, а так же количественных признаков, распределение которых отличается от нормального распределения.

Для измерения связи альтернативных признаков применяются коэффициент ассоциации Дэвида Юла и коэффициент контингенции Карла Пирсона. Для расчета этих показателей применяется следующая матрица взаимного распределения частот.

a, b, c, d – частоты взаимного распределения признаков.


1 признак


2 признак

ДА НЕТ
ДА a b
НЕТ c d

При прямой связи частоты сконцентрированы по диагонали a-d, при обратной связи по диагонали b-c, при отсутствии связи частоты практически равномерно распределены по всему полю таблицы.


Коэффициент ассоциации


Пример: проанализируем зависимость между полом и фактом совершения покупки посетителями магазина.

1 признак


2 признак

М Ж

Итого

Купил 24 32 56
Не купил 16 28 44
Итого 40 60

Наблюдается очень слабая прямая связь между полом и фактом свершения покупки. Предельное абсолютное значение коэффициента может быть близко к единице.

Коэффициент ассоциации непригоден для расчета в том случае, если одна из частот по диагонали равна 0. В этом случае применяется коэффициент контингенции, который рассчитывается по формуле:

Коэффициент контингенции также указывает на практическое отсутствие связи между признаками (его величина всегда меньше Кас).

Если значения признака распределены более чем по 2 группам, то для определения тесноты связи применяют коэффициенты взаимной сопряженности признаков Пирсона, Чупрова и др.

Показатель Пирсона определяется по формуле , где - показатель взаимной сопряженности признаков, который рассчитывается на основе матрицы взаимного распределения частот.



1 гр. 2 гр. 3 гр. Итого
1 гр.

s11

s12

s13

n1

2 гр.

s21

s22

s23

n2

3 гр.

s31

s32

s33

n3

Итого

m1

m2

m3



Пример: рассмотрим зависимость между величиной магазина и формой обслуживания.



Самообслуживание Традиционное Итого

Мелкие

магазины

12 45 57
Средние 19 10 29
Крупные 14 4 18
Итого 45 59



Коэффициент свидетельствует о наличии заметной связи между величиной магазина и формой его обслуживания. Более точным показателем тесноты связи является коэффициент Чупрова, который определяется по формуле:

, где - соответственно число групп, выделенных по каждому признаку. В нашем примере:

Непараметрические методы измерения тесноты взаимосвязи количественных признаков были первыми из методов измерения тесноты взаимосвязи. Впервые попытался измерить тесноту связи в 30-ч годах 19 века французский ученый Гиррий. Он сопоставлял между собой среднегрупповые значения факторного и результативного признаков. При этом абсолютные значения заменялись их отношениями к некоторым константам. Полученные результаты ранжировались в порядке возрастания. О наличии или отсутствии связи Гиррий судил сопоставляя ранее по группам и подсчитывая количество совпадений и несовпадений рангов. Если преобладало число совпадений – связь считалась прямой. Несовпадение – обратной. При равенстве совпадений и несовпадений – связь отсутствовала.

Методика Гиррий была использована Фехнером при разработке своего коэффициента, а так же Спирменом при разработке коэффициента корреляции рангов.

Расчет коэффициента Фехнера.

Цена 1 кг

лука, руб.

Объем продаж,

кг

Знаки отклонений Сравнение знаков

3 175 -2,5 59,1 н
3,5 200 -2 84,1 н
4 180 -1,5 64,1 н
4,5 150 -1 34,1 н
5 160 -0,5 44,1 н
5,5 120 0 4,1 с
6 85 0,5 -30,9 н
6,5 90 1 -25,9 н
7 50 1,5 -65,9 н
7,5 40 2 -75,9 н
8 25 2,5 -90,9 н

Коэффициент указывает на наличие весьма тесной обратной связи.

На ряду с коэффициентом Фехнера для измерения взаимосвязи количественных признаков применяются коэффициенты корреляции рангов. Наиболее распространенным среди них является коэффициент корреляции рангов Спирмена.

Пример: вычисление коэффициента Спирмена для измерения тесноты взаимосвязи между товарооборотом и уровнем издержек обращения в магазинах.

Однодневный товарооборот, тыс. руб.

Издержки

в % к товарообороту

Ранги

Разность рангов

18 20,5 1 4 -3 9
23 23,4 2 6 -4 16
29 21,2 3 5 -2 4
45 18,9 4 2 2 4
78 19,2 5 3 2 4
93 17,5 6 1 5 25
Всего



62

Коэффициент корреляции рангов может принимать значение в пределах от –1 (обратная связь, близкая к функциональной) до +1 (прямая связь, близкая к функциональной).

Непараметрические методы учитывают направления изменений значений признаков, но не зависят от того, насколько интенсивно колеблются значения результативного признака в результате изменения факторного признака. Это позволяют сделать параметрические методы.

Для измерения тесноты линейной взаимосвязи применяется коэффициент корреляции. Базовая форма коэффициента корреляции следующая:

Фактически, коэффициент корреляции – это среднее произведения нормативных отклонений:

Если связь между признаками отсутствует, то результативный признак не варьирует при изменении факторного признака, следовательно . Такой же результат получается при сбалансированности сумм отрицательных и положительных произведений.

Обычно для расчета коэффициента корреляции применяются формулы, использующие те показатели, которые уже рассчитывались при определении параметров уравнения регрессии. Наиболее удобной для расчетов является формула:

Величина коэффициента корреляции свидетельствует о наличии очень тесной обратной связи между признаками. Качественная оценка тесноты связи дается с помощью шкалы Чедока.


Показатель тесноты связи

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

1,0

Характеристика связи

Слабая

Умеренная

Заметная

Тесная

Очень тесная

Функциональная


Для оценки значимости коэффициента корреляции применяют критерий t-Стьюдента, расчетная величина критерия определяется по формуле:

Табличное значение критерия t-Стьюдента:

Следовательно, параметр надежен.


Для измерения тесноты криволинейных зависимостей применяются универсальные показатели тесноты связи, коэффициенты детерминации, теоретические корреляционные отношения или индексы корреляции. Эти показатели построены на принципе соизмерения дисперсий результативных признаков.

При этом по правилу сложения дисперсий получается взаимосвязь между дисперсиями: .

Коэффициент детерминации:

Теоретическое корреляционное отношение: .

Для линейной связи величина теоретического корреляционного отношения равна коэффициенту корреляции.

Индекс корреляции, по сути, аналогичен теоретическому корреляционному отношению, его рассчитывают на основе правила сложения дисперсий, используя общую и остаточную дисперсии.

Индекс корреляции:


  1. Множественная корреляция и регрессия.

Применяется для изучения влияния двух и более факторов на результативный признак. Процесс исследования включает несколько этапов.

Сначала проводится выбор формы уравнения взаимосвязи, чаще всего выбирается n-мерная линейная формула:

, так как легче считать и интерпретировать полученный результат.

Поскольку расчеты важны и трудоемки, важнейшее значение имеет отбор факторов для включения в регрессионную модель. На основе качественного анализа необходимо отбирать наиболее существенные факторы. На этапе отбора факторов, рассчитывается так же единичная матрица парных коэффициентов корреляции между признаками факторов, отобранных для включения в уравнение регрессии.


1

1

1

1


В уравнение регрессии не включаются оба или хотя бы один из тесно взаимосвязанных между собой факторов, коэффициент корреляции равен или превышает величину 0,8, это делается, чтобы избежать явления мультиколлинеарности, искажающего сущность исследуемого процесса в регрессионной модели.

После подстановки факторов в уравнение, проводятся расчеты его параметров по методу наименьших квадратов, и полученные результаты оцениваются на вероятностную надежность, путем сравнения каждого из параметров неизвестного с величиной соответствующей ошибке выборки. Ненадежные параметры исключаются из уравнений.

Все ненадежные параметры исключаются из уравнения регрессии, и расчеты повторяются до тех пор, пока все оставшиеся параметры или коэффициенты при неизвестных не будут надежны. Такой метод называется пошаговой регрессией. Затем рассчитывается множественный коэффициент детерминации.


Ряды динамики.

  1. Понятие ряда динамики и классификация динамических рядов.

  2. Обеспечение сопоставимости рядов динамики.

  3. Определение среднего уровня временного ряда.

  4. Система статистических показателей динамики.

  5. Изучение основной тенденции развития, социально-экономического развития во времени.

  6. Исследование периодических колебаний во времени.

  7. Корреляционная зависимость в рядах динамики.

  8. Статистические методы прогнозирования.


  1. Понятие ряда динамики и классификация динамических рядов.

Ряд динамики или временной ряд – это последовательность чисел, характеризующих развитие явления во времени.

Ряд динамики – это совокупность двух взаимосвязанных элементов:

  • Уровни ряда;

  • Показатели времени, к которым они относятся.

Уровень ряда – количественная оценка изучаемого явления (абсолютные, относительные, средние величины). В зависимости от показателя времени выделяют:

  • Моментные;

  • Интервальные ряды динамики.

Моментные динамические ряды характеризуют уровень явления по состоянию на определенный момент времени. Уровни моментных динамических рядов не следует суммировать, так как каждый последующих уровень условно или фактически включает в себя предыдущий.

Интервальные динамические ряды отражают масштабы явления за определенные периоды времени (дни, пятидневки, декады, месяцы, кварталы и т.д.) - товарооборот, издержки, доходы и т.д. Показатели интервального ряда можно суммировать. Такая операция называется укрупнением временных интервалов.

Разновидностью интервальных рядов являются ряды динамики с нарастающими итогами. Они применяются для оценки хода выполнения запланированных показателей и текущего, сравнение результатов деятельности разных хозяйственных субъектов. Каждый уровень такого ряда – это сумма значений анализируемого показателя за все предшествующие периоды его регистрации.


Пример: показатели динамики выполнения квартального плана коммерческого банка по доходам от реализации услуг.

Месяцы
Если Вам нужна помощь с академической работой (курсовая, контрольная, диплом, реферат и т.д.), обратитесь к нашим специалистам. Более 90000 специалистов готовы Вам помочь.
Бесплатные корректировки и доработки. Бесплатная оценка стоимости работы.

Поможем написать работу на аналогичную тему

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Нужна помощь в написании работы?
Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Пишем статьи РИНЦ, ВАК, Scopus. Помогаем в публикации. Правки вносим бесплатно.

Похожие рефераты: