Построение корреляции исследуемых зависимостей
Какое это уравнение? Имеет ли оно статистическое решение с помощью КМНК?
решение
Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос — имеют ли решения каждое из уравнений и система в целом. Воспользуемся счетным правилом, по которому в каждом уравнении системы необходимо сравнить НY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.
Таблица 3.1
Результаты идентификации структурных уравнений и всей системы
Номер уравнения | Число эндогенных переменных в уравнении, НY | Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx | Сравнение параметров НY и Dx+1 | Решение об идентификации уравнения |
1 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
2 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
3 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
4 | 3 | 2 | 3 = 2+1 | Точно идентифицируемо |
Проверим необходимое условие идентификации для уравнений модели.
I уравнение
Уравнение | Отсутствующие переменные | ||
у3 | у4 | х3 | |
Второе | b23 | 0 | 0 |
Третье | -1 | 0 | 0 |
Четвертое | 0 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и первое уравнение не идентифицируемо.
II уравнение
Уравнение | Отсутствующие переменные | ||
у1 | у4 | х3 | |
Первое | -1 | 0 | 0 |
Третье | b31 | 0 | 0 |
Четвертое | b41 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и второе уравнение не идентифицируемо.
III уравнение
Уравнение | Отсутствующие переменные | ||
у2 | у4 | х3 | |
Первое | b12 | 0 | 0 |
Второе | -1 | 0 | 0 |
Четвертое | b42 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и третье уравнение не идентифицируемо.
IV уравнение
Уравнение | Отсутствующие переменные | ||
у3 | х1 | х2 | |
Первое | 0 | а11 | а12 |
Второе | b23 | а21 | а22 |
Третье | -1 | а31 | а32 |
Det A = = -a11* + a12* № 0.
Ранг матрицы равен 2, что не менее числа эндогенных переменных системы без единицы.
Следовательно, выполняется достаточное условие идентификации, и четвертое уравнение точно идентифицируемо.
Вся модель является не идентифицируемой. Соответственно идентифицируемое уравнение не может быть решено с помощью КМНК.
4. Динамика ВРП на душу населения по региону характеризуется следующими данными за 1997-2003 гг. (тыс. руб.):
1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 |
10,0 | 12,7 | 14,3 | 17,1 | 29,4 | 42,2 | 52,4 |
Определить коэффициент автокорреляции первого порядка и дать его интерпретацию.
Построить уравнение тренда в виде экспоненты или показательной кривой. Дать интерпретацию параметров.
С помощью критерия Дарбина-Уотсона сделать выводы относительно автокорреляции в остатках в рассматриваемом уравнении.
Дать интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год.
решение
Для изменения автокорреляции уровней динамического ряда используется коэффициент автокорреляции:
r1 = ,
где = = 28,02 тыс. руб.;
= = 20,95 тыс. руб.
Таблица 4.1
Расчет коэффициента автокорреляции первого порядка для временного ряда
t | yt | yt-1 |
yt - |
yt-1 - |
(yt - )*(yt-1 - ) |
(yt - )2 |
(yt-1 - )2 |
1 | 10,0 | - | - | - | - | - | - |
2 | 12,7 | 10,0 | -15,32 | -10,95 | 167,72 | 234,60 | 119,90 |
3 | 14,3 | 12,7 | -13,72 | -8,25 | 113,16 | 188,15 | 68,06 |
4 | 17,1 | 14,3 | -10,92 | -6,65 | 72,60 | 119,17 | 44,22 |
5 | 29,4 | 17,1 | 1,38 | -3,85 | -5,33 | 1,91 | 14,82 |
6 | 42,2 | 29,4 | 14,18 | 8,45 | 119,85 | 201,17 | 71,40 |
7 | 52,4 | 42,2 | 24,38 | 21,25 | 518,15 | 594,55 | 451,56 |
Итого | 178,1 | 125,7 | 0 | 0 | 986,15 | 1339,55 | 769,98 |
r1 = = 0,971.
Полученное значение свидетельствует об очень тесной зависимости между ВРП на душу населения по региону текущего и непосредственно предшествующего годов и, следовательно, о наличии во временном ряде ВРП на душу населения по региону сильной линейной тенденции.
Определим параметры уравнения тренда в виде показательной кривой у = а*bt:
lgy = lga + t*lgb
Y = C + B*t,
где Y = lgy;
C = lga;
B = lgb.
Таблица 4.1
Расчет параметров тренда
№ | у | Y | t | Y*t | Y2 | t2 |
1 | 10,0 | 1,000 | 1 | 1,000 | 1,000 | 1 |
2 | 12,7 | 1,104 | 2 | 2,208 | 1,218 | 4 |
3 | 14,3 | 1,155 | 3 | 3,466 | 1,335 | 9 |
4 | 17,1 | 1,233 | 4 | 4,932 | 1,520 | 16 |
5 | 29,4 | 1,468 | 5 | 7,342 | 2,156 | 25 |
6 | 42,2 | 1,625 | 6 | 9,752 | 2,642 | 36 |
7 | 52,4 | 1,719 | 7 | 12,035 | 2,956 | 49 |
Сумма | 178,1 | 9,305 | 28 | 40,735 | 12,827 | 140 |
Среднее | 25,44 | 1,329 | 4 | 5,819 | 1,832 | 20 |
В = = = 0,126;
А = - В* = 1,329 – 0,126*4 = 0,825.
Получено линейное уравнение: = 0,825 + 0,126*t.
Произведем потенцирование полученного уравнения и запишем его в обычной форме: = 100,825*100,126*t = 6,683*1,337t.
Рис. 4.1. Графическое отображение уравнения тренда.
Показатель b = 1,337 представляет собой средний за период цепной коэффициент роста уровней ряда. Параметр а = 0,825 означает начальный уровень ряда в момент времени, равный 0.
Остатки et рассчитываются по формуле:
et = yt - .
Критерий Дарбина-Уотсона рассчитывается по формуле:
d = .
Таблица 4.2
Расчет критерия Дарбина-Уотсона
№ | уt |
|
et | et-1 |
|
|
1 | 10,0 | 8,94 | 1,06 | |||
2 | 12,7 | 11,95 | 0,75 | 1,06 | 0,097 | 0,568 |
3 | 14,3 | 15,97 | -1,67 | 0,75 | 5,885 | 2,796 |
4 | 17,1 | 21,35 | -4,25 | -1,67 | 6,670 | 18,104 |
5 | 29,4 | 28,55 | 0,85 | -4,25 | 26,045 | 0,720 |
6 | 42,2 | 38,17 | 4,03 | 0,85 | 10,101 | 16,214 |
7 | 52,4 | 51,04 | 1,36 | 4,03 | 7,099 | 1,856 |
Сумма | - | - | - | - | 55,896 | 40,258 |
d = = 1,39.
Фактическое значение d сравниваем с табличным значением при 5%-ном уровне значимости. При n = 7 лет и m = 1 (число факторов) нижнее значение d’ равно 0,70, а верхнее - 1,36. Так как фактическое значение d равно 1,39.
На основании схемы видно, что d = 1,39 попадает в промежуток от dU до 4 – dU. Следовательно, нет оснований отклонять гипотезу Н0 об отсутствии автокорреляции в остатках.
При t = 9, что соответствует 2005 году, прогнозное значение составит:
= 6,683*1,3379 = 91,2 тыс. руб.
Таблица 4.3
Расчет стандартной ошибки прогноза
№ | уt |
|
|
t |
|
1 | 10,0 | 8,94 | 1,124 | 1 | 9 |
2 | 12,7 | 11,95 | 0,563 | 2 | 4 |
3 | 14,3 | 15,97 | 2,789 | 3 | 1 |
4 | 17,1 | 21,35 | 18,063 | 4 | 0 |
5 | 29,4 | 28,55 | 0,722 | 5 | 1 |
6 | 42,2 | 38,17 | 16,241 | 6 | 4 |
7 | 52,4 | 51,04 | 1,850 | 7 | 9 |
Сумма | 178,1 | 176,0 | 41,351 | 28 | 28 |
Среднее | - | - | - | 4 | - |
S = = = 2,876.
myt = = = 1,726.
ta* myt = 2,571*1,726 = 4,4.
91,2 – 4,4 = 86,8 Ј Ј 91,2 + 4,4 = 95,6.
Интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год составит 86,8 Ј Ј 95,6 тыс. руб.
5. Динамика показателя деятельности организаций с участием иностранного капитала в регионе характеризуется следующими данными:
Год |
Среднесписочная численность работников, тыс. чел. (хt) |
Выпуск товаров, работ и услуг, млрд. руб. (уt) |
1998 |
25,8 |
6 |
1999 |
29,5 |
14 |
2000 |
31,4 |
19 |
2001 |
29,1 |
29 |
2002 |
35,5 |
45 |
2003 |
42,0 |
64 |
2004 |
46,1 |
69 |
В результате аналитического выравнивания получены следующие уравнения трендов и коэффициенты детерминации (t = 1:7):
для выпуска товаров, работ и услуг:
= -9,8571 + 11,25*t, R2 = 0,9654,
для среднесписочной численности работников:
= 27,4 – 0,8238*t + 0,5048*t2, R2 = 0,9397.
Дать интерпретацию параметров уравнений трендов.
Определить коэффициент корреляции между временными рядами, используя:
непосредственно исходные уровни;
отклонения от основной тенденции.
Обосновать различие полученных результатов и сделать вывод о тесноте связи между временными рядами.
Построить уравнение регрессии по отклонениям от трендов.
решение
Наиболее простую экономическую интерпретацию имеют параметры линейного тренда. Параметры линейного тренда можно интерпретировать так:
а – начальный уровень временного ряда в момент времени t = 0;
b – средний за период абсолютный прирост уровней ряда.
Для исходной задачи начальный уровень ряда для выпуска товаров соответствует значению -9,8571 млрд. руб., средний за период абсолютный прирост уровней ряда составляет 11,25 млрд. руб. Параметр b > 0, значит уровни ряда равномерно возрастают на 11,25 млрд. руб. каждый год.
Для среднесписочной численности работников коэффициент а - начальный уровень ряда соответствует значению 27,4 тыс. чел.; абсолютное ускорение увеличения среднесписочной численности работников соответствует 1,0096.
Рассчитаем коэффициент корреляции между временными рядами, используя непосредственно исходные уровни. Коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Определяем его по формуле:
rxy = ,
Таблица 5.1
Расчет параметров коэффициента корреляции
№ | у | х | х*у | у2 | х2 |
1 | 6 | 25,8 | 154,8 | 36 | 665,64 |
2 | 14 | 29,5 | 413 | 196 | 870,25 |
3 | 19 | 31,4 | 596,6 | 361 | 985,96 |
4 | 29 | 29,1 | 843,9 | 841 | 846,81 |
5 | 45 | 35,5 | 1597,5 | 2025 | 1260,25 |
6 | 64 | 42,0 | 2688 | 4096 | 1764 |
7 | 69 | 46,1 | 3180,9 | 4761 | 2125,21 |
Сумма | 246 | 239,4 | 9474,7 | 12316 | 8518,12 |
Среднее | 35,14 | 34,20 | 1353,53 | 1759,43 | 1216,87 |
sх = = = 6,87;
sу = = = 22,90.
rxy = = 0,965 - связь сильная, прямая.
Рассчитаем коэффициент корреляции между временными рядами, используя отклонения от основной тенденции.
Таблица 5.2
Расчет отклонений от основной тенденции
№ | у | х |
х - |
у - |
||
1 | 6 | 25,8 | 27,08 | 1,39 | -1,28 | 4,61 |
2 | 14 | 29,5 | 27,77 | 12,64 | 1,73 | 1,36 |
3 | 19 | 31,4 | 29,47 | 23,89 | 1,93 | -4,89 |
4 | 29 | 29,1 | 32,18 | 35,14 | -3,08 | -6,14 |
5 | 45 | 35,5 | 35,90 | 46,39 | -0,4 | -1,39 |
6 | 64 | 42,0 | 40,63 | 57,64 | 1,37 | 6,36 |
7 | 69 | 46,1 | 46,37 | 68,89 | -0,27 | 0,11 |
Сумма | 246 | 239,4 | 239,41 | 246,00 | -1,28 | 0,02 |
Среднее | 35,14 | 34,20 | - | - | 0 | 0,00286 |
Таблица 5.3
Расчет параметров коэффициента корреляции
№ | у | х | х*у | у2 | х2 |
1 | 4,61 | -1,28 | -5,90 | 21,25 | 1,64 |
2 | 1,36 | 1,73 | 2,35 | 1,85 | 2,99 |
3 | -4,89 | 1,93 | -9,44 | 23,91 | 3,72 |
4 | -6,14 | -3,08 | 18,91 | 37,70 | 9,49 |
5 | -1,39 | -0,4 | 0,56 | 1,93 | 0,16 |
6 | 6,36 | 1,37 | 8,71 | 40,45 | 1,88 |
7 | 0,11 | -0,27 | -0,03 | 0,01 | 0,07 |
Сумма | 0,02 | -1,28 | -0,03 | 0,00 | 1,64 |
Среднее | 0,00286 | 0 | 15,14 | 127,11 | 21,59 |
sх = = = 4,65;
sу = = = 11,27.
rxy = = 0,289 - связь слабая, прямая.
При измерении корреляции между двумя временными рядами следует учитывать возможное существование ложной корреляции, что связано с наличием во временных рядах тенденции, т.е. зависимости обоих рядов от общего фактора времени. Для того чтобы устранить ложную корреляцию, следует коррелировать не сами уровни временных рядов, а их последовательные (первые или вторые) разности или отклонения от трендов (если последние не содержат тенденции).
Различия полученных результатов объясняется ложной корреляцией из-за наличия во временных рядах тенденции. Таким образом между временными рядами существует прямая слабая взаимосвязь.
Линейная регрессия сводится к нахождению уравнения вида:
= a + b*x.
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов.
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b.
,
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
а = ;
b = = = 0,701;
а = 0,00286 – 0,701*0 = 0,00286.
Уравнение регрессии по отклонениям от трендов: = 0,00286 + 0,701*х.