Эконометрика Задача 1. Парная линейная регрессия. Двумерная выборка результатов совместных измерений признаков Х и Y, объемом n= 100 наблюдений задана корреляционной таблицей: Y X 0,5 1,3 2,1 2,9 3,7 nХ 0,6 2 3 - - - 5 1,8 3 8 2 - - 13 3,0 - 11 16 - - 27 4,2 - - 13 10 - 23 5,4 - - 9 10 - 19 6,6 - - 3 6 1 10 7,8 - - - 1 2 3 nY 5 22 43 27 3 n = 100 Задания: 1.Изобразить зависимость между x и y графически точками координатного поля (изобразить корреляционное поле выборки). 2. Для каждого значения хi, i = 1…..,7 (т.е. для каждой строки корреляционной таблицы) найти групповые средние по признаку Y и изобразить эмпирическую линию регрессии Y по X. 3. Для каждого значения yi, j=1…..5 (т.е. для каждого столбца корреляционной таблицы) найти групповые средние по признаку Х и изобразить эмпирическую линию регрессии Х по Y 4. В предположении о наличии линейной регрессии Y по Х, найти и изобразить теоретическую линию регрессии Y по Х в виде Yx = b0 + b1*x, Вычисляя коэффициенты b0 и b1 в соответствии с формулами, полученными из метода наименьших квадратов. 5. В предположении о наличии линейной регрессии Х по Y, найти и изобразить теоретическую линию регрессии Х по Y в виде Xy = a0 + a1*y, вычисляя коэффициенты a0 и a1 в соответствии с формулами , полученными из метода наименьших квадратов 6. Найти выборочный коэффициент корреляции признаков Х и Y r = rxy. Используя найденное значение r, проверить значимость коэффициента корреляции между переменными X и Y для уровня значимости α = 0,05 (т.е. подтвердить или опровергнуть гипотезу об отсутствии линейной корреляционной зависимости меду X и Y в генеральной совокупности Использовать статистику Критическое значение tкр. Определить по таблице критерия Стьюдента при уровне значимости α = 0,05 или, соответственно, при доверительной вероятности γ = 1 - α = 1 – 0,05 = 0,95 и при k = n – 2 = 100 – 2 = 98 степенях свободы. Решение: 1.Изобразим зависимость между x и y графически точками координатного поля (корреляционное поле выборки): 2. Для каждого значения хi, i = 1…..,7 (т.е. для каждой строки корреляционной таблицы) найдем групповые средние по признаку Y X nХ 0,6 0,98 5 1,8 1,24 13 3,0 1,77 27 4,2 2,45 23 5,4 2,52 19 6,6 2,74 10 7,8 3,43 3 - - n = 100 Изобразим эмпирическую линию регрессии Y по X: 3. Для каждого значения yi, j=1…..5 (т.е. для каждого столбца корреляционной таблицы) найдем групповые средние по признаку Х: Y nY 0,5 1,32 5 1,3 2,24 22 2,1 4,06 43 2,9 5,31 27 3,7 7,40 3 - - n = 100 Изобразим эмпирическую линию регрессии Х по Y: 4. Для облегчения расчетов перейдем к условным статистическим величинам: и Здесь х0 = 3 (варианта с наибольшей частотой) , hx = 1,2. у0 = 2,1 (варианта с наибольшей частотой) , hу = 0,8. Получаем новую корреляционную таблицу: v u -2 -1 0 1 2 Итого -2 2 3 - - - 5 -1 3 8 2 - - 13 0 - 11 16 - - 27 1 - - 13 10 - 23 2 - - 9 10 - 19 3 - - 3 6 1 10 4 - - - 1 2 3 Итого: 5 22 43 27 3 n = 100 Вычислим вспомогательные величины: _ u = Σ ui ni / n = (-2*5 + (-1)*13 + 0*27 + 1*23 + 2*19 + 3*10 + 4*3) / 100 = = 80 / 100 = 0,8 _ v = Σ vj nj / n = (-2*5 + (-1)*22 + 0*43 + 1*27 + 2*3) / 100 = 1 / 100 = 0,01 __ u2 = Σ ui2 ni / n = ((-2)2*5 + (-1)2*13 + 02*27 + 12*23 + 22*19 + 32*10 + + 42*3) / 100 = 270 / 100 = 2,7 __ v2 = Σ vj2nj / n = ((-2)2*5 + (-1)2*22 + 02*43 + 12*27 + 22*3) / 100 = 0,81 __ _ σu2 = u2 – (u)2 = 2,7 – 0,82 = 2,06 => σu = 1,435 __ _ σv2 = v2 – (v)2 = 0,81 – 0,012 = 0,8099 => σv = 0,900 __ uv = Σ ui vj nij = 102 / 100 = 1,02 Вычислим коэффициент корреляции между случайными величинами u и v: __ _ _ uv – u*v 1,02 – 0,8*0,01 ruv = ———— = —————— = 0,784 σu σv 1,435*0,9 Вернемся к исходным случайным величинам х и у: _ _ Х = u*hx + x0 = 0,8*1,2 + 3 = 3,96 _ _ Y = Y*hy + x0 = 0,01*0,8 + 2,1 = 2,108 σх = h*σu = 1,2*1,435 = 1,722 σy = h*σv = 0,8*0,9 = 0,72 Коэффициент корреляции между случайными величинами Х и Y равен коэффициенту корреляции между случайными величинами u и v: rху = ruv = 0,784 Коэффициент корреляции говорит о том, что связь между Х и Y прямая и довольно тесная. В предположении о наличии линейной регрессии Y по Х, найдем и изобразим теоретическую линию регрессии Y по Х в виде Yx = b0 + b1*x: _ σY _ Yx – Y = rxy — (Х – Х) σх Имеем: 0,72 Yx – 2,108 = 0,784 * ——— * (Х – 3,96) 1,722 Окончательно получаем: Yx = 0,328Х + 0,81. 5. В предположении о наличии линейной регрессии Х по Y, найдем и изобразим теоретическую линию регрессии Х по Y в виде Xy = a0 + a1*y: _ σX _ XY – X = rxy — (Y – Y) σY Имеем: 1,722 XY – 3,96 = 0,784 * —— * (Y – 2,108) 0,72 Окончательно получаем: XY = 1,875Y + 0,007. 6. Выборочный коэффициент корреляции признаков Х и Y: r = rxy = 0,784. Проверим значимость коэффициента корреляции между переменными X и Y для уровня значимости α = 0,05. Выполним проверку статистической значимости коэффициента корреляции с помощью t-статистики которая имеет распределение Стьюдента: tтабл (α = 0,05 ; k = n - 2 = 98) = 1,66 Получаем |tрасч| > tтабл , т.е. проверка статистической значимости коэффициента корреляции показывает, что коэффициент корреляции значимо отличен от нуля. Таким образом, коэффициент корреляции статистически значим. Задача 2. Анализ временных рядов t 1 2 3 4 5 6 7 8 9 10 x 0,7 0,8 0,9 0,9 1,0 1,0 1,1 1,1 1,1 1,2 Дан временной ряд в виде таблицы значений yt или xt при t = 1, …, n 1. Найти среднее значение 2. Произвести сглаживание ряда методом скользящей средней при m = 3. 3. Выделить линейный тренд. 4. Если можно предположить наличие у временного ряда сезонных колебаний найти индексы сезонности 5. Спрогнозировать значение временного ряда в момент времени (n+1). Решение: 1. Найдем среднее значение временного ряда по формуле средней арифметической простой: 2. Произведем сглаживание ряда методом скользящей средней: Период Y(t) Суммарное значение за три периода Сглаженное значение 1 0,7 - - 2 0,8 2,4 0,80 3 0,9 2,6 0,87 4 0,9 2,8 0,93 5 1,0 2,9 0,97 6 1,0 3,1 1,03 7 1,1 3,2 1,07 8 1,1 3,3 1,10 9 1,1 3,4 1,13 10 1,2 - - Изобразим исходные данные и сглаженные значения на графике: 3. Из графика исходных данных видно, что Y(е) c течением времени имеет тенденцию роста. Для определения характера тенденции построим ее модель. Рассмотрим модель первого порядка, то есть попытаемся описать тенденцию изучаемого явления с помощью линейного уравнения: . Для нахождения коэффициентов уравнения рассмотрим следующую систему уравнений: Построим и заполним вспомогательную таблицу. Получаем систему уравнений: <=> 82,5а1 = 4,1 а1 = 0,05 Тогда а0 = (9,8 – 55*0,05)/10 = 0,71 Период y t yt t2 yt 1 0,7 1 0,7 1 0,76 2 0,8 2 1,6 4 0,81 3 0,9 3 2,7 9 0,86 4 0,9 4 3,6 16 0,91 5 1 5 5 25 0,96 6 1 6 6 36 1,00 7 1,1 7 7,7 49 1,05 8 1,1 8 8,8 64 1,10 9 1,1 9 9,9 81 1,15 10 1,2 10 12 100 1,20 Сумма 9,8 55 58 385 9,801 Решив систему, мы получили следующие значения параметров уравнения: а0 = 0,71 и а1 = 0,05. Получаем следующее уравнение, описывающее тенденцию изменения Y: 0,71 + 0,05*t. Изобразим полученную линию тренда на графике: 4. Спрогнозируем значение временного ряда в момент времени 11: 0,71 + 0,05*11 = 1,26. Список использованной литературы: 1) Елисеева И.И., Юзбашев М.М. «Общая теория статистики: учебник» – / Под ред. чл-корр. РАН И.И. Елисеевой. – М.: Финансы и статистика, 2006; 2) «Теория статистики» / Под ред. проф. Р.А. Шмойловой, – М.: Финансы и статистика, 2004; 3) “Общая теория статистики”, под редакцией А.А.Спирина, О.Э.Башиной, - М.: Финансы и статистика, 2007; 4) «Экономическая статистика», под ред. Ю.Н. Иванова, - М.: ИНФРА-М, 2004.
|