На странице представлен фрагмент
Реши любую задачу с помощью нейросети.
По 20 предприятиям региона (см. табл.) изучается зависимость выработки продукции на одного работника У (тыс. руб.) от ввода в действие новых основных фондов Х1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих Х2 (%).
Требуется:
Построить диаграммы рассеяния выработки продукции на одного работника У (тыс. руб.) в зависимости от ввода в действие новых основных фондов Х1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих Х2 (%) и определить форму связи между результирующим показателем (У) и каждым их факторов (Х1 и Х2).
Оценить с помощью МНК параметры линейного регрессионного уравнения У от Х1 и Х2.
Рассчитать значение коэффициента детерминации и интерпретировать его.
Определить скорректированный коэффициент детерминации и сравнить его со значением обычного коэффициента детерминации.
Проверить значимость полученного уравнения регрессии на уровне 0,05.
Найти 95% доверительные интервалы для значимых коэффициентов регрессии.
Номер
предприятия у х1 х2
1 7 3,9 11
2 7 4,1 13
3 7 4,4 13
4 7 4,8 15
5 8 5,5 15
6 8 5,7 16
7 10 6 16
8 11 6 16
9 11 6,1 17
10 11 6,2 20
11 11 6,6 22
12 11 6,8 23
13 11 7,1 25
14 11 7,1 26
15 11 7,5 26
16 12 7,6 27
17 12 7,6 30
18 13 7,9 31
19 13 8 36
20 14 8,6 36
Часть выполненной работы
1. Всех факторов (χ2 – хи-квадрат).
2. Каждого фактора с остальными (критерий Фишера).
3. Каждой пары факторов (критерий Стьюдента).
Проверим переменные на мультиколлинеарность методом Фаррара-Глоубера по первому виду статистических критериев (критерий “хи-квадрат”).
Формула для расчета значения статистики Фаррара-Глоубера:
χ2 = -[n-1-(2m+5)/6]ln(det[R])
где m = 2 – количество факторов, n = 20 – количество наблюдений, det[R] – определитель матрицы парных коэффициентов корреляции R.
Сравниваем его с табличным значением при v = m/2(m-1) = 1 степенях свободы и уровне значимости α. Если χ2 > χтабл2, то в векторе факторов есть присутствует мультиколлинеарность.
χтабл2(1;0.05) = 3.84146
Проверим переменные на мультиколлинеарность по второму виду статистических критериев (критерий Фишера).
Определяем обратную матрицу D = R-1:
EQ D = bbc| (a al co3 hs3 (9,855;-9,88;0,571;-9,88;19,237;-9,391;0,571;-9,391;9,366))
Вычисляем F-критерии Фишера:
EQ Fk = (dkk-1)f(n-m;m-1)
где dkk – диагональные элементы матрицы.
Рассчитанные значения критериев сравниваются с табличными при v1=n-m и v2=m-1 степенях свободы и уровне значимости α. Если Fk > FТабл, то k-я переменная мультиколлинеарна с другими.
v1=20-2 = 18; v2=2-1 = 1. FТабл(18;1) = 248
EQ F1 = (9.855-1)f(20-2;2-1) = 159.4
Поскольку F1 ≤ Fтабл, то переменная y немультиколлинеарна с другими.
EQ F2 = (19.237-1)f(20-2;2-1) = 328.27
Поскольку F2 > Fтабл, то переменная x1 мультиколлинеарна с другими.
EQ F3 = (9.366-1)f(20-2;2-1) = 150.59
Поскольку F3 ≤ Fтабл, то переменная x2 немультиколлинеарна с другими.
Проверим переменные на мультиколлинеарность по третьему виду статистических критериев (критерий Стьюдента). Для этого найдем частные коэффициенты корреляции.
Частные коэффициенты корреляции.
Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.
На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели.
EQ ryx1 /x2 = f(ryx1 – ryx2 •rx1 x2 ;r((1-r2yx2 )(1-r2x1 x2 )))
EQ ryx1 /x2 = f(0.948 – 0.889 • 0.945;r((1-0.8892)(1-0.9452))) = 0.718
Теснота связи сильная
Определим значимость коэффициента корреляции ryx1 /x2 .
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
EQ tнабл = ryx1 /x2 f(r(n-k-2);r(1 – ryx1 /x2 2))
где k = 1 – число фиксируемых факторов.
EQ tнабл = 0.72 f(r(20 – 1 – 2);r(1 – 0.722)) = 4.25
По таблице Стьюдента находим Tтабл
tкрит(n-k-2;α/2) = (17;0.025) = 2.11
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически – значим
Как видим, связь y и x1 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x1 остается нецелесообразным.
EQ ryx2 /x1 = f(ryx2 – ryx1 •rx2 x1 ;r((1-r2yx1 )(1-r2x2 x1 )))
EQ ryx2 /x1 = f(0.889 – 0.948 • 0.945;r((1-0.9482)(1-0.9452))) = -0.0594
Теснота связи низкая.
Определим значимость коэффициента корреляции ryx2 /x1 .
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
EQ tнабл = ryx2 /x1 f(r(n-k-2);r(1 – ryx2 /x1 2))
EQ tнабл = 0.0594 f(r(20 – 1 – 2);r(1 – 0.05942)) = 0.25
Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически – не значим
Как видим, связь y и x2 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x2 остается нецелесообразным.
EQ rx1 x2 /y = f(rx1 x2 – rx1 y•rx2 y;r((1-r2x1 y)(1-r2x2 y)))
EQ rx1 x2 /y = f(0.945 – 0.948 • 0.889;r((1-0.9482)(1-0.8892))) = 0.7
Теснота связи умеренная
Определим значимость коэффициента корреляции ryx2 /y.
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
EQ tнабл = ryx2 /y f(r(n-k-2);r(1 – ryx2 /y2))
EQ tнабл = 0.7 f(r(20 – 1 – 2);r(1 – 0.72)) = 4.04
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически – значим
Как видим, связь y и x2 при условии, что y войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x2 остается нецелесообразным.
Можно сделать вывод, что при построении регрессионного уравнения следует отобрать факторы x1 , x2 .
Анализ параметров уравнения регрессии.
Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Несмещенная ошибка ε = Y – Y(x) = Y – X*s (абсолютная ошибка аппроксимации)
Y Y(x) ε = Y – Y(x) ε2 (Y-Yср)2 |ε : Y|
7 6.437 0.563 0.317 10.89 0.0804
7 6.73 0.27 0.0728 10.89 0.0385
7 7.22 -0.22 0.0484 10.89 0.0314
7 7.84 -0.84 0.705 10.89 0.12
8 8.983 -0.983 0.966 5.29 0.123
8 9.293 -1.293 1.671 5.29 0.162
10 9.782 0.218 0.0473 0.09 0.0218
11 9.782 1.218 1.482 0.49 0.111
11 9.929 1.071 1.147 0.49 0.0974
11 10.043 0.957 0.917 0.49 0.087
11 10.662 0.338 0.114 0.49 0.0307
11 10.972 0.0277 0.000767 0.49 0.00252
11 11.429 -0.429 0.184 0.49 0.039
11 11.412 -0.412 0.17 0.49 0.0375
11 12.065 -1.065 1.135 0.49 0.0968
12 12.212 -0.212 0.0449 2.89 0.0177
12 12.162 -0.162 0.0263 2.89 0.0135
13 12.635 0.365 0.133 7.29 0.0281
13 12.715 0.285 0.081 7.29 0.0219
14 13.695 0.305 0.093 13.69 0.0218
0 9.355 92.2 1.181
Средняя ошибка аппроксимации
EQ A = f(∑|ε : Y|;n) 100% = f(1.181;20) 100% = 5.91%
Оценка дисперсии равна:
se2 = (Y – X*Y(X))T(Y – X*Y(X)) = 9.36
Несмещенная оценка дисперсии равна:
EQ s2 = f(1;n-m-1) s2e = f(1;20 – 2 – 1)9.36 = 0.55
Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):
EQ S = r(S2) = r(0.55) = 0.74
Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-1
EQ k(x) = 0.74bbc| (a al co3 hs3 (2,521;-0,742;0,104;-0,742;0,269;-0,0447;0,104;-0,0447;0,00833)) = bbc| (a al co3 hs3 (1,387;-0,408;0,0573;-0,408;0,148;-0,0246;0,0573;-0,0246;0,00458))
Дисперсии параметров модели определяются соотношением S2i = Kii, т.е. это элементы, лежащие на главной диагонали
EQ Sb0 = r(1.387) = 1.178
EQ Sb1 = r(0.148) = 0.384
EQ Sb2 = r(0.00458) = 0.0677
Показатели тесноты связи факторов с результатом.
Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат.
К таким показателям тесноты связи относят: частные коэффициенты эластичности, β–коэффициенты, частные коэффициенты корреляции.
Частные коэффициенты эластичности.
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:
EQ Ei = bi f(xto(x)i; xto(y) )
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня…
Купить уже готовую работу
Так же вы можете купить уже выполненные похожие работы. Для удобства покупки работы размещены на независимой бирже. Подробнее об условиях покупки тут.