На странице представлен фрагмент
Реши любую задачу с помощью нейросети.
Вариант 23.
Приведены данные о потреблении мяса (фунты на душу населения) в США B, и его зависимости от цены (центы за фунт) P и личного располагаемого дохода (тысячи долларов в расчете на душу населения) YD.
ГОД YD В Р
1960 6,036 85,1 20
1961 6,113 87,8 21
1962 6,271 88,9 21,3
1963 6,378 94,5 19,9
1964 6,727 99,9 18
1965 7,027 99,5 20
1966 7,28 104 22,2
1967 7,513 106,5 22,3
1968 7,728 109,7 23,4
1969 7,891 110,8 26,2
1970 8,134 112 27
1971 8,322 113 29
1972 8,562 116 33,5
1973 9,042 108,7 42,8
1974 8,867 115,4 35,6
1975 8,944 118,9 32,2
1976 9,175 127,4 33,7
1977 9,381 123,5 34,4
1978 9,735 117,9 48,5
1979 9,829 105,4 66,1
1980 9,722 103,2 62,4
1981 9,769 104,2 58,6
1982 9,725 103,7 56,7
1983 9,93 105,7 55,5
1984 10,419 105,5 57,3
1985 10,625 106,5 53,7
1986 10,905 107,3 52,6
1987 10,97 103,3 61,1
1. Постройте модель множественной регрессии, объясняющую динамику потребления мяса в США, дайте подробную интерпретацию ее коэффициентам. Определите статистическую значимость коэффициентов регрессии.
2. Постройте модели парной регрессии, в которых потребление мяса в США объясняется изменением только одного фактора. Сравните их с моделью множественной регрессии: в чем заключается преимущество модели множественной регрессии?
3. Попробуйте построить множественную регрессию, в которой вместо всех трех переменных использованы их логарифмы. Какую форму уравнения связи между исходными переменными предполагает такая зависимость? Как меняется интерпретация коэффициентов регрессии? Обладает ли в данном случае логарифмическая регрессия преимуществами перед линейной регрессией? В чем вы видите ее недостатки?
Часть выполненной работы
y 1 0.52 0.19
x1 0.52 1 0.9
x2 0.19 0.9 1
При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.
Для отбора наиболее значимых факторов xi учитываются следующие условия:
– связь между результативным признаком и факторным должна быть выше межфакторной связи;
– связь между факторами должна быть не более 0.7;
– при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними;
Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результат фактора xi при неизменном уровне других факторов.
Частные коэффициенты корреляции.
Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.
EQ ryx1 /x2 = f(ryx1 – ryx2 •rx1 x2 ;r((1-r2yx2 )(1-r2x1 x2 )))
EQ ryx1 /x2 = f(0.52 – 0.19•0.9;r((1-0.192)(1-0.92))) = 0.8
Теснота связи сильная
EQ ryx2 /x1 = f(ryx2 – ryx1 •rx2 x1 ;r((1-r2yx1 )(1-r2x2 x1 )))
EQ ryx2 /x1 = f(0.19 – 0.52•0.9;r((1-0.522)(1-0.92))) = -0.73
Теснота связи сильная
EQ rx1 x2 /y = f(rx1 x2 – rx1 y•rx2 y;r((1-r2x1 y)(1-r2x2 y)))
EQ rx1 x2 /y = f(0.9 – 0.52•0.19;r((1-0.522)(1-0.192))) = 0.95
Теснота связи сильная
Уравнение регрессии в стандартизированном масштабе.
Другим видом уравнения множественной регрессии может быть уравнение регрессии в стандартизированном масштабе: ty = β1tx1 + β2tx2.
где EQ ty = f(yi-xto(y);Sy)
EQ txi = f(xi-xto(xi);Sxi)
βi – стандартные коэффициенты регрессии.
К уравнению множественной регрессии в стандартизированном масштабе применим МНК. Стандартизированные коэффициенты регрессии (β-коэффициенты) определяются из следующей системы уравнений:
ryx1 = β1 + β2rx2x1
ryx2 = β1rx2x1 + β2
Связь коэффициентов множественной регрессии bi со стандартизированными коэффициентами βi описывается соотношением:
EQ bi = βif(Sy;Sxi)
EQ βi = bif(Sxi;Sy)
или через парные коэффициенты корреляции:
EQ β1 = f(ry…