На странице представлен фрагмент
Реши любую задачу с помощью нейросети.
задачи, вариант соответствует последней цифре в номере зачетной книжки.
Последняя цифра в номере зачетной книжки 1 2 3 4 5 6 7 8 9 10
№ задачи для выполнения 1 2 3 4 5 6 7 8 9 10
№ задачи для выполнения 11 12 13 14 15 11 12 13 14 15
Перед решение задачи в открытом файле задачи выполнить следующие действия:
Файл – Открыть – папка StatPlus – файл StatPlus25.exe
В открытом файле задачи в строке меню появится еще одна команда StatPlus с выпадающим списком операций.
Пример 14
В рабочей книге ХондаСибик.xls включены данные о ценах на подержанные автомобили, опубликованные в объявлениях в газете: Цена, Возраст и Пробег (Приложение 2, таблица 2.7).
А. Обратите внимание, что здесь возникает проблема отсутствующих данных, поскольку данные о пробеге включены не во все объявления. Чтобы избежать проблемы отсутствующих данных, скопируйте строки со всеми данными в новый рабочий лист. Выполните в нем анализ корреляции и создайте диаграммы корреляции для переменных Цена, Возраст и Пробег. (Для этого придется скопировать столбец с данными о возрасте автомобиля рядом со столбцом о пробеге.)
Б. Выполните анализ регрессии переменной Цена по отношению к переменным Возраст и Пробег. Можно ли на основании анализа остатков сказать, что предположения о регрессии нарушаются?
В. Обратите внимание: один автомобиль намного старше других, и его большой остаток может указывать на то, что это выброс. Выполните новый анализ регрессии без данного наблюдения и сравните результаты. Какая регрессия лучше? Объясните смысл наклона регрессии на основе изменения цены при увеличении возраста автомобиля на один год.
Г. Сравните предыдущие результаты с результатами регрессии по отношению к переменной Пробег. Влияет ли пробег на стоимость подержанного автомобиля? Обратите внимание, что пробег автомобиля слабо связан с его возрастом. Возможно, это объясняется тем, что владельцы автомобилей с большим пробегом не стремятся подчеркивать этот факт? Как изменились бы результаты регрессии, если бы в объявлениях публиковались только данные о малом пробеге?
Создайте отчет о полученных результатах. Представьте результаты письменно.
Часть выполненной работы
Для коэффициента 1 Р-значение = 0,008642, что меньше уровня значимости в 5%, следовательно, коэффициент регрессии значим.
Для коэффициента 2 Р-значение = 0,506515, что больше уровня значимости в 5%, следовательно, коэффициент регрессии незначим.
Fф = 15,39466. Определим критическое значение F-критерия FКРИТ = 4,26 (табличное значение)
Поскольку Fф >FКРИТ, то полученное регрессионное уравнение статистически значимо. Т.е. между X (возрастом и пробегом автомобиля) и Y (ценой автомобиля) существует определенная зависимость.
Уравнение статистически значимо, статистически не значим коэффициент 2 перед переменной Пробег.
Можно ли на основании анализа остатков сказать, что предположения о регрессии нарушаются?
Получены следующие графики остатков:
По графику мы видим, что большая часть положительных остатков располагается в области новых и старых автомобилей, а большинство отрицательных остатков – в области средних возрастов. Это может означать искривленный, а не линейный характер зависимости. Причем большое значение остатка соответствует самому последнему наблюдению, без него искривление было бы не так заметно.
На данной диаграмме мы наблюдаем, что дисперсия остатков больше для меньших значений пробега, что также позволяет выявить некоторые проблемы, связанные с допущением о линейном характере взаимосвязи. Диаграмма данного вида, говорит о том, что нарушается допущение о постоянной дисперсии.
Один из методов решения этой проблемы – использовать логарифмический масштаб и повторно выполнить анализ регрессии для логарифмированных значений.
Таким образом, на основании анализа остатков можно сказать, что предположения о линейной регрессии нарушаются.
В. Обратим внимание: один автомобиль намного старше других, и его большой остаток может указывать на то, что это выброс. Выполним новый анализ регрессии без данного наблюдения и сравните результаты.
Вновь вызовем макрофункцию Регрессия: Сервис – Анализ данных – Регрессия:
Введем в качестве переменной Y – величину Цена, а в качестве Х – Возраст и Пробег, исключив из данных автомобиль возрастом 12 лет. Переменные введем вместе с названиями, поэтому поставим флажок – Метки. Укажем в параметрах вывода Новый рабочий лист. Для создания диаграммы остатков поставим флажок – График остатков:
После нажатия пиктограммы Ок макрофункция Регрессия рассчитала все необходимые данные:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,901414
R-квадрат 0,812546
Нормированный R-квадрат 0,765683
Стандартная ошибка 1145,269
Наблюдения 11
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 2 45484116 22742058,15 17,33862 0,001235
Остаток 8 10493134 1311641,712
Итого 10 55977250
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 11796,85 819,3644 14,39756096 5,29E-07 9907,391 13686,31
Возраст -1276,18 263,2811 -4,8472291 0,001276 -1883,31 -669,054
Пробег -0,02195 0,02158 -1,016982 0,338929 -0,07171 0,027817
ВЫВОД ОСТАТКА
Наблюдение Предсказанное Цена Остатки
1 10397,77 1597,233
2 10163,4 -263,401
3 9057,941 -57,941
4 8695,824 -695,824
5 7704,947 -804,947
6 7683 -1683
7 7244,07 1455,93
8 6607,622 -957,622
9 6783,194 516,806
10 4735,601 764,3994
11 3371,633 128,3669
Уравнение регрессии запишется следующим образом:
у = 11796,…
Купить уже готовую работу
Так же вы можете купить уже выполненные похожие работы. Для удобства покупки работы размещены на независимой бирже. Подробнее об условиях покупки тут.