На странице представлен фрагмент
Реши любую задачу с помощью нейросети.
14 16 18 20
ni
8 13 15 15 7 2
Найдем основные характеристики этого распределения.
Средняя выборочная (средняя заработная плата за месяц в т.р.):
xB=1n*xini=160*10*8+12*13+14*15+16*15+18*7+20*2=14.2
Выборочная дисперсия:
DB=1nxi-xB2*ni=160*10-14.22*8+12-14.22*13+14-14.22*15+16-14.22*15+18-14.22*7+20-14.22*2=7.027
Выборочное среднее квадратическое отклонение:
σB=DB=7.027≈2.65
то есть, в среднем разброс заработной платы составляет ±2.65 тыс. рублей от среднего значения 14.2 тыс. рублей.
в) Оценим неизвестные генеральные характеристики.
Генеральное среднее значение:
x≈xB=14.2 т.р.
Генеральная дисперсия:
D≈nn-1*DB=6059*7.027≈7.146
Генеральное среднее квадратическое отклонение:
σ=D=7.146≈2.673 т.р.
г) Доверительный интервал ддля оценки генеральной средней a (среднемесячной заработной платы) с надежностью γ находим по формуле:
xB-t*σn<a<xB+t*σn
По условию задачи n=60; xB=14.2; σ=2.673; γ=0.85. Неизвестный параметр t находим из условия:
2Фt=γ
2Фt=0.85
Фt=0.852
Фt=0.425
t=1.44
Вычислим по этим данным доверительный интервал:
14.2-1.44*2.67360<a<14.2+1.44*2.67360
13.7031<a<14.6969
Таким образом, с вероятностью 85% неизвестная генеральная средняя (математическое ожидание) находится в интервале
13.7031<a=x<14.6969
Длина полуинтервала δ=t*σn=0.497 характеризует точность оценки и называется предельной ошибкой оценки. Оценка тем точнее, чем меньше δ и, следовательно, доверительный интервал становится более узким.
Величина предельной ошибки δ зависит от n, σ и t. Очевидно, что с увеличением объема выборки n предельная ошибка δ уменьшается и, следовательно, точность оценки повышается. При увеличении рассеяния σ предельная ошибка δ увеличивается, то есть оценка делается менее точной. Увеличение надежности γ ведет к росту вспомогательного параметра t и расширению доверительного интервала (надежнее попасть в большой интервал). Это делает оценку менее точной. Таким образом, при повышении надежности оценки ухудшается ее точность.
67. C целью анализа взаимного влияния прибыли предприятия и его издержек выборочно были проведены наблюдения за этими показателями в течение ряда месяцев: X – величина месячной прибыл в т.р., Y – месячные издержки в процентах к объему продаж. Результаты выборки представлены в виде таблицы.
По данным выборки:
а) оценить тесноту линейной связи между признаками X и Y;
б) найти зависимость между признаками в виде уравнения линейной регрессии yx=ax+b;
в) построить графически наблюдаемые выборочные значения признаков и прямую регрессии.
г) используя уравнение линейной регрессии, спрогнозировать величину месячных издержек в процентах к объему продаж, если величина месячной прибыли будет составлять 100 т.р.
X 50 60 70 80 90
Y 26 23 20 18 12
Решение.
По условию имеется n = 5 наблюдений для соответственных значений признаков Х и Y.
Найдем средние значения признаков х и у , а также их средние квадратические отклонения σх и σу по тем же формулам, что и в предыдущей задаче, но с учетом того, что каждое значение признака встречается только один раз, то есть все ni = 1. Вычисления будем вести с точностью до 0,001.
x=xinin=xin=15*50+60+70+80+90=70
y=yinin=yin=15*26+23+20+18+12=995=19.8
xy=xiyin=1550*26+60*23+70*20+80*18+90*12=1320
x2=xi2n=15*502+602+702+802+902=5100
y2=yi2n=15*262+232+202+182+122=414.6
σx=x2-x2=5100-702=200≈14.142
σy=y2-y2=414.6-19.82=22.56≈4.75
а) Оценим тесноту линейной связи по коэффициенту линейной коррелйции r:
r=xy-x*yσx*σy=1320-70*19.814.142*4.75≈-0.98
Так как r<0, то связь обратная, то есть с ростом значений признака X значения признака Y убывают.
Так как r=-0.98=0.98, то по шкале Чаддока, определяем. что линейная связь высокая.
б) Найдем уравнение линейной регрессии, его параметры:
a=xy-x*yσx2=1320-70*19.814.1422=-0.33
b=y-a*x=19.8–0.33*70=42.9
В результате получим, что среднее значение издержек yx связано с величиной прибыли x уравнением:
yx=-0.33x+42.9
в) Изобразим графически данные значения xi;yi в виде точек на плоскости xOy.
Прямую регрессии y=-0.33x+42.9 строим по двум точкам:
x=0:y=42.9
x=100:y=9.9
Получены точки (0; 42.9) и (100; 9.9).
На графике прямая регрессии убывает. Прямая регрессии наилучшим образом приближены ко всем данным точкам, которые расположены вблизи прямой по обе стороны от нее.
г) Используя найденную зависимость, спрогнозируем величину месячных издержек, если месячная прибыль составит 100 т.р.:
y=-0.33*100+42.9
то есть 9.9% к объему продаж.
Часть выполненной работы
ее можно описать линейным уравнение регрессии:
y=-0.33x+42….