Линейный коэффициент корреляции Пирсона: пример решения задачи

 

Задача:

На основании наблюдений за развивающимся сайтом и изменением его средневзвешенной позиции по основным запросам в поисковой системе необходимо проверить, можно ли говорить о линейной зависимости между позицией сайта и числом посетителей.

Исходные данные: X (число посетителей в сутки), Y (усредненная позиция сайта в поисковой системе).

В таблице представлены значения признаков X и Y:

X Y
1 500 5.4
2 790 4.2
3 870 4.0
4 1500 3.4
5 2300 2.5
6 5600 1.0
7 100 6.1
8 20 8.2
9 5 14.6
Читайте также  Алгоритм Литтла - Пример 1

1. На основании исходных данных, приведенных в таблице, расчитаем средние значения для X и Y:
=1298.333=5.489

Все необходимые для расчета коэффициента корреляции промежуточные данные и их суммы представлены в таблице:

X Y X-Xср Y-Yср (Y-Yср)*(X-Xср) (X-Xср)2 (X-Xср)2
1 500 5.4 -798.333 -0.089 71.052 637335.579 0.008
2 790 4.2 -508.333 -1.289 655.241 258402.439 1.662
3 870 4.0 -428.333 -1.489 637.788 183469.159 2.217
4 1500 3.4 201.667 -2.089 -421.282 40669.579 4.364
5 2300 2.5 1001.667 -2.989 -2993.983 1003336.779 8.934
6 5600 1.0 4301.667 -4.489 -19310.183 18504338.979 20.151
7 100 6.1 -1198.333 0.611 -732.181 1436001.979 0.373
8 20 8.2 -1278.333 2.711 -3465.561 1634135.259 7.35
9 5 14.6 -1293.333 9.111 -11783.557 1672710.249 83.01
-37342.667 25370400 128.069
Читайте также  Формулы

2. Рассчитаем ∑[(X-Xср)(Y-Yср)]): ∑[(X-Xср)(Y-Yср)])=-37342.6673. Рассчитаем m*σx и m*σy:

m*σx=5036.904, m*σy=11.317;Коэффициент корреляции Пирсона: rxy=-37342.667/(5036.904×11.317)=-0.655

Оценка коэффициента корреляции Пирсона

Оценим полученное нами эмпирическое значение коэффициента Пирсона, сравнив его с соответствующим критическим значением для заданного уровня значимости из таблицы критических значений коэффициента корреляции Пирсона. При нахождении критических значений для вычисленного коэффициента корреляции Пирсона число степеней свободы рассчитывается как k=m-2. Для выборки с числом элементов m=9 и уровнем значимости p=0.05 критическое значение коэффициента Пирсона rкрит=0.67, с уровнем значимости p=0.01 rкрит=0.8

Читайте также  Абсолютная медиана графа

Так как абсолютное значение, полученного нами коэффициента корреляции меньше критического значения, взятого из таблицы (находится вне зоны значимости), мы принимаем гипотезу H об отсутcтвии корреляционной зависимости между выборками.

Полученный результат свидетельствует об отсутствии линейной зависимости между числом посетителей сайта и его позицией в поисковой системе, однако это не означает, что эти параметры не связаны между собой. Пример расчета коэффициента ранговой корреляции Спирмена для тех же исходных данных

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...