Содержимое

Задача 1.

Имеются данные об уровне рентабельности сельхозпредприятий (Х) и размерах среднемесячной заработной платы работников (Y). Необходимо определить вид корреляционной зависимости между рассматриваемыми признаками на основании эмпирической регрессии, используя исходные данные таблицы 1.

Таблица 1 – Данные о среднемесячной заработной плате работающих и уровне рентабельности предприятия

№ п/п Район Среднемесячная начисленная заработная плата работающих, руб. Уровень рентабельности деятельности сельхозпредприятий, %
1 Александровский 5 460 11,3
2 Андроповский 2 803 6,7
3 Апанасенковский 3 164 13,1
4 Арзгирский 3 892 16,7
5 Благодарненский 2 831 14,8
6 Буденновский 4 831 10,9
7 Георгиевский 3 932 10,4
8 Грачевский 5 584 15,0
9 Изобильненский 3 749 15,3
10 Ипатовский 5 074 15,3
11 Кировский 4 644 12,4
12 Кочубеевский 3 861 17,6
13 Красногвардейский 3 530 43,4
14 Курский 3 395 39,8
15 Левокумский 4 713 6,1
16 Минераловодский 5 620 16,4
17 Нефтекумский 4 003 9,4
18 Новоалександровский 3 475 40
19 Новоселицкий 4 317 7,1
20 Петровский 5 260 6,1
21 Предгорный 3 832 27,6
22 Советский 3 163 2,4
23 Степновский 4 275 9,9
24 Труновский 3 139 15,2
25 Туркменский 5 186 10
26 Шпаковский 5 460 -11,3

Решение

Строим корреляционное поле

На основании графика можем сказать, что особой зависимости между показателями нет.

Проводим сортировку данных

Х У
-11,3 5 460
2,4 3 163
6,1 4 713
6,1 5 260
6,7 2 803
7,1 4 317
9,4 4 003
9,9 4 275
10 5 186
10,4 3 932
10,9 4 831
11,3 5 460
12,4 4 644
13,1 3 164
14,8 2 831
15 5 584
15,2 3 139
15,3 3 749
15,3 5 074
16,4 5 620
16,7 3 892
17,6 3 861
27,6 3 832
39,8 3 395
40 3 475
43,4 3 530

Интервалы для Х

-11,3 -0,36
-0,36 10,58
10,58 21,52
21,52 32,46
32,46 43,4

Интервалы для Y

2803 3366,4
3366,4 3929,8
3929,8 4493,2
4493,2 5056,6
5056,6 5620

Проводим группировку хозяйств

В качестве значения признаков выбираем середину интервалов

Y

X

3084,7 3648,1 4211,5 4774,9 5338,3 Итого
-5,83         1 1
5,11 2   4 1 2 9
16,05 3 3   2 4 12
26,99     1     1
37,93     3     3
Итого 5 3 8 3 7 26

Выборочные средние:

= (-5,83*1 + 5,11(2 + 4 + 1 + 2) + 16,05(3 + 3 + 2 + 4) + 26,99*1 + 37,93*3)/26 = 14,367

= (3084,7(2 + 3) + 3648,1*3 + 4211,5(4 + 1 + 3) + 4774,9(1 + 2) + 5338,3(1 + 2 + 4))/26 = 4298,177

Дисперсии:

σ2x = (-5,832*1 + 5,112(2 + 4 + 1 + 2) + 16,052(3 + 3 + 2 + 4) + 26,992*1 + 37,932*3)/26 – 14,3672 = 116,85

σ2y = (3084,72(2 + 3) + 3648,12*3 + 4211,52(4 + 1 + 3) + 4774,92(1 + 2) + 5338,32(1 + 2 + 4))/26 – 4298,1772 = 651743,12

Откуда получаем среднеквадратические отклонения:

σx = 10,81 и σy = 807,31

и ковариация:

Cov(x,y) = (5,11*3084,7*2 + 16,05*3084,7*3 + 16,05*3648,1*3 + 5,11*4211,5*4 + 26,99*4211,5*1 + 37,93*4211,5*3 + 5,11*4774,9*1 + 16,05*4774,9*2 + -5,83*5338,3*1 + 5,11*5338,3*2 + 16,05*5338,3*4)/26 – 14,367 * 4298,177 = -1039,42

Определим коэффициент корреляции:

Запишем уравнения линий регрессии y(x):

и вычисляя, получаем:

yx = -8,89 x + 4425,97

Задача 2.

Постройте интерполяционную функцию, принимающей в точках x0 = 1, x1 = 3, x2 = 6 заданные значения функции y0 = 11, y1 = 15,8, y2 = 4.

Решение

Составляем полином Лагранжа

Задача 3.

По данным таблицы 2 проведите иерархический агломеративный кластерный анализ.

Таблица 2 – Исходные статистические данные о реализованной сельхозпродукции за 2012 г. в разрезе районов Ставропольского края

Район Реализация зерна сельскохозяйственными предприятиями, тыс т Реализация подсолнечника сельхоз предприятиями, тыс т Реализация картофеля сельхоз предприятиями, т Реализация овощей сельхоз предприятиями, т
Александровский 64,7 4,8 1 162
Андроповский 15,7 1 0 0
Апанасенковский 132,4 0,7 60 940
Арзгирский 84,5 0,5 1 0
Благодарненский 110,5 4 35 133
Буденновский 136,7 1,4 140 301
Георгиевский 92,3 6 8 123
Грачевский 74 3,2 0 5
Изобильненский 78,5 9,4 66 3555
Ипатовский 121,5 4,8 70 734
Кировский 50,2 5,2 0 205
Кочубеевский 127,5 10,5 372 564
Красногвардейский 173,6 17,1 4 22

На первом шаге каждый объект выборки рассматривается как отдельный кластер. Процесс объединения кластеров происходит последовательно: на основании матрицы расстояний.

Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами примем обычное евклидовое расстояние. Тогда согласно формуле:

где l – признаки; k – количество признаков

так как показатели имеют единицы измерения, их необходимо нормировать.

Таблица 3 – Безразмерные показатели

Район Реализация зерна сельскохозяйственными предприятиями, тыс т Реализация подсолнечника сельхоз предприятиями, тыс т Реализация картофеля сельхоз предприятиями, т Реализация овощей сельхоз предприятиями, т
Александровский 0,310 0,259 0,003 0,046
Андроповский 0,000 0,030 0,000 0,000
Апанасенковский 0,739 0,012 0,161 0,264
Арзгирский 0,436 0,000 0,003 0,000
Благодарненский 0,600 0,211 0,094 0,037
Буденновский 0,766 0,054 0,376 0,085
Георгиевский 0,485 0,331 0,022 0,035
Грачевский 0,369 0,163 0,000 0,001
Изобильненский 0,398 0,536 0,177 1,000
Ипатовский 0,670 0,259 0,188 0,206
Кировский 0,218 0,283 0,000 0,058
Кочубеевский 0,708 0,602 1,000 0,159
Красногвардейский 1,000 1,000 0,011 0,006
Курский 0,310 0,259 0,003 0,046

2. Полученные данные помещаем в таблицу (матрицу расстояний).

№ п/п 1 2 3 4 5 6 7 8 9 10 11 12 13
1 0 0,388 0,564 0,291 0,308 0,625 0,190 0,121 1,013 0,436 0,096 1,133 1,013
2 0,388 0 0,801 0,436 0,644 0,860 0,589 0,403 1,215 0,771 0,362 1,375 1,414
3 0,564 0,801 0 1,314 1,098 1,015 1,114 1,249 0,736 0,907 1,220 0,652 1,097
4 0,291 0,436 1,314 0 0,594 0,618 0,588 0,676 0,630 0,447 0,635 0,705 1,001
5 0,308 0,644 1,098 0,594 0 0,801 0,861 0,982 0,620 0,668 0,949 0,605 1,010
6 0,625 0,860 1,015 0,618 0,801 0 1,166 1,302 0,768 0,956 1,274 0,674 1,122
7 0,190 0,589 1,114 0,588 0,861 1,166 0 0,766 0,608 0,501 0,728 0,660 0,992
8 0,121 0,403 1,249 0,676 0,982 1,302 0,766 0 0,681 0,402 0,513 0,782 1,028
9 1,013 1,215 0,736 0,630 0,620 0,768 0,608 0,681 0 0,417 0,565 0,747 1,014
10 0,436 0,771 0,907 0,447 0,668 0,956 0,501 0,402 0,417 0 1,085 0,614 1,046
11 0,096 0,362 1,220 0,635 0,949 1,274 0,728 0,513 0,565 1,085 0 1,001 1,144
12 1,133 1,375 0,652 0,705 0,605 0,674 0,660 0,782 0,747 0,614 1,001 0 0,810
13 1,013 1,414 1,097 1,001 1,010 1,122 0,992 1,028 1,014 1,046 1,144 0,810 0

3. Поиск наименьшего расстояния.

Из матрицы расстояний следует, что объекты 1 и 11 наиболее близки P1,11 = 0,096 и поэтому объединяются в один кластер.

При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №1 и №11.

№ п/п 1,11 2 3 4 5 6 7 8 9 10 12 13
1,11 0 0,362 0,564 0,291 0,308 0,625 0,190 0,121 1,013 0,436 1,001 1,013
2 0,362 0 0,801 0,436 0,644 0,860 0,589 0,403 1,215 0,771 1,375 1,414
3 0,564 0,801 0 1,314 1,098 1,015 1,114 1,249 0,736 0,907 0,652 1,097
4 0,291 0,436 1,314 0 0,594 0,618 0,588 0,676 0,630 0,447 0,705 1,001
5 0,308 0,644 1,098 0,594 0 0,801 0,861 0,982 0,620 0,668 0,605 1,010
6 0,625 0,860 1,015 0,618 0,801 0 1,166 1,302 0,768 0,956 0,674 1,122
7 0,190 0,589 1,114 0,588 0,861 1,166 0 0,766 0,608 0,501 0,660 0,992
8 0,121 0,403 1,249 0,676 0,982 1,302 0,766 0 0,681 0,402 0,782 1,028
9 1,013 1,215 0,736 0,630 0,620 0,768 0,608 0,681 0 0,417 0,747 1,014
10 0,436 0,771 0,907 0,447 0,668 0,956 0,501 0,402 0,417 0 0,614 1,046
12 1,001 1,375 0,652 0,705 0,605 0,674 0,660 0,782 0,747 0,614 0 0,810
13 1,013 1,414 1,097 1,001 1,010 1,122 0,992 1,028 1,014 1,046 0,810 0

Объединяем (1,11) и 8

№ п/п 1,8,11 2 3 4 5 6 7 9 10 12 13
1,8,11 0 0,362 0,564 0,291 0,308 0,625 0,190 0,681 0,402 0,782 1,013
2 0,362 0 0,801 0,436 0,644 0,860 0,589 1,215 0,771 1,375 1,414
3 0,564 0,801 0 1,314 1,098 1,015 1,114 0,736 0,907 0,652 1,097
4 0,291 0,436 1,314 0 0,594 0,618 0,588 0,630 0,447 0,705 1,001
5 0,308 0,644 1,098 0,594 0 0,801 0,861 0,620 0,668 0,605 1,010
6 0,625 0,860 1,015 0,618 0,801 0 1,166 0,768 0,956 0,674 1,122
7 0,190 0,589 1,114 0,588 0,861 1,166 0 0,608 0,501 0,660 0,992
9 0,681 1,215 0,736 0,630 0,620 0,768 0,608 0 0,417 0,747 1,014
10 0,402 0,771 0,907 0,447 0,668 0,956 0,501 0,417 0 0,614 1,046
12 0,782 1,375 0,652 0,705 0,605 0,674 0,660 0,747 0,614 0 0,810
13 1,013 1,414 1,097 1,001 1,010 1,122 0,992 1,014 1,046 0,810 0

Объединяем (1,8,11) и 7

№ п/п 1,7,8,11 2 3 4 5 6 9 10 12 13
1,7,8,11 0 0,362 0,564 0,291 0,308 0,625 0,608 0,402 0,660 0,992
2 0,362 0 0,801 0,436 0,644 0,860 1,215 0,771 1,375 1,414
3 0,564 0,801 0 1,314 1,098 1,015 0,736 0,907 0,652 1,097
4 0,291 0,436 1,314 0 0,594 0,618 0,630 0,447 0,705 1,001
5 0,308 0,644 1,098 0,594 0 0,801 0,620 0,668 0,605 1,010
6 0,625 0,860 1,015 0,618 0,801 0 0,768 0,956 0,674 1,122
9 0,608 1,215 0,736 0,630 0,620 0,768 0 0,417 0,747 1,014
10 0,402 0,771 0,907 0,447 0,668 0,956 0,417 0 0,614 1,046
12 0,660 1,375 0,652 0,705 0,605 0,674 0,747 0,614 0 0,810
13 0,992 1,414 1,097 1,001 1,010 1,122 1,014 1,046 0,810 0

Объединяем (1,7,8,11) и 4

№ п/п 1,4,7,8,11 2 3 5 6 9 10 12 13
1,4,7,8,11 0 0,362 0,564 0,308 0,618 0,608 0,402 0,660 0,992
2 0,362 0 0,801 0,644 0,860 1,215 0,771 1,375 1,414
3 0,564 0,801 0 1,098 1,015 0,736 0,907 0,652 1,097
5 0,308 0,644 1,098 0 0,801 0,620 0,668 0,605 1,010
6 0,618 0,860 1,015 0,801 0 0,768 0,956 0,674 1,122
9 0,608 1,215 0,736 0,620 0,768 0 0,417 0,747 1,014
10 0,402 0,771 0,907 0,668 0,956 0,417 0 0,614 1,046
12 0,660 1,375 0,652 0,605 0,674 0,747 0,614 0 0,810
13 0,992 1,414 1,097 1,010 1,122 1,014 1,046 0,810 0

Объединяем (1,4,7,8,11) и 5

№ п/п 1,4,5,7,8,11 2 3 6 9 10 12 13
1,4,5,7,8,11 0 0,362 0,564 0,618 0,608 0,402 0,605 0,992
2 0,362 0 0,801 0,860 1,215 0,771 1,375 1,414
3 0,564 0,801 0 1,015 0,736 0,907 0,652 1,097
6 0,618 0,860 1,015 0 0,768 0,956 0,674 1,122
9 0,608 1,215 0,736 0,768 0 0,417 0,747 1,014
10 0,402 0,771 0,907 0,956 0,417 0 0,614 1,046
12 0,605 1,375 0,652 0,674 0,747 0,614 0 0,810
13 0,992 1,414 1,097 1,122 1,014 1,046 0,810 0

Объединяем (1,4,5,7,8,11) и 2

№ п/п 1,4,5,7,8,11 3 6 9 10 12 13
1,4,5,7,8,11 0 0,564 0,618 0,608 0,402 0,605 0,992
3 0,564 0 1,015 0,736 0,907 0,652 1,097
6 0,618 1,015 0 0,768 0,956 0,674 1,122
9 0,608 0,736 0,768 0 0,417 0,747 1,014
10 0,402 0,907 0,956 0,417 0 0,614 1,046
12 0,605 0,652 0,674 0,747 0,614 0 0,810
13 0,992 1,097 1,122 1,014 1,046 0,810 0

Объединяем (1,2,4,5,7,8,11) и 10

№ п/п 1,4,5,7,8,10,11 3 6 9 12 13
1,4,5,7,8,10,11 0 0,564 0,618 0,608 0,605 0,992
3 0,564 0 1,015 0,736 0,652 1,097
6 0,618 1,015 0 0,768 0,674 1,122
9 0,608 0,736 0,768 0 0,747 1,014
12 0,605 0,652 0,674 0,747 0 0,810
13 0,992 1,097 1,122 1,014 0,810 0

Объединяем (1,2,4,5,7,8,10,11) и 3

№ п/п 1,3,4,5,7,8,10,11 6 9 12 13
1,3,4,5,7,8,10,11 0 0,618 0,608 0,605 0,992
6 0,618 0 0,768 0,674 1,122
9 0,608 0,768 0 0,747 1,014
12 0,605 0,674 0,747 0 0,810
13 0,992 1,122 1,014 0,810 0

Объединяем (1,2,3,4,5,7,8,10,11) и 12

№ п/п 1,3,4,5,7,8,10,11 6 9 13
1,3,4,5,7,8,10,11 0 0,618 0,608 0,810
6 0,618 0 0,768 1,122
9 0,608 0,768 0 1,014
13 0,810 1,122 1,014 0

Объединяем (1,2,3,4,5,7,8,10,11,12) и 9

№ п/п 1,3,4,5,7,8,9,10,11 6 13
1,3,4,5,7,8,9,10,11 0 0,618 0,810
6 0,618 0 1,122
13 0,810 1,122 0

Объединяем (1,2,3,4,5,7,8,9,10,11,12) и 6

№ п/п 1,3,4,5,7,8,9,10,11 13
1,3,4,5,7,8,9,10,11 0 0,810
13 0,810 0

Таким образом, при проведении кластерного анализа по принципу “ближнего соседа” получили два кластера, расстояние между которыми равно P=0,810

Задача 4.

Для парного уравнения регрессии, аппроксимированного на основе степенной функции для девяти наблюдений, известны следующие значения сумм: ∑lgx = 15, ∑(lgx)2 = 85, ∑lgy × lgx = 125, ∑lgy = 58, ∑(lgy)2 = 120. Определите параметры уравнения регрессии.

Решение

Степенная регрессия

Линеаризация

Система МНК для линейной регрессии

После замены

После алгебраических преобразований

Задача 5.

Рассчитайте t-критерий Стьюдента для параметра a0 уравнения парной регрессии равного 16,4, если известно, что число узловых точек равно 14, среднее квадратичное отклонение факторного признака — 2,6; общая дисперсия результативного признака — 3,9, остаточная дисперсия — 1,2. Дайте характеристику значимости параметра.

Решение

Стандартная ошибка

Значение неизвестно, определить ошибку невозможно.

Стандартная ошибка

Фактическое значение t-критерия

Табличное значение 2,16, расчетное значение выше, параметр значим.

Задача 6.

По данным о внутригодовой динамике изменения индексов физического объема продукции животноводства (таблица 3), построить уравнение Фурье по первой и второй гармоникам; оценить их статистическую значимость и сделать вывод о наиболее приемлемой форме модели для оценки сезонных колебаний анализируемого показателя.

Таблица 3 – Индексы физического объема продукции животноводства в регионе в 2012 г.

Месяц года Индексы Y, % Месяц года Индексы Y, %
1 96,9 7 101,4
2 89,9 8 106,5
3 91,4 9 98,0
4 95,0 10 98,4
5 98,8 11 103,1
6 102,6 12 105,2

Решение

Для построения уравнения Фурье по первой гармонике и оценки его статистической корректности составим табл.:

Таблица 4

месяцы Y T cos t sin t Yt(1) (YtYt1)2
1 96,9 0 1,00 0,00 96,90 0,00 95,97 0,86 4,13 0,0096
2 89,9 π/6 0,87 0,50 77,86 44,95 94,50 21,14 81,60 0,0511
3 91,4 π/3 0,50 0,87 45,70 79,15 94,21 7,91 56,75 0,0308
4 95 π/2 0,00 1,00 0,00 95,00 95,19 0,04 15,47 0,0020
5 98,8 2π/3 -0,50 0,87 -49,40 85,56 97,18 2,64 0,02 0,0164
6 102,6 5π/6 -0,87 0,50 -88,85 51,30 99,63 8,83 13,44 0,0290
7 101,4 π -1,00 0,00 -101,40 0,00 101,90 0,25 6,08 0,0049
8 106,5 7π/6 -0,87 -0,50 -92,23 -53,25 103,37 9,80 57,25 0,0294
9 98 4π/3 -0,50 -0,87 -49,00 -84,87 103,65 31,96 0,87 0,0577
10 98,4 3π/2 0,00 -1,00 0,00 -98,40 102,67 18,26 0,28 0,0434
11 103,1 5π/3 0,50 -0,87 51,55 -89,29 100,69 5,80 17,36 0,0234
12 105,2 11π/6 0,87 -0,50 91,11 -52,60 98,24 48,47 39,27 0,0662
Всего 1187,2     -17,77 -22,44 1187,20 155,97 292,55 0,36

Общий вид уравнения Фурье по первой гармонике имеет следующий вид:

t = a0 + a1 × cos t + b1 × sin t.

Для оценки параметров уравнения Фурье введем условное обозначение времени t в графе 3.

Определим величину прироста переменной t как

Для определения параметров a0, a1, b1 будем использовать формулы:

Для определения параметров a0 найдем сумму Yt.

Расчет сумм произведений осуществим таблично.

После этого рассчитаем значения параметров a1 и b1:

Таким образом, уравнение Фурье по первой гармонике имеет вид:

В соответствии с ним определим теоретическое значение ряда динамики и отобразим в таблице

Оценку тесноты связи проводят с помощью индекса корреляции:

В соответствии со шкалой Чеддока связь между факторами по модели можно охарактеризовать как умеренную.

На основании полученного значения индекса корреляции рассчитаем значение коэффициента детерминации:

R2 = (R)2 = (0,98)2 = 0,47.

Таким образом, полученная модель уравнения Фурье позволила объяснить изменение стоимости производимой продукции предприятием от сезонных колебаний на 47%.

В заключение необходимо проверить статистическое значение полученной модели в целом. Для этого необходимо рассчитать значение F-критерия Фишера по формуле:

F=3,94

Так как для полученной модели F-критерий больше табличного, то можно сделать вывод, что она является статистически значимой.

Расчет средней ошибки аппроксимации осуществляется по формуле:

Для построения уравнения Фурье по второй гармонике и оценки его статистической корректности составим табл. 6.3.

Таблица 6.3

Месяц Y T cos 2t sin 2t Yt × cos 2t Yt × sin 2t Yt(2) (YtYt2)2 (YtYt)2
1 96,9 0 1,00 0,00 96,90 0,00 97,86 0,93 4,13 0,0099
2 89,9 π/6 0,50 0,87 44,95 77,86 77,52 153,30 81,60 0,1377
3 91,4 π/3 -0,50 0,87 -45,70 79,15 75,34 257,85 56,75 0,1757
4 95 π/2 -1,00 0,00 -95,00 0,00 93,30 2,88 15,47 0,0179
5 98,8 2π/3 -0,50 -0,87 -49,40 -85,56 114,15 235,77 0,02 0,1554
6 102,6 5π/6 0,50 -0,87 51,30 -88,85 118,50 252,80 13,44 0,1550
7 101,4 π 1,00 0,00 101,40 0,00 103,79 5,70 6,08 0,0235
8 106,5 7π/6 0,50 0,87 53,25 92,23 86,39 404,43 57,25 0,1888
9 98 4π/3 -0,50 0,87 -49,00 84,87 84,78 174,70 0,87 0,1349
10 98,4 3π/2 -1,00 0,00 -98,40 0,00 100,78 5,67 0,28 0,0242
11 103,1 5π/3 -0,50 -0,87 -51,55 -89,29 117,67 212,29 17,36 0,1413
12 105,2 11π/6 0,50 -0,87 52,60 -91,11 117,11 141,82 39,27 0,1132
1187,2     11,35 -20,70 1187,20 1848,13 292,55 1,28

Общий вид уравнения Фурье по второй гармонике имеет следующий вид:

t = a0 + a1 × cos t + b1 × sin t + a2 × cos t + b2 × sin t.

Для определения параметров a2 и b2 будем использовать формулы:

Расчет сумм произведений осуществим таблично.

После этого рассчитаем значения параметров a2 и b2:

Таким образом, уравнение Фурье по второй гармонике имеет вид:

В соответствии с ним определим теоретическое значение ряда динамики и отобразим в таблице.

Оценку тесноты связи проводят с помощью индекса корреляции:

В соответствии со шкалой Чеддока связь между факторами по модели можно охарактеризовать как сильную.

На основании полученного значения индекса корреляции рассчитаем значение коэффициента детерминации:

R2 = (R)2 = (0,886)2 = 0,784.

Таким образом, полученная модель уравнения Фурье позволила объяснить изменение стоимости производимой продукции предприятием от сезонных колебаний на 78,4%.

В заключение необходимо проверить статистическое значение полученной модели в целом. Для этого необходимо рассчитать значение F– критерия Фишера по формуле:

F=6,36.

Так как полученная модель F -критерия больше табличного, то можно сказать, что полученная модель статистически значима.

Расчет средней ошибки аппроксимации осуществляется по формуле:

В соответствии с величиной ошибки аппроксимации можно сделать вывод о том, что ни одна из моделей не подходит для оценки сезонных колебаний анализируемого показателя.

 

Доступа нет, контент закрыт

Доступа нет, контент закрыт

Доступа нет, контент закрыт

Был ли этот материал полезен для Вас?

Комментирование закрыто.