Вы на НеОфициальном сайте факультета ЭиП

На нашем портале ежедневно выкладываются материалы способные помочь студентам. Курсовые, шпаргалки, ответы и еще куча всего что может понадобиться в учебе!
Главная Контакты Карта сайта
 
Где мы?
» » » Численные методы обработки информации

Реклама


Численные методы обработки информации

Просмотров: 4211 Автор: Angel
Задание
Дан вариант исходных данных(Таб. 1), в варианте приведены данные (размер выборки равен 18) об одном из 20-ти потребительских расходов населения США за 18 лет. 

Таб.1- Вариант исходных данных
Вариант=24  
Вариант 24  
76,2 79,3 79,3 81 79,1 80,8 83 85,6 88,3 90,2 93,6 99,5 100 114,8 182,4 197,4 212 239,9
71,9 72,6 73,7 74,8 75,9 77,2 79,4 81,4 84,6 88,4 92,5 96,5 100 105,7 116,3 125,2 131,7 139,3
5 4,7 4,7 4,9 5,2 5,5 5,6 5,6 5,3 5 4,7 4,6 5 5,4 2,4 4,2 4,6 4,4
489,7 503,8 524,9 542,3 580,8 616,3 646,8 673,5 701,3 722,5 751,6 779,2 810,3 865,3 858,4 875,8 906,8 942,9
106,0 109,2 107,6 108,3 104,2 104,7 104,5 105,2 104,4 102,0 101,2 103,1 100,0 108,6 156,8 157,7 161,0 172,2

Потребительские расходы (рис.1) нужны для того чтобы суметь объяснить вид и полученное качество исследуемой зависимости. Вид потребительских расходов по данному варианту соответствует вид №4-моторное масло (максимальное число, которое делится на 20 без остатка равно 20 и тогда остается 24–20=4).
Во второй и третьей строках варианта (см. Таб. 1) представлены дефляторы цен для совокупных личных расходов (строка 2) и соответствующего вида (№4. т.е. расходов на моторное масло) потребительских расходов (строка 3). 
Эти ряды в форме индекса (1972=100%) показывают, как росли цены во времени. С помощью этих рядов построен параметр –относительный индекс цены товара в процентах (строка 6 в варианте исходных данных, т.е. индекс, показывающий, происходило ли изменение цены на товар более или менее быстрыми темпами, чем общий рост цен. 
Именно такая относительная цена товара, а не его номинальная цена, определяет спрос на этот товар.
В четвертой и пятой строках варианта (см. Таб. 1) представлены соответственно величина потребительских расходов населения США на данный товар и личного располагаемого дохода.
С помощью этих данных необходимо провести анализ. А именно:
1. Статистический анализ связей
a. Корреляционный анализ
b. Регрессионный анализ
2. Статистические методы прогнозирования экономических показателей
a. Исследование данных на наличие автокорреляции
b. Использование в прогнозировании ряда Фурье
c. Рассчитать доверительные интервалы прогноза по уравнению линейного тренда и параболы второй степени
3. Исследование данных на наличие гетероскедастичности
4. Получение прогноза значений на 2 года
5. Мультиколеарность
6. Критерии Гравса
Размер выборки равен 18, но для проведения анализа используется только 16 значений, другие оставшиеся 2 значения используются для проверки прогноза, проводимого на 2 года вперед. Анализ и обработка данных проводилась в системе Mathcad 13 и в Microsoft Office Excel 2003.
 
Статистический анализ связей
 
Вывод: 
На основание полученных данных были построены графики зависимости между расходами населения на данный товар (y) и доходом (I), а также расходами и ценой (P). По графикам видно, что с ростом цены на моторное масло расходы населения на данный вид товара снижаются. Что касается графика дохода, то в данном случае функция является тоже убывающей, то есть с уменьшением дохода, расходы населения на моторное масло падает.
Коэффициенты детерминации RI и RP составили соответственно 0,613 и 0,133. Это значит, что малая доля расходов (y) – 61% и 13% – объясняется за счет учтенных признаков (I и P).
Следующим этапом анализа является проведение множественной регрессии. Сначала с помощью метода наименьших квадратов были получены коэффициенты линейного уравнения множественной регрессии:
y=a0 + a1*P + a2*I.
Данные коэффициенты составили: a0 = 8.553; a1 = -0,033; a2 = 2.872*10^-3.
Также как и для парной регрессии, была проведена проверка значимости уравнения. Использовался критерий Фишера. Расчетное значение критерия более чем в 4 раза превысило табличное, что дает право утверждать, что доля вариации, обусловленная регрессией, намного превышает случайную ошибку.
 
Статистические методы прогнозирования экономических показателей
После определения уравнений парной и множественной регрессии и построения графиков необходимо проверить исходные данные на наличие автокорреляции остатков, т.е. на наличие корреляционной зависимости между значениями остатков за текущий и предыдущий моменты времени. При необходимости следует избавиться от автокорреляции.
Проверка на автокорреляцию осуществляется с помощью критерия Дарбина-Уотсона, который определяется по формуле:
 
 При к=1..4, d=3.196. При к=1..6, d=3.351
 
 При к=1..7, d=3.75. При к=1..8, d=3.75
 
Условие отсутствия автокорреляции заключается в том, что величина DW должна лежать в промежутке от 1,5 до 2,5. Использование в качестве уравнения тренда полинома третьей степени позволило повысить значение коэффициента Дарбина-Уотсона с 1,773 до 2.731. Можно было и не повышать значение коэффициента, тк 1,773 попадает в промежуток, что автокорреляция отсутствует.
Выполнение второго этапа – использования в прогнозировании ряда Фурье позволило повысить значение критерия Дарбина-Уотсона до 3,031, а следовательно, коэффициент улучшился!
Интересен тот факт, что при k=1..7 и k=1..8, значение d=3.75, те одинаково, зато при k=1..9 (d=3.351) и тд, значение d уменьшается!!!
 
Исследование данных на наличие гетероскедастичности
Следующим этапом в исследовании данных является их проверка на гетероскедастичность. Для этой цели было применен критерий Спирмена. Тест Спирмена проводился для двух параметров I – дохода и P – цены. В общем виде коэффициент ранговой корреляции для критерия Спирмена выглядит следующим образом:

где di – разность между рангом x и рангом e.
 
Для параметра I коэффициент ранговой корреляции составил -0,215, а тестовая статистика -0,832. Согласно полученным значениям можно принять нулевую гипотезу об отсутствии гетероскедастичности, поскольку тестовая статистика попадает в интервал от -2,58 до 2,58, установленный для уровня значимости 1%.
Для параметра P коэффициент ранговой корреляции составил -0,067, а тестовая статистика -0,259. В данном случае также можно принять нулевую гипотезу об отсутствии гетероскедастичности, поскольку тестовая статистика попадает в интервал от -2,58 до 2,58, установленный для уровня значимости в 1%.
 
Получение прогноза значений на 2 года
Построение прогноза для 17 и 18 значения исходных данных (на 2 года).
 
На графике изображен результат значений прогнозирование. Зелеными точками отмечено значение 17 и 18. Для 17 значение получилось 4,47, а для 18 значение 4,447. Сравним их с исходными данными. Исходные данные равны для 17=4,6 и 18=4,4. Итак, 17-ое и 18-ое значение фактически равны с реальными данными. Прогноз оказался, как мы видим почти точным, с небольшими, даже очень малыми погрешностями для 17-го погрешность равна 0,13, а для 18-го погрешность равна -0,047. Можно считать что показатели хорошие.
 
Мультиколеарность

y(спрос) I(доходы) P(индекс цены) y-p* y1
   
5 489,7 105,9805285 8,51687 5,040257
4,7 503,8 109,2286501 8,32466 4,932786
4,7 524,9 107,5983718 8,27056 4,987358
4,9 542,3 108,2887701 8,49347 4,964837
5,2 580,8 104,2160738 8,65832 5,100847
5,5 616,3 104,6632124 8,97316 5,086803
5,6 646,8 104,534005 9,06887 5,091773
5,6 673,5 105,1597052 9,08964 5,071606
5,3 701,3 104,3735225 8,76355 5,098317
5 722,5 102,0361991 8,38599 5,176353
4,7 751,6 101,1891892 8,05788 5,205112
4,6 779,2 103,1088083 8,02158 5,142028
5 810,3 100 8,31842 5,245887
5,4 865,3 108,6092715 9,00411 4,961425
2,4 858,4 156,8357696 7,60446 3,360916
4,2 875,8 157,6677316 9,43207 3,333697

Корреляция P(цены) от I (дохода)= 0,470334
Корреляция y1 от y= 0,782701
Регрессионная статистика  
Множественный R 0,786  
R-квадрат 0,61  
Нормированный R-квадрат 0,58  
Стандартная ошибка 0,49  
Наблюдения 16  
   
Дисперсионный анализ  
  df SS MS F Значимость F  
Регрессия 1 5,39 5,39 22,14 0,00  
Остаток 14 3,41 0,24  
Итого 15 8,80  
   
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 8,56 0,80 10,76 0,00 6,85 10,27 6,85 10,27
Переменная X 1 -0,03 0,01 -4,71 0,00 -0,05 -0,02 -0,05 -0,02

ВЫВОД ОСТАТКА 
  
Наблюдение Предсказанное Y Остатки
1,00 5,04 -0,04
2,00 4,94 -0,24
3,00 4,99 -0,29
4,00 4,97 -0,07
5,00 5,10 0,10
6,00 5,09 0,41
7,00 5,09 0,51
8,00 5,07 0,53
9,00 5,10 0,20
10,00 5,18 -0,18
11,00 5,20 -0,50
12,00 5,14 -0,54
13,00 5,24 -0,24
14,00 4,96 0,44
15,00 3,36 -0,96
16,00 3,33 0,87

ВЫВОД ИТОГОВ  
   
Регрессионная статистика  
Множественный R 0,01  
R-квадрат 0,00  
Нормированный R-квадрат -0,07  
Стандартная ошибка 0,49  
Наблюдения 16,00  
   
Дисперсионный анализ  
  df SS MS F Значимость F  
Регрессия 1,00 0,00 0,00 0,00 0,98  
Остаток 14,00 3,41 0,24  
Итого 15,00 3,41  
   
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 8,55 0,67 12,78 0,00 7,11 9,98 7,11 9,98
Переменная X 1 0,00 0,00 0,02 0,98 0,00 0,00 0,00 0,00

ВЫВОД ОСТАТКА 
  
Наблюдение Предсказанное Y Остатки
1,00 8,56 -0,04
2,00 8,56 -0,23
3,00 8,56 -0,29
4,00 8,56 -0,06
5,00 8,56 0,10
6,00 8,56 0,41
7,00 8,56 0,51
8,00 8,56 0,53
9,00 8,56 0,20
10,00 8,56 -0,18
11,00 8,56 -0,51
12,00 8,56 -0,54
13,00 8,56 -0,25
14,00 8,57 0,44
15,00 8,57 -0,96
16,00 8,57 0,87


ВЫВОД ИТОГОВ  
   
Регрессионная статистика  
Множественный R 0,78  
R-квадрат 0,61  
Нормированный R-квадрат 0,55  
Стандартная ошибка 0,51  
Наблюдения 16,00  
   
Дисперсионный анализ  
  df SS MS F Значимость F  
Регрессия 2,00 5,39 2,69 10,28 0,00  
Остаток 13,00 3,41 0,26  
Итого 15,00 8,80  
   
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 8,55 0,89 9,59 0,00 6,63 10,48 6,63 10,48
Переменная X 1 0,00 0,00 0,03 0,98 0,00 0,00 0,00 0,00
Переменная X 2 -0,03 0,01 -4,01 0,00 -0,05 -0,02 -0,05 -0,02

ВЫВОД ОСТАТКА 
  
Наблюдение Предсказанное Y Остатки
1,00 5,04 -0,04
2,00 4,93 -0,23
3,00 4,99 -0,29
4,00 4,96 -0,06
5,00 5,10 0,10
6,00 5,09 0,41
7,00 5,09 0,51
8,00 5,07 0,53
9,00 5,10 0,20
10,00 5,18 -0,18
11,00 5,21 -0,51
12,00 5,14 -0,54
13,00 5,25 -0,25
14,00 4,96 0,44
15,00 3,36 -0,96
16,00 3,33 0,87

Так как связь не большая, то мультиколиарности нет, 0,470
 


Информация

Комментировать статьи на нашем сайте возможно только в течении 60 дней со дня публикации.

Популярные новости

Статистика сайта






 
Copyright © НеОфициальный сайт факультета ЭиП