Решение задач по эконометрике.

По 20 предприятиям региона (см. табл.) изучается зависимость выработки продукции на одного работника У (тыс. руб.) от ввода в действие новых основных фондов Х1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих Х2 (%).

Требуется:

  • 1. Построить диаграммы рассеяния выработки продукции на одного работника У (тыс. руб.) в зависимости от ввода в действие новых основных фондов Х1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих Х2 (%) и определить форму связи между результирующим показателем (У) и каждым их факторов (Х1 и Х2).
  • 2. Рассчитать основные статистические характеристики по каждому показателю и найти коэффициенты вариации. Сделать выводы об однородности совокупности по данным переменным.
  • 3. Рассчитать матрицу парных и частных коэффициентов корреляции и сделать выводы о целесообразности включения факторов Х1 и Х2 в модель.
  • 4. Оценить с помощью МНК параметры линейного регрессионного уравнения У от Х1 и Х2 (применив пакет анализа).
  • 5. Рассчитать значение коэффициента детерминации, коэффициенты эластичности и среднюю ошибку аппроксимации и интерпретировать их.
  • 6. Проверить значимость полученного уравнения регрессии на уровне 0,05. Найти 95% доверительные интервалы для значимых коэффициентов регрессии.
  • 7. Построить прогноз Y* по уравнению регрессии, приняв прогнозные значения Х1 и Х2 равными 80% от их максимального значения.

Вариант 9

предприятия

  • 2. Так как коэффициент вариации по каждой переменной не превышает 33 % (коэффициент вариации Y равен 24,957; коэффициент вариации X1 равен 30,528; коэффициент вариации X2 равен 29,783), то можно сделать вывод, что по всем переменным наблюдается однородность данных и по ним можно проводить анализ.
  • 3. Исходя из рассчитанной матрицы парных и частных коэффициентов корреляции (приведены в приложении), можно сделать вывод о том, что ввод в действие новых основных фондов Х1 и удельный вес рабочих высокой квалификации в общей численности рабочих Х2 тесно связаны с выработки продукции на одного работника У, а также Х1 и Х2 тесно связаны между собой, следовательно наблюдается явление мультиколлинеарности, поэтому оба этих фактора в модель включать нельзя.
  • 4. Применив пакет анализа, получилось следующее уравнение модели:

у=1,864+0,906*х1+0,098*х2; график остатков по обоим переменным показывает отсутствие зависимости в остатках.

5. По данной модели коэффициент детерминации равен 0,952, следовательно, в данной модели существует весьма тесная связь с результатом (объясняет 95,2 % разброса Y); коэффициенты эластичности (Эх1=1,403 и Эх2=0,041) показывают, что выработка продукции на одного работника увеличивается в среднем на 1,40 % при увеличении ввода действия новых основных фондов на 1 % и увеличивается на 0,04 % при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1 %. Следовательно, наибольшее влияние на выработку продукции на одного работника оказывает действие новых основных фондов.

Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, так как средняя ошибка аппроксимации не превышает 10 %.

6. Так как, F-критерий Фишера по модели равен 169,411, что больше табличного значения (4,41), то модель является значимой, то есть, вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5 %.

По построенной модели оказался незначимым коэффициент при Х2 (удельный вес рабочих высокой квалификации в общей численности рабочих), поскольку этот фактор является неинформативным, поэтому для построения более качественной модели необходимо исключить этот фактор.

После исключения фактора Х2, уравнение модели приняло вид:

у=1,037+1,393*х.

Коэффициент детерминации при этом равен 0,934 и F-критерий Фишера равен 271,429.

Прогноз по данной модели: если взять 80 % от максимального значения Х1 (9,5), то прогнозное значение выработки продукции на одного работника составляет 11,625 тысяч рублей.

Пример . По 20 предприятиям региона изучается зависимость выборки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%).

Номер предприятия y Номер предприятия y
7,0 3,9 10,0 9,0 6,0 21,0
7,0 3,9 14,0 11,0 6,4 22,0
7,0 3,7 15,0 9,0 6,8 22,0
7,0 4,0 16,0 11,0 7,2 25,0
7,0 3,8 17,0 12,0 8,0 28,0
7,0 4,8 19,0 12,0 8,2 29,0
8,0 5,4 19,0 12,0 8,1 30,0
8,0 4,4 20,0 12,0 8,5 31,0
8,0 5,3 20,0 14,0 9,6 32,0
10,0 6,8 20,0 14,0 9,0 36,0

Требуется:

1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессия и средних коэффициентов эластичности ранжировать факторы по степени их влияния результатов.

2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3.

4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5. С помощью частных F-критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6.

Решение:

Найдем средние квадратические отклонения признаков:

1. Вычисление параметров линейного уравнения множественной регрессии.

Для нахождения параметров линейного уравнения множественной

регрессии

необходимо решить следующую систему линейных уравнений относительно неизвестных параметров

Либо воспользоваться готовыми формулами:

Рассчитаем сначала парные коэффициенты корреляции:

Таким образом получили следующие уравнение множественной регрессии:

Коэффициенты и стандартизованного уравнения регрессии ,

находятся по формулам:

;

.

Т.е. уравнение будет выглядеть следующим образом:

Так как стандартизованные коэффициенты регрессии можно сравнить между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большое влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

Вычисляем:

Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,61 % или 0,20% соответственно. Таким образом, подтверждается большее влияние на результат y фактора x 1 , чем фактора x 2 .

2. Коэффициенты парной корреляции мы уже нашли:

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы х х и х 2 явно коллинеарны, т.к. ). При такой сильной

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:

где

Определитель матрицы парных коэффициентов корреляции;

Определитель матрицы межфакторной корреляции.

Коэффициент множественной корреляции

Аналогичный результат получим при использовании других формул:

Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.

3. Нескорректированный коэффициент множественной

детерминации = 0,947 оценивает долю вариации результата за счет

представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами - на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 94%) детерминированность результата у в модели факторами х 1 и х 2 .

4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F -критерий Фишера:

В нашем случае фактическое значение F-критерия Фишера:

Получили, что > (при n = 20), т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

5. С помощью частных F-критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:

;

.

Найдем и .

;

.

Получили, что . Следовательно, включение в

модель фактора x 2 после того, как в модель включен фактор x 1 статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака x 2 оказывается незначительным, несущественным; фактор х 2 включать в уравнение после фактора х 1 не

Если поменять первоначальный порядок включения факторов в модель

и рассмотреть вариант включения x 1 после х 2 , то результат расчета частного F -критерия для х 1 будет иным. , т.е. вероятность его

случайного формирования меньше принятого стандарта а = 0,05 (5%). Следовательно, значение частного F -критерия для дополнительно включенного фактора x 1 не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора x 1 является существенным. Фактор x 1 должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора x 2 .

6. Общий вывод состоит в том, что множественная модель с факторами x 1 и х 2 с =0,947 содержит неинформативный фактор х 2 . Если исключить фактор х 2 , то можно ограничиться уравнением парной регрессии:

.

Варианты индивидуальных заданий

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника у (тыс. руб.) от ввода в действие новых

основных фондов х, (% от стоимости фондов на конец года) и от удельного

веса рабочих высокой квалификации в общей численности рабочих x 2 (%) (смотри таблицу своего варианта).

Требуется:

1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2. Найти коэффициенты парной частной и множественной корреляции. Проанализировав их.

3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4. С помощью F- критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5. С помощью частных F - критериев Фишера оценить целесообразность включения в управление множественной регрессии фактора x 1 после x 2 и фактора x 2 после x 1 .

6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Вариант 1

Номер предприятия y Номер предприятия y
3,6 6,3
3,6 6,4
3,6
4,1 7,5
3,9 7,9
4,5 8,2
5,3
5,3 8,6
5,6 9,5
6,8

Вариант 2

Номер предприятия y x 1 x 2 Номер предприятия y x 1 x 2
3,5 6,3
3,6 6,4
3,9
4,1 7,5
4,2 7,9
4,5 8,2
5,3 8,4
5,3 8,6
5,6 9,5
Вариант 3
Номер предприятия y x 1 x 2 Номер предприятия y x 1 x 2
3,7 6,3
3,7 6,4
3,9 7,2
4,1 7,5
4,2 7,9
4,9 8,1
5,3 8,4
5,1 8,6
5,6 9,5
6,1 9,5
Вариант 4
Номер предприятия y x 1 x 2 Номер предприятия y x 1 x 2
3,5 6,3
3,6 6,5
3,9 7,2
4,1 7,5
4,2 7,9
4,5 8,2
5,3 8,4
5,5 8,6
5,6 9,5
6,1 9,6

Вариант 5

Номер предприятия y Номер предприятия y
3,6 6,3
3,6 6,8
3,7 7,2
4,1 7,9
4,3 8,1
4,5 8,3
5,4 8,4
5,5 8,8
5,8 9,6
6,1 9,7

ГОУ ВПО «Санкт-Петербургская академия управления и экономики»

Контрольная работа по дисциплине

«Эконометрика»

Вариант № 1

Выполнила студентка 4 курса

Факультета экономики и финансов

Специальность Финансы и кредит

Группа № 14-35335

Колыванова А.В.

Проверила преподаватель

Золотарев А. А.

Пикалево 2010

Задача 1
.
По территориям региона приводятся данные за 199X г.


Номер региона

Среднедушевой прожиточный минимум в день одного трудоспособного, руб.,

Среднедневная заработная плата, руб.,

1

81

124

2

77

131

3

85

146

4

79

139

5

93

143

6

100

159

7

72

135

8

90

152

9

71

127

10

89

154

11

82

127

12

111

162

Требуется:

Решение


















1

81

124

10044

6561

15376

133

- 9

7,2

2

77

131

10087

5929

17161

129

- 2

1,5

3

85

146

12410

7225

21316

136

- 10

6,8

4

79

139

10981

6241

19321

131

- 8

5,7

5

93

143

13299

8649

20449

144

- 1

0,7

6

100

159

15900

10000

25281

157

- 2

1,2

7

72

135

9720

5184

18225

124

- 11

8,1

8

90

152

13680

8100

23104

141

- 11

7,2

9

71

127

9017

5041

16129

123

- 4

3,1

10

89

154

13706

7921

23716

140

- 14

9,1

11

82

127

10414

6724

16129

134

7

5,5

12

111

162

17982

12321

26244

161

- 1

0,6

Итого

1030

1699

147240

89896

242451

1653

- 66

56,7

Среднее значение

85,9

141,6

12270

7491,3

20204,25





2,8



10,60

12,4















112,5

153,7













=

Получено уравнение регрессии:

С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб.


    1. Тесноту линейной связи оценит коэффициент корреляции:

Это означает, что 81% вариации заработной платы () объясняется вариацией фактора – среднедушевого прожиточного минимума.

Качество модели определяет средняя ошибка аппроксимации:

Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как

То уравнение регрессии признается статистически значимым.

Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.

Табличное значение -критерия для числа степеней свободы и составит .

Определим случайные ошибки , , :

Фактические значения -статистики превосходят табличное значение:

Поэтому параметры , и не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя:

Доверительные интервалы

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.


  1. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
тогда прогнозное значение заработной платы составит:

    1. Ошибка прогноза составит:

Предельная ошибка прогноза, которая в случаев не будет превышена, составит:

Доверительный интервал прогноза:

Выполненный прогноз среднемесячной заработной платы является надежным () и находится в пределах от 131,23руб. до 163,37руб.


  1. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую:
D .2. Множественная регрессия и корреляция

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%)


Номер предприятия







Номер предприятия







1

6

3,6

9

11

9

6,3

21

2

6

3,6

12

12

11

6,4

22

3

6

3,9

14

13

11

7

24

4

7

4,1

17

14

12

7,5

25

5

7

3,9

18

15

12

7,9

28

6

7

4,5

19

16

13

8,2

30

7

8

5,3

19

17

13

8

30

8

8

5,3

19

18

13

8,6

31

9

9

5,6

20

19

14

9,5

33

10

10

6,8

21

20

14

9

36
  • ID: 51823
  • 17 страниц

Список литературы

Ситуационная (практическая) задача № 1

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от удельного веса рабочих высокой квалификации в общей численности рабочих x1 (% от стоимости фондов на конец года) и от ввода в действие новых основных фондов x2 (%).

Номер предприятия

Номер предприятия

Требуется:

1. Построить корреляционное поле между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации. Выдвинуть гипотезу о тесноте и виде зависимости между показателями X1 и Y.

2. Оценить тесноту линейной связи между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации с надежностью 0,9.

4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы.

6. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих.

8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы.

9. Найти коэффициенты парной и частной корреляции. Проанализировать их.

10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9.

12. Дать точечный и интервальный прогноз с надежностью 0,9 выработки продукции на одного работника для предприятия, на котором высокую квалификацию имеют 24% рабочих, а ввод в действие новых основных фондов составляет 5%.

13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию ч2. Сравнить полученные результаты.

Ситуационная (практическая) задача № 2

Имеются помесячные данные по объему платных услуг населению в 2010 г.

Объем платных услуг, млн. руб.

сентябрь

Требуется:

1. Проверить гипотезу о наличии тренда во временном ряде.

3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99.

4. Дать точечный и интервальный прогноз объема платных услуг на февраль 2011 г. с надежностью 0,99.

Тестовые задания

Необходимо из предложенных вариантов ответа на вопрос теста выбрать единственно верный, по Вашему мнению.

1.Остаток в i-м наблюдении – это:

a) разница между значением объясняющей переменной в i-м наблюдении и прогнозным значением этой переменной;

b) разница между значением переменной Y в i-м наблюдении и прогнозным значением этой переменной, полученным по выборочной линии регрессии;

c) разница между значением переменной Y в i-м наблюдении и прогнозным значением этой переменной, полученным по истинной линии регрессии;

d) разница между прогнозным значением зависимой переменной, полученным по выборочной линии регрессии и значением объясняющей переменной в этом наблюдении.

2. Дано регрессионное уравнение Y = 10 + 0.5X. Чему равно прогнозное значение переменной Y, если Х = 10:

3. При анализе тесноты линейной корреляционной связи между двумя переменными получен коэффициент парной линейной корреляции, равный – 1. Это означает, что:

a) линейная корреляционная связь отсутствует;

b) между переменными существует нелинейная связь;

c) парный коэффициент корреляции не может принять такое значение;

d) между переменными существует точная обратная линейная зависимость;

4. С помощью какой меры невозможно избавиться от мультиколлинеарности?

a) увеличение объема выборки;

b) исключения переменных высококоррелированных с остальными;

c) изменение спецификации модели;

d) преобразование случайной составляющей.

5. Какое из приведенных чисел может быть значением коэффициента множественной детерминации:

6. Если значение статистики Дарбина-Уотсона равно 0, это говорит

а) о наличии положительной автокорреляции остатков в модели;

б) об отсутствии зависимости между рассматриваемыми показателями;

в) об отсутствии тренда во временном ряде;

г) о статистической незначимости коэффициентов уравнения.

7. К каким последствиям приводит наличие гетероскедастичности в остатках:

a) МНК-оценки коэффициентов уже не обладают меньшей дисперсией, но остаются несмещенными и линейными;

b) МНК-оценки коэффициентов остаются наилучшими линейными несмещенными оценками, проблема только в стандартных ошибках, их надо корректировать.

c) МНК-оценки коэффициентов уже не обладают меньшей дисперсией, но остаются несмещенными и линейными; МНК – стандартные ошибки правильны (состоятельны), тестами, в которых они участвуют, пользоваться можно.

d) МНК-оценки коэффициентов становятся нелинейными.

8. Периодические колебания, возникающие под влиянием смены времени года называются…

a) хронологическими;

b) сезонными;

c) тенденцией;

d) случайными.

9. Известны помесячные данные за полгода относительно прибыли некоторой компании (тыс. руб.): 100, 110, 98, 90, 100, 110. Медиана данного ряда равна