Полная версия

Главная arrow Математика, химия, физика arrow Множественная регрессия

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ   >>

Анализ описательных статистик данных и графиков

Построим диаграммы рассеяния зависимости оплаты труда (З/п) от срока обучения (Образ) и опыта работы (Опыт).

Анализируя полученные диаграммы, можно сделать вывод о наличии выброса, который может быть вызван как неправильным введением данных, так и особенностями выборки. Это значение необходимо удалить из выборки.

Анализ описательных статистик

Найдем описательные статистики для переменных З/п, Образование, Опыт.

Построение модели, анализ качества и выбор оптимальной модели

Построим модель, состоящую из всех факторов, т.е. зависимость почасовой оплаты труда (З/п = I) от срока обучения (Образ = A), опыта работы (Опыт = G), региона проживания (Юг = B), расы (Черный = C), принадлежности к латиноамериканской группе (Латинос = D), пола (Жен = E), семейного положения (СемПол = F) и принадлежности к профессиональному союзу (Профсоюз = H).

Данная модель описывается следующим уравнением множественной регрессии:

Исследуем значимость коэффициентов и уравнения.

Полученная модель:

На основании полученных данных можно сделать вывод о том, что:

  • 1) значимыми являются переменные Образование, Опыт, Жен, Профсоюз;
  • 2) коэффициент детерминации

3) скорректированный коэффициент детерминации .

Проверим модель на наличие автокорреляция с помощью критерия Дарбина-Уотсона.

DW = 1,84, значит, можно сделать вывод об отсутствии автокорреляции.

Построим модель, состоящую из всех факторов, т.е. зависимость почасовой оплаты труда (Лог з/п =J) от срока обучения (Образ = A, опыта работы (Опыт = G), региона проживания (Юг = B), расы (Черный = C), принадлежности к латиноамериканской группе (Латинос = D), пола (Жен = E), семейного положения (СемПол =F) и принадлежности к профессиональному союзу (Профсоюз = H).

Данная модель описывается следующим уравнением множественной регрессии:

Исследуем значимость коэффициентов и уравнения.

Полученная модель:

На основании полученных данных можно сделать вывод о том, что:

  • 1) значимыми являются переменные Образование, Опыт, Юг, Жен, Профсоюз и СемПол;
  • 2) коэффициент детерминации ;

3) скорректированный коэффициент детерминации .

Проверим модель на наличие автокорреляции с помощью критерия Дарбина-Уотсона.

DW = 1,80, значит, можно сделать вывод об отсутствии автокорреляции.

Выбор оптимальной модели и определение значений коэффициентов

Сравним значения коэффициентов детерминации для рассмотренных ранее моделей:

1) Для модели с зависимой переменной I (заработная плата):

2) Для модели с зависимой переменной J (логарифм заработной платы):

Таким образом, наиболее качественной является модель, описываемая уравнением:

Интерпретация и анализ значимых коэффициентов

Проанализировав полученное уравнение регрессии, можно сделать вывод о том, что наибольшее влияние на уровень почасовой оплаты труда оказывают образование, опыт работы, пол и принадлежность профессиональному союзу.

Переменные A, J, F и H входят в модель со знаком «+», а переменные B, C, D, E - со знаком «-». Это означает, что:

  • - уровень заработной платы напрямую зависит от образования (срока обучения) и опыта работы;
  • - женатые имеют более высокую заработную плату;
  • - принадлежность профессиональному союзу положительно влияет на уровень оплаты труда;
  • - проживающие в южном регионе имеют более низкую заработную плату, т.е. имеет место дискриминация в зависимости от региона проживания);
  • - не принадлежащие к белокожему населению и принадлежащие к латиноамериканской группе имеют более низкую оплату труда, однако, коэффициенты малы, что говорит о совсем незначительной расовой дискриминации;
  • - женщины имеют более низкую заработную плату, чем мужчины.
 
Перейти к загрузке файла
<<   СОДЕРЖАНИЕ   >>