Дисперсионный анализ эконометрической модели

Оценка параметров эконометрической модели и ее дисперсионный анализ составляют общий процесс построения модели. Сочетание этих частей обусловило появление альтернативного метода оценки параметров модели 1МНК, основанная на элементах дисперсионного анализа.

При элементарно толковании взаимосвязи между двумя переменными с помощью 1МНК внимание, как правило, акцентируют на коэффициентах корреляции. Причем нетрудно показать, что

где r yx & mdash; парный коэффициент корреляции между Y и X ; & Mdash; среднее отклонение зависимой переменной; & Mdash; среднее отклонение независимой переменной.

Таким образом, оценка параметров модели прямо пропорциональна коэффициенту парной корреляции. Аналогичные соотношения выполняются и в общем случае.

А это значит, что оценить параметры модели можно через коэффициенты корреляции: сначала оценить теснота связи между каждой парой переменных, а затем найти оценки параметров эконометрической модели.

Так как коэффициенты парной корреляции и соотношение между ними и оценками параметров модели базируются на дисперсии и средних квадратичных отклонениях, то построение эконометрической модели через коэффициенты парной корреляции целесообразно рассмотреть в дисперсионном анализе модели.

Зависимость оценок параметров эконометрической модели и коэффициентов парной корреляции положено в основу алгоритма Пошаговое регрессии.

Опишем этот алгоритм.

Шаг 1-й .

Все выходные данные переменных стандартизуются (нормализуются)

(5.1)

где & mdash; нормализовано зависимая переменная; & Mdash; нормализованы независимые переменные; & Mdash; среднее значение j й независимой переменной; & Mdash; среднее значение зависимой переменной; , & Mdash; среднеквадратичные отклонения.

При этом средние значения и равны нулю, а дисперсии & mdash; единицы.

Шаг 2-й. находится корреляционная матрица (матрица парных коэффициентов корреляции)

(5.2)

где & mdash; парные коэффициенты корреляции между зависимой и независимыми переменными,

n & mdash; количество наблюдений;

& mdash; парные коэффициенты корреляции между независимыми переменными,

Шаг 3-й . На основании сравнения абсолютных значений выбираются всего указывает на то независимую переменную, которая тесно связана с y . На этом этапе на основе 1МНК находится оценка параметра этой переменной в модели:

, (5.3)

где & mdash; оценка параметра модели, которая строится на основе стандартизированных данных.

Шаг 4-й. Среди вторых значений выбирается и в модель вводится следующая независимая переменная

и т. д.

Если нет ограничения на внесение в эконометрической модели каждой последующей независимой переменной, то вычисления выполняются в тех пор, пока постепенно не должны быть Внесены в модели все переменные.

Сумма квадратов остатков для такой модели запишется так:

.

отсюда минимизации подлежит

.

Взял производную по каждому неизвестным параметром & # +61538; j этой функции и приравняв все полученные производные нулю, получим систему нормальных уравнений.

Система нормальных уравнений для нахождения параметров модели & # 61538; j в общем виде запишется так:

Обозначим матрицу парных коэффициентов корреляции между независимыми переменными через r , а вектор парных коэффициентов корреляции между зависимой и независимыми переменными через . тогда система нормальных уравнений примет вид

а оператор оценивания параметров:

(5.4)

Поскольку все переменные выражены в стандартизированному масштабе, то параметры показывают сравнительную силу влияния каждой независимой переменной на зависимую: чем больше модулем значение параметра, тем сильнее влияет j и переменная на результат.

Связь между оценками параметров модели на основе стандартизированных и нестандартизированных переменных запишется так:

(5.5)

Пример 5.1 . Для десяти цехов машиностроительного предприятия Приведены следующие данные (табл. 5.1).

Построим эконометрическую модель, которая будет описывать связь производительности труда с приведеннымы факторами согласно алгоритма Пошаговое регрессии.

Таблица 5.1

< td>

Производительность труда х 1

< td>

выполнения нормы выработки х 3,%

Номер цеха

Среднемесячная зарплата в

Фондоемкость продукции х 2

1

45

265

0,20

< / TD>

130

2

42

236

0,04

127

3

50

257

0,30

151

4

55

279

0,20

149

5

40 < / p>

226

0,10

140

6

70

350

0,10

141

7

56

278

0,25 < / p>

152

8

57

262

0,03

188

9

55

269

0,15

120

10

53

250

0, 32

126

Запишем корреляционную матрицу для этих выходных данных:

С матрицы видим, что диагональные ее элементы равны единице, потому что они характеризуют связь каждой переменной с собой. Эта матрица квадратная и симметричная.

В первой строке содержатся коэффициенты парной корреляции, характеризующие теснота связи каждой переменной с производительностью труда.

Да

= 0,9; = 0,03; = 0,28.

где & mdash; производительность труда; & Mdash; зарплата; & Mdash; фондоемкость продукции; & Mdash; % Выполнения нормы выработки.

Поскольку среди величин максимальное значение = 0,9, то сначала будет строиться модель: сравнивать затем другие два коэффициента:

max {= 0,03; = 0,28} = 0,28, введем модели переменную

и, наконец,

Далее, Используя соотношение (5.5), Вычислим оценки параметров модели для исходной нестандартизированное информации.

В результате получим такие регрессионный уравнения связи:

1);

2)

3) (5.6)

множественные коэффициент корреляции и д етерминациы

теснота связи общего воздействия всех независимых переменных на зависимую определяется коэффициентами детерминации и множественной корреляции.

Чтобы дать метод их расчета необходимо показать, что вариация зависимой переменной ( Y ) вокруг своего избирательно среднего значения () * может быть разложена на две составляющие:

1) вариации расчетных значений () вокруг среднего значения;

2) вариации расчетных значений () вокруг фактических ( Y ).

Необходимые при этом вычисления СВЕДА в табл. 5.2.

Таблица 5.2

< td>

< td>

Источник вариации

Сумма квадратов отклонений

Степени свободы

Среднее квадратов отклонений или дисперсия

Остаток

Общая вариация

Заметим, что все переменные Y i X взятые как отклонение от своего среднего значения.

Используем средние квадратов отклонений (дисперсии) (см. Табл. 5.2) и запишем формулу для вычисления коэффициента детерминации:

(5.7)

или, НЕ Учитывая степеней свободы:

(5.8)

Поскольку в (5.7) заданный несмещенные оценки дисперсии с учетом числа степеней свободы, то коэффициент детерминации может уменьшаться при введении в модель новых независимых переменных. Тогда как для коэффициента детерминации, исчисленного без учета поправки ( n — 1 / m — 1) на число степеней свободы (5.8), коэффициент детерминации никогда НЕ уменьшается. Зависимость между Этими двумя коэффициентами можно представит следующим образом:

(5.9)

где & mdash; коэффициент детерминации с учетом числа степеней свободы;

& mdash; коэффициент детерминации без учета числа степеней свободы.

Для функции с двумя и более независимыми переменными коэффициент детерминации может Принимать значения на множестве. Числовое значение коэффициента детерминации характеризует, в какой мере вариация зависимой переменной () определяется Вариацией независимых переменных. Чем ближе он к единице, тем больше вариация зависимой переменной определяется Вариацией независимых переменных.