<<

стр. 7
(всего 28)

СОДЕРЖАНИЕ

>>



4.4. Анализ временных рядов
Временным или динамическим рядом называется совокупность наблюдений xi
в последовательные моменты времени i = 1, . . . , N (обычно для индексации вре-
менных рядов используется t, в этом пункте для целостности изложения материала
сохранено i). Задача анализа временного ряда заключается в выделении и модели-
ровании 3-х его основных компонент:

xi = ?i + ?i + ?i , i = 1, . . . , N,

или в оценках:

xi = di + ci + ei , i = 1, . . . , N,

где
?i , di — тренд, долговременная тенденция,
?i , ci — цикл, циклическая составляющая,
?i , ei — случайная компонента,
с целью последующего использования построенных моделей в прикладном эконо-
мическом анализе и прогнозировании.
168 Глава 4. Введение в анализ связей

Для выявления долгосрочной тенденции используют различные методы.
Наиболее распространено использование полиномиального тренда. Такой
тренд строится как регрессия xi на полином определенной степени относительно
времени:

xi = a1 i + a2 i2 + . . . + b + ei , i = 1, . . . , N.

Для выбора степени полинома можно использовать F -критерий: оценивают
тренд как полином, последовательно увеличивая его степень до тех пор, пока уда-
ется отвергнуть нулевую гипотезу.
Тренд может быть экспоненциальным. Он строится как регрессия ln xi на по-
лином от времени, так что после оценки параметров регрессии его можно записать
в следующем виде:
2 +...+b+e
xi = ea1 i+a2 i , i = 1, . . . , N.
i




Иногда тренд строится как сплайн, т.е. как некоторая «гладкая» композиция
разных функций от времени на разных подпериодах.

Пусть, например, на двух подпериодах [1, . . . , N1 ] и [N1 + 1, . . . , N ] тренд вы-
ражается разными квадратическими функциями от времени (в момент времени N1
происходит смена тенденции):

xi = a1 i + a2 i2 + b1 + ei1 , i = 1, . . . , N1 ,
xi = a3 i + a4 i2 + b2 + ei2 , i = N1 + 1, . . . , N.

Для того чтобы общий тренд был «гладким» требуют совпадения самих значений
и значений первых производных двух полиномов в точке «перелома» тенденции:
2 2
a1 N 1 + a2 N 1 + b 1 = a3 N 1 + a4 N 1 + b 2 ,
a1 + 2a2 N1 = a3 + 2a4 N1 .

Отсюда выражают, например, a3 и b2 через остальные параметры и подставляют
полученные выражения в исходное уравнение регрессии. После несложных преоб-
разований уравнение приобретает следующий вид:

xi = a1 i + a2 i2 + b1 + ei1 , i = 1, . . . , N1 ,
2 2
xi = a1 i + a2 i2 ? (i ? N1 ) + b1 + a4 (i ? N1 ) + ei2 , i = N1 + 1, . . . , N .


Параметры полученного уравнения оцениваются, и, тем самым, завершается по-
строение тренда как полиномиального сплайна.
169
4.4. Анализ временных рядов

Для выявления долговременной тенденции применяют также различные прие-
мы сглаживания динамических рядов с помощью скользящего среднего.
Один из подходов к расчету скользящей средней заключается в следующем: в ка-
честве сглаженного значения xi , которое по аналогии с расчетным значением мож-
но обозначить через xc , принимается среднее значений xi?p , . . . , xi , . . . , xi+p ,
i
где p — полупериод сглаживания. Сам процесс сглаживания заключается в по-
следовательном расчете (скольжении средней) xc , . . . , xc ?p . При этом часто
p+1 N
теряются первые и последние p значений исходного временного ряда.
Для сглаживания могут использоваться различные средние. Так, например,
при полиномиальном сглаживании средние рассчитываются следующим образом.
Пусть сглаживающим является полином q-й степени. Оценивается регрессия
вида:

xi+l = a1 l + a2 l2 + . . . + aq lq + b + ei+l , l = ?p, . . . , p,

и в качестве сглаженного значения xc принимается b (расчетное значение при
i
l = 0).


Так, при q = 2 и p = 2 уравнение регрессии принимает следующий вид (исключая i
как текущий индекс):
? ? ? ? ? ?
?2 4 1 ?
x?2 ? ? e
? ? ? ?2 ?
??
? ?? ? ?
? ?? ? ? ?
? x?1 ? ? ?1 1 1 ? ? a1 ? ? e?1 ?
? ?? ?? ?? ?
? ?? ?? ?? ?
? x0 ? = ? 0 0 1 ? ? a2 ? + ? e 0 ?.
? ?? ?? ?? ?
? ?? ? ? ?
? ?? ? ? ?
? x1 ? ? 1 1 1? ? e1 ?
b
? ?? ? ? ?
2 41
x2 e2


По аналогии с (4.29), можно записать:
? ? ???1 ? ?
?2 4 1 ?? x
?? ?? ?? ?2 ?
? ? ?
? ? ?? ? ?
? ? ?? ? ?
a1 ? ?? ?2 ?1 0 1 ?1 1 ? ?2 ?1 0
2 ?? 1 ?? 1 2 ?? x?1 ?
?
? ?? ?? ?? ?? ?
? ?
? ?? ?? ?? ?? ?
? ?
? a2 ? = ? ? 4 4 ?? 1 ?? 1 4 ?? x0 ?=
?4
1 01 0 0 10
? ?? ?? ?? ?? ?
? ?
? ? ?? ? ?
? ? ?? ? ?
? 1? 1 ?? 1 1 ? x1 ?
b 1 1 11 1 1 1 11
? ? ?? ? ?
2 4 1 x2
170 Глава 4. Введение в анализ связей
? ?
x
? ? ?2 ?
? ? ?
? ?
? ?14 ?7 14 ? ? x?1 ?
0 7
?? ?
1? ?? ?
?
?10 ?5 10 ? ? x0 ?.
=
70 ? 10 ?5 ?? ?
? ? ?
? ?
?6 24 ?6 ? x1 ?
24 34
? ?
x2

Таким образом, в данном случае веса скользящей средней принимаются равными

1
[?3, 12, 17, 12, ?3] .
35

При полиномиальном сглаживании потеря первых и последних p наблюдений
в сглаженном динамическом ряду не является неизбежной; их можно взять как рас-
четные значения соответствующих наблюдений по первому и последнему полиному
(в последовательности скольжения средней).

Так, в рассмотренном примере при p = q = 2:
? ?
x1 ?
?
? ?
?? ?
? ?? ? ?
? x2 ?
1 ? 31 9 ?3 ?5 3 ? ? ?
xc ? ? ?2a1 + 4a2 + b ?
?1 ? ?
?? x3 ? ,
? ?=? ?= ?
? ?
35
6 ?5 ? ?
?a1 + a2 + b
xc 9 13 12 ? ?
2
? x4 ?
? ?
x5
? ?
? xN ?4 ?
? ?
?? ?
? ? ? ? ?
? xN ?3 ?
13 9 ? ? ?
1 ? ?5 6
c
? xN ?1 ? ? a1 + a2 + b ? ? ?
12
? ? xN ?2 ?.
? ?=? ?= ?
? ?
35
9 31 ? ?
3 ?5 ?3
xc 2a1 + 4a2 + b ? ?
N
? xN ?1 ?
? ?
xN

Как видно, все эти расчетные значения являются средними взвешенными величина-
ми с несимметричными весами.

Для выбора параметров сглаживания p и q можно воспользоваться
F -критерием (применение этого критерия в данном случае носит эвристический
171
4.4. Анализ временных рядов

характер). Для каждой проверяемой пары p и q рассчитывается сначала остаточ-
ная дисперсия:
N
1
(xi ? xc )2 ,
s2 =
e i
N i=1

а затем F -статистика:
s2 ? s2 (2p ? q)
F= x e
c
,
s2 q
e

где s2 — полная дисперсия ряда.
x
Выбираются такие параметры сглаживания, при которых эта статистика (q сте-
пеней свободы в числителе и 2p ? q степеней свободы в знаменателе) имеет наи-
меньший показатель pv.
Другой способ сглаживания называется экспоненциальным. При таком спосо-
бе в качестве сглаженного (расчетного) значения принимается среднее всех преды-
дущих наблюдений с экспоненциально возрастающими весами:
?
= (1 ? a)
xc al xi?l ,
i+1
l=0

где 0 < a < 1 — параметр экспоненциального сглаживания (xc является на
i
? 1
al =
самом деле средней, т.к. ).
1?a
l=0
В такой форме процедура сглаживания неоперациональна, поскольку требует
знания всей предыстории — до минус бесконечности. Но если из xc i+1 вычесть
axc , то весь «хвост» предыстории взаимно сократится:
i
? ?
? = (1 ? a)xi + (1 ? a) a xi?l ? (1 ? a)
xc axc l
al+1 xi?1?l .
i+1 i
< ? ? l=1 ? ?
?????>? < ? ? l=0? ? ? ?
? ? ? ? ? ? ?>
?
^ ^
<? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ?>
=


Отсюда получается правило экспоненциального сглаживания:
xc = (1 ? a)xi + axc ,
i+1 i

в соответствии с которым сглаженное значение в следующий момент времени по-
лучается как среднее фактического и сглаженного значений в текущий момент
времени.
Для того чтобы сгладить временной ряд, используя это правило, необходимо
задать не только a, но и xc . Эти два параметра выбираются так, чтобы миниму-
1
ма достигла остаточная дисперсия. Минимизация остаточной дисперсии в данном
172 Глава 4. Введение в анализ связей

случае является достаточно сложной задачей, поскольку относительно a она (оста-
точная дисперсия) является полиномом степени 2(N ? 1) (по xc — квадратичной
1
функцией).
Пусть долговременная тенденция выявлена. На ее основе можно попытаться
сразу дать прогноз моделируемой переменной (прогноз, по-видимому, будет точнее,
если в нем учесть все компоненты временного ряда).
В случае тренда как аналитической функции от времени i, прогнозом является
расчетное значение переменной в моменты времени N + 1, , N + 2, . . . .
Процедура экспоненциального сглаживания дает прогноз на один момент вре-
мени вперед:

xc +1 = (1 ? a) xN + axc .
N N

Последующие значения «прогноза» не будут меняться, т.к. отсутствуют основания
для определения ошибки eN +1 и т.д. и, соответственно, для наблюдения различий
между xc +1 и xN +1 и т.д.
N
При полиномиальном сглаживании расчет xc +1 проводится по последнему по-
N
линому (в последовательности скольжения средней) и оказывается равным неко-
торой средней последних 2p + 1 наблюдений во временном ряду.

В приведенном выше примере (p = q = 2):
? ?
xN ?4 ?
?
? ?
? ?
? xN ?3 ?
? ?
? ?
1
? xN ?2 ?.
xc +1 = (b + 3a1 + 9a2 ) = 21 ?21 ?28 0 63 ? ?
N
35
? ?
? ?
? xN ?1 ?
? ?
xN

Определение циклической и случайной составляющей временного ряда дается
во II части книги.


4.5. Упражнения и задачи
Упражнение 1

На основании информации о весе и росте студентов вашего курса:

1.1. Сгруппируйте студентов по росту и весу (юношей и девушек отдельно).
173
4.5. Упражнения и задачи

1.2. Дайте табличное и графическое изображение полученных совместных рас-
пределений частот, сделайте выводы о наличии связи между признаками.

1.3. С помощью критерия Пирсона проверьте нулевую гипотезу о независимости
роста и веса студентов.

1.4. С помощью дисперсионного анализа установите, существенно ли влияние
роста на их вес.

1.5. На основе построенной таблицы сопряженности рассчитайте средние и дис-
персии роста и веса, а также абсолютную и относительную ковариацию между
ними.

1.6. На основе исходных данных, без предварительной группировки (для юношей
и девушек отдельно):

• Оцените с помощью МНК параметры линейного регрессионного урав-
нения, предположив, что переменная «рост» объясняется переменной
«вес». Дайте интерпретацию полученным коэффициентам уравнения
регрессии.
• Повторите задание, предположив, что переменная «вес» объясняется
переменной «рост».
• Оцените с помощью МНК параметры ортогональной регрессии.
• Изобразите диаграмму рассеяния признаков роста и веса и все три линии
регрессии. Объясните почему, если поменять экзогенные и эндогенные
переменные местами, получаются различные уравнения.
• Для регрессионной зависимости роста от фактора веса вычислите объ-
ясненную и остаточную дисперсию, рассчитайте коэффициент детер-
минации и с помощью статистики Фишера проверьте статистическую
значимость полученного уравнения.


Упражнение 2

Дана таблица (табл. 4.1, индекс Доу—Джонса средних курсов на акции ряда
промышленных компаний).

2.1. Изобразить данные, представленные в таблице, графически.

2.2. Найти оценки параметров линейного тренда. Вычислить и изобразить графи-
чески остатки от оценки линейного тренда.

2.3. На основе данных таблицы
174 Глава 4. Введение в анализ связей


Таблица 4.1

Год Индекс Год Индекс Год Индекс
1897 45.5 1903 55.5 1909 92.8
1898 52.8 1904 55.1 1910 84.3
1899 71.6 1905 80.3 1911 82.4
1900 61.4 1906 93.9 1912 88.7
1901 69.9 1907 74.9 1913 79.2
1902 65.4 1908 75.6



• произвести сглаживание ряда с помощью процедуры, основывающейся
на q = 1 и p = 3 (q — степень полинома, p — полупериод сглажива-
ния);
• произвести сглаживание ряда с помощью процедуры, основывающейся
на q = 2 и p = 2.

2.4. Сравнить сглаженный ряд с трендом, подобранным в упражнении 2.2.


Задачи

1. Используя интенсивность цвета для обозначения степени концентрации эле-
ментов в группах, дайте графическое изображение совокупности, характери-
зующейся:

а) однородностью и прямой зависимостью признаков (x1 , x2 ) ;
б) однородностью и обратной зависимостью признаков (x1 , x2 ) ;
в) неоднородностью и прямой зависимостью признаков (x1 , x2 ) ;
г) неоднородностью и обратной зависимостью признаков (x1 , x2 ) ;
д) неоднородностью и отсутствием связи между признаками (x1 , x2 ) .

2. Пусть заданы значения (x1 , x2 ). Объясните, какие приемы следует приме-
нять для оценки параметров следующих уравнений, используя обычный метод
наименьших квадратов:

а) x1 = ?x? ;
2
б) x2 = ?ex1 ? ;
в) x1 = ? + ? ln(x2 );
г) x1 = x2 /(? + ?x2 );
д) x1 = ? + ?/(? ? x2 ).
175
4.5. Упражнения и задачи

3. Может ли матрица
? ? ? ?
?2 3? ?4 3?
а) ? ? б) ? ?
34 23
являться ковариационной матрицей переменных, для которых строятся урав-
нения регрессии? Ответ обосновать.

4. Наблюдения трех пар (x1 , x2 ) дали следующие результаты:

x2 = 41, x2 = 14, xi1 xi2 = 23, xi1 = 9, xi2 = 6.
i1 i2
i i i i i

Оценить уравнения прямой, обратной и ортогональной регрессии.

5. Построить уравнения прямой, обратной и ортогональной регрессии, если

а) X1 = (1, 2, 3) , X2 = (1, 0, 5) ;
б) X1 = (0, 2, 0, 2) , X2 = (0, 0, 2, 2) ;
в) X1 = (0, 1, 1, 2) , X2 = (1, 0, 2, 1) .

Нарисовать на графике в пространстве переменных облако наблюдений и
линии прямой, обратной и ортогональной регрессии. Вычислить объяснен-
ную, остаточную дисперсию и коэффициент детерминации для каждого из
построенных уравнений регрессии.

6. Какая из двух оценок коэффициента зависимости баллов, полученных на
экзамене, от количества пропущенных занятий больше другой: по прямой
или по обратной регрессии.

7. В регрессии x1 = a12 x2 + 1N b1 + e1 , фактор x1 равен (1, 3, 7, 1) . Пара-
метры регрессии найдены по МНК. Могут ли остатки быть равными:

(1, ?2, 2, 1) ;
а)
б) (1, ?2, 1, ?1) .

8. Для рядов наблюдений x1 и x2 известны средние значения, которые равны
соответственно 10 и 5. Коэффициент детерминации в уравнениях регрессии
x1 на x2 равен нулю. Найти значения параметров простой регрессии x1
по x2 .

9. В регрессии x1 = a12 x2 + 14 b1 + e1 , где x2 = (5, 3, 7, 1) , получены оценки
a12 = 2, b1 = 1, а коэффициент детерминации оказался равным 100%.
Найти вектор фактических значений x1 .
176 Глава 4. Введение в анализ связей

10. Изобразите на графике в пространстве двух переменных облако наблюдений
и линию прямой регрессии, если коэффициент корреляции между перемен-
ными:
а) положительный;
б) равен единице;
в) отрицательный;
г) равен минус единице;
д) равен нулю.
11. Существенна ли связь между зарплатой и производительностью труда по вы-
борке из 12 наблюдений, если матрица ковариаций для этих показателей
? ?
?9 6?
имеет вид ? ?.
6 16

12. Оцените параметры ортогональной регрессии и рассчитайте остаточную дис-
персию и коэффициент детерминации для переменных, у которых матрица
? ?
?9 6?
ковариаций равна ? ?, а средние значения равны 3 и 4.
6 16

13. Имеются данные об объемах производства по четырем предприятиям двух
отраслей, расположенным в двух регионах (млн. руб):
Отрасль
1 2
Регион

1 48 60

2 20 40

Рассчитать эффекты взаимодействия, факторную и общую дисперсии.
14. Имеются данные об инвестициях на предприятиях двух отраслей:
Инвестиции
Предприятие
(млн. руб.)
1 50
Отрасль 1 2 60
3 40
4 110
Отрасль 2 5 160
6 150
177
4.5. Упражнения и задачи

Рассчитать групповую, межгрупповую и общую дисперсии.

15. Имеются данные об урожайности культуры (в ц/га) в зависимости от способа
обработки земли и сорта семян:
Способы обработки земли (B)
Сорт семян (A)
1 2 3 4
1 16 18 20 21
2 20 21 23 25
3 23 24 26 27

С помощью двухфакторного дисперсионного анализа оценить, зависит ли
урожайность культуры от сорта семян (A) или от способа обработки земли.

16. Запишите систему нормальных уравнений оценивания параметров полино-
миального тренда первой, второй и третей степеней.

17. Перенесите систему отсчета времени в середину ряда, т.е. i = . . . ?3; ?2;
?1; 0; 1; 2; 3 . . ., и перепишите систему нормальных уравнений для поли-
номиального тренда первой, второй и третей степеней. Как изменится вид
системы? Найдите оценку параметров многочленов в явном виде из получен-
ной системы уравнений.

18. По данным о выручке за 3 месяца: 11, 14, 15 — оцените параметры поли-
номиального тренда первой степени и сделайте прогноз выручки на четвертый
месяц.

19. Имеются данные об ежедневных объемах производства (млн. руб.):
День 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Объем 9 12 27 15 33 14 10 26 18 24 38 28 45 32 41

Проведите сглаживание временного ряда, используя различные приемы
скользящего среднего:

а) используя полиномиальное сглаживание;
б) используя экспоненциальное сглаживание.

20. Оценена регрессия xi = ? + ?s sin(?i) + ?c cos(?i) + ?i для частоты ?/2.
При этом ?s = 4 и ?c = 3. Найти значения амплитуды, фазы и периода.

21. Что называется гармоническими частотами? Записать формулу с расшиф-
ровкой обозначений.

22. Что такое частота Найквиста? Записать одним числом или символом.
178 Глава 4. Введение в анализ связей

23. Строится регрессия с циклическими компонентами:
k
xi = ? + (?sj sin(?j i) + ?cj cos(?j i)) + ?i , i = 1, . . . , 5, k = 2.
j=1


Запишите матрицу ковариаций факторов для данной регрессии.


Рекомендуемая литература
1. Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 2).

2. Кендэл М. Временные ряды. — М.: «Финансы и статистика», 1981. (Гл. 3–5, 8).

3. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный
курс. — М.: «Дело», 2000. (Гл. 2).
Часть II

Эконометрия — I:
Регрессионный анализ




179
Это пустая страница
В этой части развиваются положения 4-й главы «Введение в анализ связей»
I-й части книги. Предполагается, что читатель знаком с основными разделами тео-
рии вероятностей и математической статистики (функции распределения случай-
ных величин, оценивание и свойства оценок, проверка статистических гипотез),
линейной алгебры (свойства матриц и квадратичных форм, собственные числа
и вектора). Некоторые положения этих теорий в порядке напоминания приводятся
в тексте.

В частности, в силу особой значимости здесь дается краткий обзор функций распре-
деления, используемых в классической эконометрии (см. также Приложение A.3.2).
Пусть ? — случайная величина, имеющая нормальное распределение с нулевым ма-
тематическим ожиданием и единичной дисперсией ( ? ? N (0, 1)). Функция плотности
?2
?2
этого распределения прямо пропорциональна ; 95-процентный двусторонний
e
квантиль ?0.95 равен 1.96, 99-процентный квантиль — 2.57.
?
Пусть теперь имеется k таких взаимно независимых величин ?l ? N (0, 1),
2
k
l = 1, . . . , k. Сумма их квадратов l=1 ?l является случайной величиной, имею-
щей распределение ?2 c k степенями свободы (обозначается ?2 ). Математическое
k
ожидание этой величины равно k, а отношение ?2 /k при k > ? стремится к 1,
k
т.е. в пределе ?2 становится детерминированной величиной. 95-процентный (одно-
сторонний) квантиль ?2 ?k,0.95 при k = 1 равен 3.84 (квадрат 1.96), при k = 5 —
11.1, при k = 20 — 31.4, при k = 100 — 124.3 (видно, что отношение ?2 k,0.95 /k
приближается к 1).
Если две случайные величины ? и ?2 независимы друг от друга, то случайная
k
?
величина tk = имеет распределение t-Стьюдента с k степенями свободы.
2 /k
?k k+1
2 ?2
t
; в пределе при k > ?
Ее функция распределения пропорциональна 1 + k
k
она становится нормально распределенной. 95-процентный двусторонний кван-
?
тиль tk, 0.95 при k = 1 равен 12.7, при k = 5 — 2.57, при k = 20 — 2.09,
при k = 100 — 1.98, т.е. стремится к ?0.95 .
?
Если две случайные величины ?21 и ?22 не зависят друг от друга, то случайная
k k
?2 1 /k1
k
величина Fk1 ,k2 = имеет распределение F -Фишера с k1 и k2 степенями
?2 /k2
k2
свободы (соответственно, в числителе и знаменателе). При k2 > ? эта случайная
величина стремится к ?21 /k1 , т.е. k1 Fk1 ,? = ?21 . Очевидно также, что F1,k2 = t22 .
k k k
?1,k2 ,0.95 при k2 = 1 равен 161, при
95-процентный (односторонний) квантиль F
k2 = 5 — 6.61, при k2 = 20 — 4.35, при k2 = 100 — 3.94 (квадраты соответ-
?
ствующих tk,0.95 ); квантиль F2,k2 ,0.95 при k2 = 1 равен 200, при k2 = 5 — 5.79,
?
при k2 = 20 — 3.49, при k2 = 100 — 3.09; квантиль Fk1 ,20,0.95 при k1 = 3 равен
3.10, при k1 = 4 — 2.87, при k1 = 5 — 2.71, при k1 = 6 — 2.60.
Глава 5

Случайные ошибки


Задачей регрессионного анализа является построение зависимости изучаемой
случайной величины x от факторов z :
x = f (z, A) + ?,
где A — параметры зависимости.
Если z — истинный набор факторов, полностью определяющий значение x,
а f — истинная форма зависимости, то ? — случайные ошибки измерения x.
Однако в экономике весьма ограничены возможности построения таких истинных
моделей, прежде всего потому, что факторов, влияющих на изучаемую величи-
ну, слишком много. В конкретных моделях в лучшем случае наборы z включают
лишь несколько наиболее значимых факторов, и влияние остальных, неучтенных,
факторов определяет ?. Поэтому ? называют просто случайными ошибками или
остатками.
В любом случае считают, что ? — случайные величины с нулевым математиче-
ским ожиданием и, как правило, нормальным распределением. Последнее следует
из центральной предельной теоремы теории вероятностей, поскольку ? по своему
смыслу является результатом (суммой) действия многих мелких малозначимых по
отдельности факторов случайного характера.

Действительно, в соответствии с этой теоремой, случайная величина, являющаяся
суммой большого количества других случайных величин, которые могут иметь раз-
личные распределения, но взаимно независимы и не слишком различаются между
собой, имеет асимптотически нормальное распределение, т.е. чем больше случайных
величин, тем ближе распределение их суммы к нормальному.
183
5.1. Первичные измерения

5.1. Первичные измерения

Пусть имеется N измерений xi , i = 1, . . . , N , случайной величины x, т.е. N
наблюдений за случайной величиной. Предполагается, что измерения проведены
в неизменных условиях (факторы, влияющие на x, не меняют своих значений),
и систематические ошибки измерений исключены. Тогда различия в результатах
отдельных наблюдений (измерений) связаны только с наличием случайных ошибок
измерения:

(5.1)
xi = ? + ?i , i = 1, . . . , N,

где ? — истинное значение x, ?i — случайная ошибка в i-м наблюдении. Такой
набор наблюдений называется выборкой.
Понятно, что это — идеальная модель, которая может иметь место в естествен-
нонаучных дисциплинах (в управляемом эксперименте). В экономике возможности
измерения одной и той же величины в неизменных условиях практически отсут-
ствуют. Определенные аналогии с этой моделью возникают в случае, когда неко-
торая экономическая величина измеряется разными методами (например, ВВП —
по производству или по использованию), и наблюдениями выступают результаты
измерения, осуществленные этими разными методами. Однако эта аналогия до-
статочно отдаленная, хотя бы потому, что в модели N предполагается достаточно
большим, а разных методов расчета экономической величины может быть в луч-
шем случае два-три. Тем не менее, эта модель полезна для понимания случайных
ошибок.
Если X и ? — вектор-столбцы с компонентами, соответственно, xi и ?i ,
а 1N — N -мерный вектор-столбец, состоящий из единиц, то данную модель мож-
но записать в матричной форме:

(5.2)
X = 1N ? + ?.

Предполагается, что ошибки по наблюдениям имеют нулевое математическое
ожидание в каждом наблюдении: E (?i ) = 0, i = 1, . . . , N ; линейно не зависят
друг от друга: cov (?i , ?j ) = 0, i = j; а их дисперсии по наблюдениям одинаковы:
var (?i ) = ? 2 , i = 1, . . . , N или, в матричной форме: E (?? ) = IN ? 2 , где ? 2 —
дисперсия случайных ошибок или остаточная дисперсия, IN — единичная матрица
размерности N . Это — обычные гипотезы относительно случайных ошибок.
Требуется найти b и ei — оценки, соответственно, ? и ?i . Для этого исполь-
зуется метод наименьших квадратов (МНК), т.е. искомые оценки определяются
N N
(xi ? b)2 = e2 = e e > min!, где e вектор-столбец оценок ei .
так, чтобы i
i=1 i=1
184 Глава 5. Случайные ошибки

В результате,
N
1 1
e = X ? 1N b,
b=x=
? xi = 1 X,
NN
N i=1

d2 e e
de e
= ?2 (xi ? b) = 0. Кроме того,
т.к. = 2N > 0, следовательно, в дан-
db2
db
ной точке достигается минимум, т.е. МНК-оценкой истинного значения измеряемой
величины является, как и следовало ожидать, среднее арифметическое по наблю-
дениям, а среднее МНК-оценок остатков равно нулю:
1
1 (X ? 1N b) = x ? b = 0.
e=
? ?
NN
Оценка b относится к классу линейных, поскольку линейно зависит от наблюдений
за случайной величиной.
Полученная оценка истинного значения является несмещенной (т.е. ее мате-
матическое ожидание равно истинному значению оцениваемого параметра), что
можно легко показать.

Действительно:
1 1 1
(5.1)
(5.3)
b= xi = (? + ?i ) = ? + ?i ,
N N N
? — детер-
1
минировано E(?i )=0
E (b) = ?+ E (?i ) = ?.
N
Что и требовалось доказать.

Однако несмещенной оценкой ? является и любое наблюдение xi , т.к. из (5.1)
следует, что E (xi ) = ?.
Легко установить, что оценка b лучше, чем xi , т.к. имеет меньшую дисперсию
(меньшую ошибку), то есть является эффективной. Более того, b — наилучшая
в этом смысле оценка во множестве всех возможных линейных несмещенных оце-
нок. Ее дисперсия минимальна в классе линейных несмещенных оценок и опреде-
ляется следующим образом:
12
2
(5.4)
?b = ?,
N
т.е. она в N раз меньше, чем дисперсия xi , которая, как это следует из (5.1),
равна ? 2 .
185
5.1. Первичные измерения

Действительно, множество всех линейных оценок по определению представляется
следующим образом:
N
?
b= di xi ,
i=1

где di — любые детерминированные числа.
Из требования несмещенности,

E (b? ) = ?,

следует, что di = 1, т.к.

di — детер-
минировано
E (b? ) = E di xi = di E (xi ) = ? di .
<?
?>
?

Таким образом, множество всех линейных несмещенных оценок описывается так:
N N
?
b= di xi , di = 1.
i=1 i=1


В этом множестве надо найти такую оценку (такие di ), которая имеет наименьшую
дисперсию,
(5.1)
b? = di xi = ? di + di ?i ,
<?
?>
=1

откуда b? ? ? = di ?i , и можно рассчитать дисперсию b? :

var(b? ) = ?b? = E (b? ? E(b? )2 =
2

E(?2 )=?2
2 E(?i ?i )=0 i
d2 E(?2 ) ?2 d2 .
=E di ?i = =
i i i



d2 при ограничении
Минимум di = 1 достигается, если все di одинаковы
i
1 1
и равны N , т.е. если b = b. Отсюда, в частности, следует, что ?b = N ? 2 .
? 2

Что и требовалось доказать.

Такие оценки относятся к классу BLUE — Best Linear Unbiased Estimators.
Кроме того, оценка b состоятельна (стремится при N > ? к истинному
значению параметра), т.к. она несмещена и ее дисперсия, как это следует из (5.4),
при N > ? стремится к 0.
186 Глава 5. Случайные ошибки

Чтобы завершить рассмотрение данного случая, осталось дать оценку остаточ-
ной дисперсии. Естественный «кандидат» на эту «роль» — дисперсия x :

1 1 1
(xi ? b)2 =
s2 = ei = e e,
N N N
— дает смещенную оценку. Для получения несмещенной оценки остаточной дис-
персии сумму квадратов остатков надо делить не на N , а на N ? 1 :

1
s2 = (5.5)
? e e,
N ?1

поскольку в векторе остатков e и, соответственно, в сумме квадратов остатков e e
линейно независимых элементов только N ? 1 (т.к. 1N e = 0). Этот факт можно
доказать строго.

Если просуммировать по i соотношения (5.1) и поделить обе части полученного
1
выражения на N , то окажется, что b = ? + N ?i . Кроме того, известно, что
xi = ? + ?i = b + ei . Объединяя эти два факта можно получить следующее выраже-
ние:
1
ei = ?i ? (5.6)
?i ,
N
(т.е. оценки остатков равны центрированным значениям истинных случайных оши-
бок), и далее получить

2 2 2
1 2 1
?2 ?
?i ?
ee= ?i = ?i + ?i =
i
N N N
2
1
?2 ?
= ?i .
i
N
Наконец:

E(?2 )=?2 , E(?i ?i )=0
(N ? 1) ? 2 ,
i
E (e e) =

т.е.
1
= ?2 .
E ee
N ?1

Что и требовалось доказать.

Теперь относительно случайных ошибок вводится дополнительное предполо-
жение: они взаимно независимы (а не только линейно независимы) и распре-
делены нормально: ?i ? NID 0, ? 2 . NID расшифровывается как normally and
187
5.1. Первичные измерения

independently distributed (нормально и независимо распределенные случайные
величины). Тогда становится известной функция плотности вероятности ?i :
2
1 1
1 1
2
f (?i ) = (2?)? 2 ? ?1 e? 2?2 ?i = (2?)? 2 ? ?1 e? 2?2 (xi ??) ,

и функция совместной плотности вероятности (произведение отдельных функ-
ций плотности, так как случайные ошибки по наблюдениям взаимно независи-
мы) (см. Приложение A.3.2):

(xi ??)2
1
f (?1 , . . . , ?N ) = (2?)? 2 ? ?N e? 2?2
N
.

Эта функция рассматривается как функция правдоподобия L (?, ?), значения
которой показывают «вероятность» (правдоподобность) появления наблюдаемых
xi , i = 1, . . . , N , при тех или иных значениях ? и ?. Имея такую функцию,
можно воспользоваться для оценки параметров ? и ? методом максимального
правдоподобия (ММП): в качестве оценок принять такие значения ? и ?, которые
доставляют максимум функции правдоподобия (фактически предполагая, что, раз
конкретные xi , i = 1, . . . , N реально наблюдаются, то вероятность их появления
должна быть максимальной).
Обычно ищется максимум не непосредственно функции правдоподобия, а ее
логарифма (значения этой функции при конкретных xi и конечных ? положи-
тельны, и их можно логарифмировать; эта операция, естественно, не меняет точки
экстремума), что проще аналитически.

N 1
(xi ? ?)2 .
ln L (?, ?) = ? ln 2? ? N ln ? ? 2
2 2?

Ищутся производные этой функции по ? и ?, приравниваются нулю и опреде-
ляются искомые оценки:
? ln L 1
(xi ? ?) = 0 ?
=2 ? = x = b,
?
?? ?
? ln L N 1 1
e2 = 0 ?2 = e2 = s2 .
=? + 3 ?
i i
?? ? ? N

Это точка минимума, поскольку матрица 2-х производных
? ?
N ?1 0?
? ? ?
s2
0 2

в ней отрицательно определена.
188 Глава 5. Случайные ошибки

Таким образом, ММП-оценки ? и ?i совпадают с МНК-оценками, но ММП-
оценка ? 2 равна не s2 , а s2 , т.е. является смещенной. Тем не менее, эта оценка
?
состоятельна, т.к. при N > ? различия между s2 и s2 исчезают.
?
Известно, что метод максимального правдоподобия гарантирует оценкам со-
стоятельность и эффективность, т.е. они обладают минимально возможными дис-
персиями (вообще, а не только в классе линейных несмещенных, как оценки класса
BLUE).
В рамках гипотезы о нормальности ошибок ? можно построить доверительный
интервал для истинного значения параметра, т.е. интервал, в который это значение
попадает с определенной вероятностью 1 ? ?, где ? — уровень ошибки (аналоги-
чен величинам sl и pv, введенным во 2-й и 4-й главах I части книги; в прикладных
исследованиях уровень ошибки принимается обычно равным 0.05). Он называется
(1 ? ?)100-процентным (например, при ? = 0.05 — 95-процентным) доверитель-
ным интервалом.
?2
Следствием нормальности ? является нормальность b : b ? N ?, . По-
N
этому
v
(b ? ?) N
? N (0, 1), (5.7)
?
и, по определению двустороннего квантиля (см. п. 2.3),
v
(b ? ?) N
?1?? ,
?
?

где ?1?? — (1 ? ?)100-процентный двусторонний квантиль нормального распре-
?
деления.
Откуда
?
? ? b ± v ?1?? (5.8)
?
N
— искомый (1 ? ?)100-процентный доверительный интервал.
К сожалению, на практике этой формулой доверительного интервала восполь-
зоваться невозможно, т.к. она предполагает знание остаточной дисперсии ? 2 . Из-
вестна же только ее оценка s2 .
?
Простая замена в (5.8) ? на s будет приводить к систематическим ошибкам —
?
к преуменьшению доверительного интервала, т.е. к преувеличению точности рас-
чета.
Чтобы получить правильную формулу расчета, необходимо провести дополни-
тельные рассуждения.
189
5.1. Первичные измерения

Прежде всего, доказывается, что

ee
? ?2 ?1 . (5.9)
2 N
?
Справедливость этого утверждения достаточно очевидна, поскольку, как было по-
казано выше, сумма квадратов e e имеет N ? 1 степень свободы, но может быть
доказана строго.

В матричной форме выражение (5.6) записывается следующим образом:

(5.10)
e = B?,

1
где B = IN ? 1N 1N .
N
Матрица B размерности N ? N :
а) вещественна и симметрична ( B = B), поэтому она имеет N вещественных
корней, которые можно «собрать» в диагональной матрице ?, и N взаимно орто-
гональных вещественных собственных векторов, образующих по столбцам матрицу
Y . Пусть проведена надлежащая нормировка и длины этих собственных векторов
равны 1. Тогда:

Y = Y ?1 , (5.11)
Y Y = IN , BY = Y ?, B = Y ?Y ;

б) вырождена и имеет ранг N ? 1. Действительно, имеется один и только один (с
точностью до нормировки) вектор ? = 0, который дает равенство B? = 0. Все
компоненты этого единственного вектора одинаковы, т.к., как было показано выше,
B? — центрированный ?. В частности,

(5.12)
B1N = 0.

Это и означает, что ранг B равен N ? 1;
в) идемпотентна, т.е. B 2 = B (см. Приложение A.3.2):

1 1
B2 = IN ? IN ?
1N 1N 1N 1N =
N N
1 1 1
= IN ? 1N 1N ? 1N 1N + 2 1N 1N 1N 1N = B.
<?
?>
N N N
<? ? ? ? ? ? ? =N?
? ? ? ? ? ? ? ? ?>
?
=0


Далее, пусть
1 1
(5.13)
u= Y ?, uj = Y ?,
?j
?
где Yj — j-й собственный вектор матрицы B.
190 Глава 5. Случайные ошибки

Очевидно, что E (uj ) = 0, дисперсии uj одинаковы и равны 1:

E(?? )=?2 IN
1 (5.11)
u2
E = 2 E Yj ?? Yj = Yj Yj = 1,
j
?
и uj взаимно независимы (при j = j ):

(5.11)
аналогично
E (uj uj ) = Yj Yj = 0.

Тогда

B =B, B 2 =B 1
e e (5.10) 1 (5.11) 1 (5.13)
(5.14)
= ? B B? = ? B? = ? Y ?Y ? = u ?u.
2 2 2 2
? ? ? ?

Собственные числа матрицы B, как и любой другой идемпотентной матрицы, равны
либо 1, либо 0 ( ? — любое собственное число, ?— соответствующий собственный
вектор):

B? = ??, 0,
?2 = ?
? ? ?=
B? = B 2 ? = B?? = ?2 ? 1.

и, поскольку ранг матрицы B равен N ? 1, среди ее собственных чисел имеется
N ? 1, равных 1, и одно, равное 0. Поэтому (5.14), в соответствии с определе-
нием случайной величины, имеющей распределение ?2 , дает требуемый результат
(см. также Приложение A.3.2).

Случайные величины, определенные соотношениями (5.7, 5.9), некоррелиро-
ваны, а, следовательно, и взаимно независимы по свойствам многомерного нор-
мального распределения (см. Приложение A.3.2).

Действительно:

1
(5.3)
b?? = 1 ?,
NN
1 E(?? )=?2 IN ? 2
(5.10) (5.12)
cov(e, b) = E(e (b ? ?) ) = E(B?? 1N ) = B1N = 0.
N N

Что и требовалось доказать.

Поэтому, в соответствии с определением случайной величины, имеющей
t-распределение (см. также Приложение A.3.2):
v
(b ? ?) N ee
/(N ? 1) ? tN ?1 ,
?2
?
191
5.1. Первичные измерения

и после элементарных преобразований (сокращения ? и замены (5.5)) получается
следующий результат:
v
(b ? ?) N
? tN ?1 .
s
?
Откуда:
s?
?
? ? b ± v tN ?1,1?? , (5.15)
N
где tN ?1,1?? — (1 ? ?)100-процентный двусторонний квантиль tN ?1 -распреде-
?
ления.
Это — операциональная (допускающая расчет) форма доверительного интер-
вала для ?. Как видно, для ее получения в (5.8) надо заменить не только ? на s, но
?
? ?
и ?1?? на tN ?1,1?? . Т. к. tN ?1,1?? > ?1?? , использование (5.8) с простой заменой
? ?
? на s действительно преуменьшает доверительный интервал (преувеличивает
?
точность расчета). Но по мере роста N (объема информации), в соответствии со
свойствами t-распределения, доверительный интервал сужается (растет точность
расчета), и в пределе при N > ? он совпадает с доверительным интервалом (5.8)
(с простой заменой ? на s). ?
Важным является вопрос содержательной интерпретации доверительных ин-
тервалов.
Понятно, что в рамках подхода объективной вероятности непосредственно
утверждения (5.8, 5.15) не могут считаться корректными. Величина ? — детерми-
нирована и не может с какой-либо вероятностью 0 < 1 ? ? < 1 принадлежать кон-
кретному интервалу. Она может либо принадлежать, либо не принадлежать этому
интервалу, т.е. вероятность равна либо 1, либо 0. Потому в рамках этого подхода
интерпретация может быть следующей: если процедуру построения доверитель-
ного интервала повторять многократно, то (1 ? ?) · 100 процентов полученных
интервалов будут содержать истинное значение измеряемой величины.
Непосредственно утверждения (5.8, 5.15) справедливы в рамках подхода субъ-
ективной вероятности.
Рассмотренная модель (5.1) чрезвычайно идеализирует ситуацию: в экономике
условия, в которых измеряются величины, постоянно меняются. Эти условия пред-
ставляются некоторым набором факторов zj , j = 1, . . . , n, и модель «измерения»
записывается следующим образом:
n
xi = zij ?j + ? + ?i , i = 1, . . . , N ,
j=1

где zij — наблюдения за значениями факторов, ?j , j = 1, . . . , n, ? — оценива-
емые параметры.
192 Глава 5. Случайные ошибки

Такая модель — это предмет регрессионного анализа. Рассмотренная же мо-
дель (5.1) является ее частным случаем: формально — при n = 0, по существу —
c
при неизменных по наблюдениям значениях факторов zij = zj ( c — const), так
c
что оцениваемый в (5.1) параметр ? в действительности равен zj ?j + ?.
Прежде чем переходить к изучению этой более общей модели, будут рассмот-
рены проблемы «распространения» ошибок первичных измерений (в этой гла-
ве) и решены алгебраические вопросы оценки параметров регрессии (следующая
глава).


5.2. Производные измерения
Измеренные первично величины используются в различных расчетах (в произ-
водных измерениях), и результаты этих расчетов содержат ошибки, являющиеся
следствием ошибок первичных измерений. В этом пункте изучается связь между
ошибками первичных и производных измерений, или проблема «распространения»
ошибок первичных измерений. Возможна и более общая трактовка проблемы: вли-
яние ошибок в исходной информации на результаты расчетов.
Пусть xj , j = 1, . . . , n, — выборочные (фактические) значения (наблюдения,
измерения) n различных случайных величин, ?j — их истинные значения, ?j —
ошибки измерений. Если x, ?, ? — соответствующие n-компонентные вектор-
строки, то x = ? + ?. Предполагается, что E(?) = 0 и ковариационная матрица
ошибок E(? ?) равна ?.
2
Пусть величина y рассчитывается как f (x). Требуется найти дисперсию ?y
ошибки ?y = y ? f (?) измерения (расчета) этой величины.
Разложение функции f в ряд Тэйлора в фактической точке x по направлению
? ? x ( = ??), если в нем оставить только члены 1-го порядка, имеет вид: f (?) =
= y ? ?g (заменяя « ? » на « = ») или ?y = ?g, где g — градиент f в точке x
?f
(вектор-столбец с компонентами gj = ?xj (x)).
Откуда E (?y ) = 0 и
E(? ?)=?
?y = E ?2 = E g ? ?g
2
(5.16)
= g ?g.
y


Это — общая формула, частным случаем которой являются известные форму-
лы для дисперсии среднего, суммы, разности, произведения, частного от деления
и др.
? ?
2
? ?1 ??
Пусть n = 2, ? = ? ?.
2
? ?2
193
5.2. Производные измерения
? ?
?1? 2 2 2
а) если y = x1 ± x2 , то: g = ? ? , ?y = ?1 + ?2 ± 2?.
±1
? ?
? x2 ? 2 2 2
?y
? , ?y = x2 ?1 + x2 ?2 + 2x1 x2 ? или
2 2 ?1
б) если y = x1 x2 , то: g = ? = +
2 1 2
2
y x1
x1
2
?2 ?
+ 2 x1 x2 .
+ 2
x2
? ?
1
? ?2 2
x2 2 x2 2 2
?y
12 ?1 ?2
? 2 x1 ? или ?
x2
x1
то: g = ? ? , ?y = 1
в) если y = x2 , ? + ? = +
x2 1 x4 2 3 2 2
2
y x1 x2
2 2 2
? x2
x1
2
? 2 x1 x2 .
?

2 2 2
?y
Случаи (б) и (в) можно объединить: если y = x1 x±1 , то
?1 ?2
± 2 x1 x2
?
= +
2 2 2
y2 x1 x2
?
Можно назвать ?y , ?1 , ?2 абсолютными, а yy , ?1 , ?2 — относительными ошибка-
x1 x2
ми, и, как только что показано, сделать следующие утверждения.
Если ошибки аргументов не коррелированы ( ? = 0), то квадрат абсолютной ошиб-
ки суммы или разности равен сумме квадратов абсолютных ошибок аргументов,
а квадрат относительной ошибки произведения или частного от деления равен сумме
квадратов относительных ошибок аргументов.
Если ошибки аргументов коррелированы положительно ( ? > 0), то ошибка сум-
мы или произведения возрастает (предполагается, что x1 x2 > 0), а разности или
частного от деления — сокращается. Влияние отрицательной корреляции ошибок
аргументов противоположное.
Выражение (5.4), которое фактически дает формулу ошибки среднего, также явля-
ется частным случаем (5.16).
N
1
xi , ? = ? 2 IN , и поскольку
Действительно, в данном случае y = N
i=1
? ?
1
? ?
1? ? 12
? ?,
. 2
. то
g= ?y = ?.
N? ?
. N
? ?
1

В случае, если ошибки величин xj не коррелированы друг с другом и имеют
одинаковую дисперсию ? 2 ( ? = ? 2 In ), то
?y = ? 2 g g,
2
(5.17)
т.е. чем резче меняется значение функции в точке расчета, тем в большей сте-
пени ошибки исходной информации влияют на результат расчета. Возможны си-
туации, когда результат расчета практически полностью определяется ошибками
«на входе».
194 Глава 5. Случайные ошибки

В случае, если известны дисперсии ошибок ?j , а информация о их ковариациях
отсутствует, можно воспользоваться формулой, дающей верхнюю оценку ошибки
результата вычислений:
n
|?j gj | = ?y ,
?y
j=1

где ?j — среднеквадратическое отклонение ?j .

Пусть в данном случае ? — диагональная матрица {?j }, тогда ? = ?R?, где R —
?
корреляционная матрица ( rjj = ?jjj ).
? j

Тогда (5.16) преобразуется к виду:
2
?y = g ?R?g.

Пусть далее |?g| — вектор-столбец {|?j gj |}, а W — диагональная матрица {±1}
такая, что ?g = W |?g|.
Тогда
2
?y = |g ?| W RW |?g| . (5.18)

<<

стр. 7
(всего 28)

СОДЕРЖАНИЕ

>>