<<

стр. 14
(всего 28)

СОДЕРЖАНИЕ

>>

него.

– Полиномиальный тренд:
?t = a0 + a1 t + . . . + ap tp . (11.3)
Для p = 1 имеем линейный тренд.
– Экспоненциальный тренд:
?t = ea0 +a1 t+...+ap t .
p
(11.4)

– Гармонический тренд:
(11.5)
?t = R cos(?t + ?),
где R — амплитуда колебаний, ? — угловая частота, ? — фаза.
– Тренд, выражаемый логистической функцией:
k
(11.6)
?t = .
1 + be?at
Оценивание параметров полиномиального и экспоненциального трендов (по-
сле введения обозначения zi = ti , i = 1, . . . , p, — в первом случае и логарифми-
рования функции во втором случае) производится с помощью обычного МНК.
Гармонический тренд оправдан, когда в составе временного ряда отчетливо
прослеживаются периодические колебания. При этом если частота ? известна
(или ее можно оценить), то функцию (11.5) несложно представить в виде линейной
комбинации синуса и косинуса:
?t = ? cos(?t) + ? sin(?t)
и, рассчитав векторы cos(?t) и sin(?t), также воспользоваться МНК для оцени-
вания параметров ? и ?.
Логистическая кривая нуждается в особом рассмотрении.
358 Глава 11. Основные понятия в анализе временных рядов

11.4.2. Оценка логистической функции

Проанализируем логистическую функцию:

k
(11.7)
?t = ,
1 + be?at
где a, b , k — параметры, подлежащие оцениванию. Функция ограничена и имеет
горизонтальную асимптоту (рис. 11.1):

lim ?t = k.
t>?

В этом преимущество логистической функ-
ции перед полиномиальной или экспонен-
?t
циальной функциями, которые по мере ро-
k ста t стремятся в бесконечность и, следо-
вательно, не всегда годятся для прогнози-
рования.
Логистическая кривая наиболее часто
используется при изучении социальных и,
в частности, демографических процессов.
Особенностью логистической кривой
t
является нелинейность по оцениваемым
параметрам a, b , k, поэтому система
Рис. 11.1. Логистическая кривая
уравнений, получаемая с помощью МНК,
нелинейна относительно неизвестных параметров и для ее решения могут приме-
няться только итеративные численные методы.
Гарольд Готтелинг (H. Hotteling) предложил интересный метод для оценки этих
параметров, основанный на использовании дифференциального уравнения логи-
стической функции. Дифференцирование функции ?t по времени t дает первую
производную:

kabe?at
d?t
= .
(1 + be?at )2
dt

Поскольку

?t2 k k
be?at = ? 1,
и
=
(1 + be?at )2
k ?t

то, подставляя эти выражения в формулу первой производной, получаем диффе-
ренциальное уравнение, выражающее зависимость темпа прироста исследуемой
359
11.4 Использование линейной регрессии

переменной от абсолютного уровня показателя в момент времени t:

d?t /dt a
= a ? ?t . (11.8)
?t k

Исходя из этого соотношения, можно предположить, что в реальности абсо-
лютный прирост показателя ?xt связан с фактическим его уровнем xt следующей
статистической зависимостью:
a
x2 + ?t ,
?xt = axt + ? t
k

где ?t — белый шум.
К этому уравнению теперь можно применить непосредственно метод наимень-
a
ших квадратов, получить оценки параметров a и ? и, следовательно, найти k.
k
Оценка параметра b методом моментов впервые предложена Родсом. Так как
k k
be?at = ? 1, то ln b = at + ln ? 1 и с помощью метода моментов получаем:
?t ?t
T
1 T (T + 1) k
a· ?1
ln b = + ln ,
T 2 ?t
t=1

или фактически после замены ?t на xt имеем:

T k
?1
ln
a(T + 1) xt
t=1
(11.9)
ln b = + .
2 T

Описанный выше метод Готтелинга имеет ограниченную сферу применения, его
использование оправдано лишь в том случае, если наблюдения в исходном времен-
ном ряду представлены через равные промежутки времени (например, ежегодные
или еженедельные данные).


11.4.3. Сезонные колебания

Для моделирования сезонной составляющей ?t можно использовать формулу:

vt = ?1 ?1t + . . . + ?h ?ht ,

где ?jt — сезонные фиктивные переменные, соответствующие h сезонам:
?jt = 1, когда наблюдение относится к сезону j, и ?jt = 0 в противном случае.
360 Глава 11. Основные понятия в анализе временных рядов

Использование в линейной регрессии полного набора таких переменных свя-
зано с одной особенностью. В сумме они дают единицу:

?1t + . . . + ?ht = 1.

Поэтому, коль скоро в регрессии имеется константа, то будет иметь место ли-
нейная зависимость, и ?1 , . . . , ?h нельзя будет оценить однозначно. Таким об-
разом, требуется наложить на коэффициенты ?1 , . . . , ?h какое-либо нормирую-
щее ограничение. В частности, можно положить один из коэффициентов равным
нулю, что эквивалентно неиспользованию соответствующей переменной при по-
строении регрессии. Однако более удачная нормировка состоит в том, чтобы по-
ложить ?1 + . . . + ?h = 0. При этом сезонная компонента центрируется, то есть
в среднем влияние эффекта сезонности на уровень ряда оказывается равным
нулю.
Подставим это ограничение в сезонную компоненту, исключив коэффициент ?1 :

vt = ?(?2 + . . . + ?h )?1t + ?2 ?2t + . . . + ?h ?ht =
= ?2 (?2t ? ?1t ) + . . . + ?h (?ht ? ?1t ).

Новые переменные ?2t ? ?1t , . . . , ?ht ? ?1t будут уже линейно независимыми, и их
можно использовать в линейной регрессии в качестве факторов, а также получить
и оценку структуры сезонности ?1 , . . . , ?h . Трактовать ее следует так: в j-м сезоне
сезонность приводит к отклонению от основной динамики ряда на величину ?j .
Если для описания тренда взять полиномиальную функцию, то, используя ад-
дитивную схему, можно представить временной ряд в виде следующей линейной
регрессии:

xt = a0 + a1 t + . . . + ap tp + ?1 ?1t + . . . + ?h ?ht + ?t ,

где ?1 + . . . + ?h = 0.
В этой регрессии ai и ?j являются неизвестными коэффициентами. При-
менение МНК дает оценки p + h + 1 неизвестных коэффициентов и приводит
к выделению составляющих ?t , vt и ?t .


11.4.4. Аномальные наблюдения

При моделировании временного ряда часто отбрасываются аномальные на-
блюдения, резко отклоняющиеся от направления эволюции ряда. Такого рода
выбросы, вместо исключения, можно моделировать с помощью фиктивных пе-
ременных, соответствующих фиксированным моментам времени. Предположим,
361
11.5. Прогнозы по регрессии с детерминированными факторами

что в момент t? в экономике произошло какое-нибудь важное событие (напри-
мер, отставка правительства). Тогда можно построить фиктивную переменную
t?
?t , которая равна нулю всегда, кроме момента t = t? , когда она равна едини-
t?
це: ?t = (0, . . . , 0, 1, 0, . . . , 0).
Такая фиктивная переменная пригодна только для моделирования кратковре-
менного отклонения временного ряда. Если же в экономике произошел структур-
ный сдвиг, вызвавший скачок в динамике ряда, то следует использовать фиктив-
ную переменную другого вида: (0, . . . , 0, 1, . . . , 1). Эта переменная равна нулю до
некоторого фиксированного момента t? , а после этого момента становится равной
единице.
Заметим, что последние два вида переменных нельзя использовать для про-
гнозирования, поскольку они относятся к единичным непрогнозируемым собы-
тиям.


11.5. Прогнозы по регрессии
с детерминированными факторами.
Экстраполирование тренда
Предположим, что данные описываются линейной регрессией с детерминиро-
ванными регрессорами, являющимися функциями t, и получены оценки парамет-
ров регрессии на основе данных x = (x1 , . . . , xT ) и соответствующей матрицы
факторов Z. Это позволяет построить прогноз на будущее, например на период
T + k. Вообще говоря, прогноз в такой регрессии строится так же, как в любой
классической линейной регрессии. Отличие состоит только в том, что значения
факторов zT +k , необходимые для осуществления прогноза, в данном случае всегда
известны.
Рассмотрим прогнозирование на примере, когда временной ряд моделирует-
ся по упрощенной схеме — тренд плюс шум: xt = ?t + ?t , где ?t = zt ?, zt —
вектор-строка значения факторов регрессии в момент t, ? — вектор-столбец ко-
эффициентов регрессии.
Такое моделирование имеет смысл, если циклические и сезонные компоненты
отсутствуют или мало значимы. Тогда выявленный тренд ?t может служить осно-
вой для прогнозирования. Прогноз величины xT +k строится по формуле условного
математического ожидания xT (k) = zT +k a, где a — оценки параметров, получен-
ные с помощью МНК, т.е. a = (Z Z)?1 Z x. Известно, что такой прогноз обладает
свойством оптимальности.
Предположим, что для описания тренда выбран многочлен:
?t = ?0 + ?1 t + ?2 t2 + . . . + ?p tp , t = 1, . . . , T.
362 Глава 11. Основные понятия в анализе временных рядов

В такой модели матрица факторов имеет следующий вид:
? ?
10 11 ··· 1p ?
?
? ?
? ?
? ?
20 21 ··· 2p
? ?
Z=? ?.
? ?
. . .
..
? ?
. . .
.
. . .
? ?
? ?
T0 T1 ··· Tp

Вектор значений факторов на момент T + k известен определенно:

zT +k = 1, (T + k), (T + k)2 , . . . , (T + k)p .

Точечный прогноз исследуемого показателя в момент времени T на k шагов вперед
равен:

xT (k) = zT +k a = a0 + a1 (T + k) + a2 (T + k)2 + . . . + ap (T + k)p .

Возвратимся к общей теории прогноза. Ошибка прогноза равна:

d = xT +k ? xT (k) = xT +k ? zT +k a.

Ее можно представить как сумму двух отдельных ошибок:

d = (xT +k ? zT +k ?) + (zT +k ? ? zT +k a) = ?T +k + zT +k (? ? a).

Первое слагаемое здесь — это будущая ошибка единичного наблюдения, а вто-
рое — ошибка, обусловленная выборкой и связанная с тем, что вместо неизвест-
ных истинных параметров ? используются оценки a.
Прогноз будет несмещенным, поскольку

E(d) = E(?T +k ) + zT +k E(? ? a) = 0.

Величина xT (k) представляет собой точечный прогноз. Поскольку точечный
прогноз всегда связан с ошибкой, то важно иметь оценку точности этого прогно-
за. Кроме того, вокруг точечного прогноза желательно построить доверительный
интервал и, тем самым, получить интервальный прогноз.
Точность прогноза измеряется, как правило, средним квадратом ошибки про-
гноза, т.е. величиной E(d2 ), или корнем из нее — среднеквадратической ошибкой
прогноза. Поскольку E(d) = 0, то средний квадрат ошибки прогноза равен диспер-
сии ошибки прогноза. Полезным показателем точности является корень из этой
363
11.5. Прогнозы по регрессии с детерминированными факторами

дисперсии — стандартная ошибка прогноза. В предположении отсутствия автокор-
реляции ошибок ?t дисперсия ошибки прогноза, подобно самой ошибке прогноза,
является суммой двух дисперсий: дисперсии ?T +k и дисперсии zT +k (? ? a), а
именно:
2
?d = var(d) = var(?T +k ) + var (zT +k (? ? a)) .

Найдем эту дисперсию, исходя из того, что ошибки гомоскедастичны:

?d = ? 2 + zT +k var(? ? a)zT +k = ? 2 + zT +k var(a)zT +k .
2


Как известно, при отсутствии автокорреляции и гетероскедастичности, оценки
МНК имеют дисперсию
?1
var(a) = ? 2 Z Z .

Поэтому
?1
?d = ? 2 1 + zT +k Z Z
2
zT +k .

Для того чтобы построить доверительный интервал прогноза, следует пред-
положить нормальность ошибок. Более конкретно, предполагаем, что ошибки
регрессии, включая ошибку наблюдения, для которого делается прогноз, имеют
многомерное нормальное распределение с нулевым математическим ожиданием
и ковариационной матрицей ? 2 I. При таком предположении ошибка прогноза
имеет нормальное распределение с нулевым математическим ожиданием и диспер-
2
сией ?d :
2
d ? N (0, ?d ).

Приводя к стандартному нормальному распределению, получим
d
? N (0, 1).
?d

Однако, эта формула еще не дает возможности построить доверительный ин-
2
тервал, поскольку истинная дисперсия прогноза ?d неизвестна. Вместо нее следует
использовать оценку
?1
s2 = s2 1 + zT +k Z Z
?e zT +k ,
d


где s2 — несмещенная оценка дисперсии ошибок регрессии, или остаточная дис-
?e
персия.
364 Глава 11. Основные понятия в анализе временных рядов

Оказывается, что получающаяся величина d sd имеет распределение Стью-
дента с (T ?p?1) степенями свободы (см. Приложение A.3.2), где p — количество
факторов в регрессии (без учета константы): d sd ? tT ?p?1 .
Построим на основе этого вокруг прогноза xT (k) доверительный интервал
для xT +k , учитывая, что d = xT +k ? xT (k):

xT (k) ? sd tT ?p?1,1?q ; xT (k) + sd tT ?p?1,1?q ,

где tT ?p?1,1?q — (1 ? q)-квантиль t-распределения Стьюдента с (T ? p ? 1)
степенями свободы.

Рассмотрим прогнозирование на примере линейного тренда. В этом случае

zT +k = (1, T + k) ,

С учетом того, что
? ?
1 ···
?1 1?
Z =? ?,
2 ··· T
1

произведение Z Z имеет вид:
? ?
T
? t?
T t=1
ZZ=? ?,
2
T T
t t=1 t
t=1
? ?
2
T T
?
? t?
t=1 t
1
?1 t=1
? ?,
(Z Z) = 2
T T
2 ? T
?
T t=1 t t t T
t=1 t=1



2
t + T (T + k)2
T T
? 2(T + k)
t=1 t
?1 t=1
zT +k (Z Z) zT +k = =
2
T T
2 ?
T t=1 t t
t=1

t2
T (T + k)2 ? 2(T + k)t + t2 + ? t2
T
?? ?
t=1 T
= =
T ?2
t=1 (t ? t)
T
2 ?2
T ((T + k) ? t)2 ((T + k) ? t)2
T
t=1 t ? T t
? ? 1
= + = +.
T T T
T t=1 (t ? t)2 T t=1 (t ? t)2 ?2
t=1 (t ? t)
? ? T

Тогда:

((T + k) ? t)2
?
1
?d = ? 2
2
1+ + .
T
t=1 (t ? t)
?2
T
365
11.6. Критерии, используемые в анализе временных рядов

Соответственно,

((T + k) ? t)2
?
1
sd = se
? 1+ + .
T
(t ? t)2
T ?
t=1


Из этой формулы видно, что чем больше горизонт прогноза k, тем больше дисперсия
прогноза и шире прогнозный интервал.



11.6. Критерии, используемые в анализе
временных рядов

В анализе временных рядов наиболее разработанными критериями являют-
ся критерии случайности, которые призваны определить, является ли ряд чисто
случайным, либо в его поведении проявляются определенные закономерности,
которые позволяют делать предсказания. «Чисто случайный ряд» — это в дан-
ном случае неформальный термин, подчеркивающий отсутствие закономерностей.
Здесь может, например, подразумеваться ряд, состоящий из независимых и одина-
ково распределенных наблюдений (что соответствует понятию выборки в обычной
статистике), либо белый шум, в том смысле, который указан ранее.
Среди экономических временных рядов редко встречаются такие, которые под-
ходят под это описание3 . Типичный экономический ряд характеризуется сильной
положительной корреляцией. Очень часто экономические ряды содержат тенден-
цию, сезонность и т.д. В связи с этим применение критериев случайности по пря-
мому назначению не имеет особого смысла. Тем не менее, критерии случайности
играют очень важную роль в анализе временных рядов, и существуют различные
способы их использования:
1) Критерий может быть чувствительным к определенным отклонениям от «слу-
чайности». Тогда большое значение соответствующей статистики может указывать
на наличие именно такого отклонения. Таким образом, статистика критерия мо-
жет использоваться просто как описательная статистика. При этом формальная
проверка гипотезы не производится.
Так, например, автокорреляционная функция, о которой речь пойдет ниже,
очень чувствительна к наличию периодичностей и трендов. Кроме того, по автокор-
реляционной функции можно определить, насколько быстро затухает временна? я
зависимость в рядах4 .
3
Близки к этому, видимо, только темпы прироста курсов ценных бумаг.
4
При интерпретации автокорреляционной функции возникают сложности, связанные с тем,
что соседние значения автокорреляций коррелированы между собой.
366 Глава 11. Основные понятия в анализе временных рядов

2) Критерий можно применять к остаткам от модели, а не к самому исход-
ному ряду. Пусть, например, была оценена модель вида «тренд плюс шум». После
вычитания из ряда выявленного тренда получаются остатки, которые можно рас-
сматривать как оценки случайной компоненты. Наличие в остатках каких-либо
закономерностей свидетельствует о том, что модель неполна, либо в принципе
некорректна. Поэтому критерии случайности можно использовать в качестве диа-
гностических критериев при моделировании.
Следует помнить, однако, что распределение статистики, рассчитанной по
остаткам, и распределение статистики, рассчитанной по исходному случайному
шуму, вообще говоря, не совпадают. В некоторых случаях при большом количе-
стве наблюдений это различие несущественно, но часто в результате критерий
становится несостоятельным и критические значения в исходном виде применять
нельзя5 .
Существует большое количество различных критериев случайности. По-види-
мому, наиболее популярными являются критерии, основанные на автокорреляци-
онной функции.


11.6.1. Критерии, основанные
на автокорреляционной функции

Для того чтобы сконструировать критерии, следует рассмотреть, какими ста-
тистическими свойствами характеризуется автокорреляционная функция стацио-
нарного процесса.
Известно, что выборочные автокорреляции имеют нормальное асимптотиче-
ское распределение. При большом количестве наблюдений математическое ожи-
дание rk приближенно равно ?k . Дисперсия автокорреляции приближенно равна
+?
1
[?2 + ?i?k ?i+k ? 4?k ?i ?i+k + 2?2 ?2 ].
var(rk ) ? (11.10)
i ki
T i=??

Для ковариации двух коэффициентов автокорреляции верно приближение

cov(rk , rl ) ? (11.11)
+?
1
[?i+k ?i+l + ?i?k ?i+l ? 2?k ?i ?i+l ? 2?l ?i ?i+k + 2?k ?l ?2 ]
? i
T i=??

Эти аппроксимации были выведены Бартлеттом.
5
Так, Q-статистика, о которой идет речь ниже, в случае остатков модели ARMA(p, q) будет
распределена не как ?2 , а как ?2 2
m?p?q . Применение распределения ?m приводит к тому, что
m
нулевая гипотеза о «случайности» принимается слишком часто.
367
11.6. Критерии, используемые в анализе временных рядов

В частности, для белого шума (учитывая, что ?k = 0 при k = 0) получаем
согласно формуле (11.10)

1
var(rk ) ? (11.12)
.
T
Это только грубое приближение для дисперсии. Для гауссовского белого шума
известна точная формула для дисперсии коэффициента автокорреляции:

T ?k
(11.13)
var(rk ) = .
T (T + 2)

Кроме того, из приближенной формулы (11.11) следует, что автокорреляции rk
и rl , соответствующие разным порядкам ( k = l), некоррелированы.
Эти формулы позволяют проверять гипотезы относительно автокорреляцион-
ных коэффициентов. Так, в предположении, что ряд представляет собой белый
шум, можно использовать следующий доверительный интервал для отдельного ко-
эффициента автокорреляции:

T ?k T ?k
rk ? ?1?? , rk +
? ?1?? ,
?
T (T + 2) T (T + 2)

где ?1?? — квантиль нормального распределения. При больших T и малых k
?
оправдано использование более простой формулы

?1??
? ?1??
?
rk ? v , rk + v ,
T T

Вместо того чтобы проверять отсутствие автокорреляции для каждого отдель-
ного коэффициента, имеет смысл использовать критерий случайности, основанный
на нескольких ближних автокорреляциях. Рассмотрим m первых автокорреляций:
r1 , . . . , rm . В предположении, что ряд является белым шумом, при большом коли-
1
честве наблюдений их совместное распределение приближенно равно N 0, T Im .
На основе этого приближения Бокс и Пирс предложили следующую статистику, на-
зываемую Q-статистикой Бокса—Пирса:
m
2
Q (r) = T rk .
k=1

Она имеет асимптотическое распределение ?2 .
m
При дальнейшем изучении выяснилось, что выборочные значения Q-статис-
тики Бокса—Пирса могут сильно отклонятся от распределения ?2 . Для улучшения
m
368 Глава 11. Основные понятия в анализе временных рядов

аппроксимации Льюнг и Бокс предложили использовать точную формулу диспер-
сии (11.13) вместо (11.12). Полученная ими статистика, Q-статистика Льюнга—
Бокса:
2
m
rk
?
Q (r) = T (T + 2) ,
T ?k
k=1


тоже имеет асимптотическое распределение ?2 , однако при малом количестве
m
наблюдений демонстрирует гораздо лучшее соответствие этому асимптотическому
распределению, чем статистика Бокса—Пирса.
Было показано, что критерий не теряет своей состоятельности даже при невы-
полнении гипотезы о нормальности процесса. Требуется лишь, чтобы дисперсия
была конечной.
Нулевая гипотеза в Q-критерии заключается в том, что ряд представляет собой
белый шум, то есть является чисто случайным процессом. Используется стандарт-
ная процедура проверки: если расчетное значение Q-статистики больше заданного
квантиля распределения ?2 , то нулевая гипотеза отвергается и признается нали-
m
чие автокорреляции до m-го порядка в исследуемом ряду.
Кроме критериев случайности можно строить и другие критерии на основе ав-
токорреляций. Пусть, например, ?i = 0 при i k, т.е. процесс автокоррелирован,
но автокорреляция пропадает после порядка k 6 . Тогда по формуле 11.10 получаем

k?1
?2 .
var(rk ) ? 1 + 2 i
i=1

Если в этой формуле заменить теоретические автокорреляции выборочными, то по-
лучим следующее приближение:

k?1
2
var(rk ) ? 1 + 2 ri .
i=1


На основе этого приближения (приближения Бартлетта) с учетом асимптотиче-
ской нормальности можно стандартным образом построить доверительный интер-
вал для rk :

rk ? ?1?? var(rk ), rk + ?1?? var(rk ) .
? ?

6
Это предположение выполнено для процессов скользящего среднего MA(q) при q < k
(см. п. 14.4).
369
11.6. Критерии, используемые в анализе временных рядов

0.8

Автокорреляции
0.6


95%-е доверительные
0.4
интервалы


0.2



0.0


-0.2
0 10 20 30 40

Рис. 11.2. Коррелограмма с доверительными интервалами, основанными на формуле Бартлетта.


На рисунке 11.2 представлена коррелограмма некоторого ряда с доверитель-
ными интервалами, основанными на формуле Бартлетта7 . Для удобства довери-
тельные интервалы построены вокруг нуля, а не вокруг rk .


11.6.2. Критерий Спирмена

Критерий Спирмена принадлежит к числу непараметрических8 критериев про-
верки случайности временного ряда и связан с использованием коэффициента ран-
говой корреляции Спирмена. Он позволяет уловить наличие или отсутствие тренда
в последовательности наблюдений за исследуемой переменной.
Идея критерия состоит в следующем. Допустим, что имеется временной ряд,
представленный в хронологической последовательности. Если ряд случайный,
то распределение отдельного наблюдения не зависит от того, в каком месте ря-
да стоит это наблюдение, какой номер оно имеет. При расчете критерия Спирмена
в соответствие исходному ряду ставится проранжированный ряд, т.е. полученный
в результате сортировки изучаемой переменной по возрастанию или по убыванию.
Новый порядок, или ранг ?t , сравнивается с исходным номером t, соответству-
7
При использовании нескольких доверительных интервалов следует отдавать себе отчет, что они
не являются совместными. В связи с этим при одновременном использовании интервалов вероят-
ность ошибки первого рода будет выше ?
8
В отличие от параметрических, непараметрические критерии не имеют в своей основе априорных
предположений о законах распределения временного ряда.
370 Глава 11. Основные понятия в анализе временных рядов

ющим хронологической последовательности. Эти порядки будут независимы для
чисто случайного процесса и коррелированы при наличии тенденции.
В крайнем случае, если ряд всегда возрастает, то полученная ранжировка
совпадает с исходным порядком наблюдений, т.е. t = ?t для всех наблюдений
t = 1, . . . , T . В общем случае тесноту связи между двумя последовательностя-
ми 1, . . . , T и ?1 , . . . , ?T можно измерить с помощью обычного коэффициента
корреляции:
T
t=1 xt yt
??
(11.14)
?= ,
?2 ?2
T T
t=1 xt t=1 yt

заменяя xt на t и yt на ?t . Такой показатель корреляции между рангами наблю-
дений (когда xt и yt представляют собой перестановки первых T натуральных
чисел) в статистике называется коэффициентом ранговой корреляции Спирмена:

T
6
(?t ? t)2 .
? =1? (11.15)
T (T 2 ? 1) t=1


Для чисто случайных процессов ? имеет нулевое математическое ожидание
1
и дисперсию, равную . В больших выборках величина ? приближенно имеет
T ?1
1
нормальное распределение N (0, ). Для малых выборок предпочтительнее
T ?1
T ?2
использовать в качестве статистики величину ? , которая приближенно
1 ? ?2
имеет распределение Стьюдента с T ? 2 степенями свободы. Если искомая рас-
четная величина по модулю меньше двусторонней критической границы распре-
деления Стьюдента, то нулевая гипотеза о том, что процесс является случайным,
принимается и утверждается, что тенденция отсутствует. И наоборот, если искомая
величина по модулю превосходит табличное значение, т.е. значение коэффициента
? существенно отлично от нуля, то нулевая гипотеза о случайности ряда отверга-
ется. Как правило, это можно интерпретировать как наличие тенденции.


11.6.3. Сравнение средних

Кроме критериев случайности можно использовать различные способы про-
верки неизменности во времени моментов первого и второго порядков. Из всего
многообразия подобных критериев рассмотрим лишь некоторые.
В статистике существует ряд критериев, оценивающих неоднородность выбор-
ки путем ранжирования наблюдений с последующим разбиением их на группы
371
11.6. Критерии, используемые в анализе временных рядов

и сравнением межгрупповых показателей. Эти критерии применимы и к времен-
ным рядам. При анализе временных рядов нет необходимости в ранжировании
наблюдений и поиске адекватного способа сортировки — их порядок автоматиче-
ски закреплен на временном интервале. Например, можно проверять, является ли
математическое ожидание («среднее») постоянным или же в начале ряда оно иное,
чем в конце.
Разобьем ряд длиной T на две части примерно равной длины: x1 , . . . , xT1
и xT1 +1 , . . . , xT . Пусть x1 — среднее, s2 — выборочная дисперсия (несмещен-
? 1
ная оценка), T1 — количество наблюдений по первой части ряда, а x2 , s2 и T2 =
? 2
= T ? T1 — те же величины по второй части.
Статистика Стьюдента для проверки равенства средних в двух частях ряда
равна9

T1 + T2 ? 2
t = (?1 ? x2 ) (11.16)
x ? .
(1/T1 + 1/T2 ) (T1 ? 1)s2 + (T2 ? 1)s2
1 2


В предположении, что ряд является гауссовским белым шумом, данная стати-
стика имеет распределение Стьюдента с T1 + T2 ? 2 степенями свободы. Если
статистика t по модулю превосходит заданный двусторонний квантиль распреде-
ления Стьюдента, то нулевая гипотеза отвергается.
Данный критерий имеет хорошую мощность в случае, если альтернативой яв-
ляется ряд со структурным сдвигом. С помощью данной статистики также мож-
но обнаружить наличие тенденции в изучаемом ряде. Для того чтобы увеличить
мощность критерия в этом случае, можно среднюю часть ряда (например, треть
наблюдений) не учитывать. При этом T1 + T2 < T .
Рассчитать статистику при T1 + T2 = T можно с помощью вспомогательной
регрессии следующего вида:

xt = ?zt + ? + ?,

где zt — фиктивная переменная, принимающая значение 0 в первой части ряда
и 1 во второй части ряда. Статистика Стьюдента для переменной zt совпадает
со статистикой (11.16).
Критерий сравнения средних применим и в случае, когда ряд xt не являет-
ся гауссовским, а имеет какое-либо другое распределение. Однако его использо-
вание в случае автокоррелированного нестационарного ряда для проверки неиз-
менности среднего неправомерно, поскольку критерий чувствителен не только

Формула (11.16) намеренно записана без учета того, что T1 + T2 = T , чтобы она охватывала
9

и вариант использования с T1 + T2 < T , о котором речь идет ниже.
372 Глава 11. Основные понятия в анализе временных рядов

к структурным сдвигам, но и к автокоррелированности ряда. Поэтому в исход-
ном виде критерий сравнения средних следует считать одним из критериев случай-
ности.
В какой-то степени проблему автокорреляции (а одновременно и гетероске-
дастичности) можно решить за счет использования устойчивой к автокорреляции
и гетероскедастичности оценки Ньюи—Уэста (см. п. 8.3). При использовании этой
модификации критерий сравнения средних перестает быть критерием случайности
и его можно использовать как критерий стационарности ряда.
Легко распространить этот метод на случай, когда ряд разбивается более чем
на две части. В этом случае во вспомогательной регрессии будет более одной фик-
тивной переменной и следует применять уже F -статистику, а не t-статистику. Так,
разбиение на три части может помочь выявить U-образную динамику среднего
(например, в первой и третьей части среднее велико, а во второй мало).
Ясно, что с помощью подобных регрессий можно также проверять отсутствие
неслучайной зависящей от времени t компоненты другого вида. Например, пере-
менная zt может иметь вид линейного тренда zt = t. Можно также дополнительно
включить в регрессию t2 , t3 и т.д. и тем самым «уловить» нелинейную тенденцию.
Однако в таком виде по указанным выше причинам следует проявлять осторож-
ность при анализе сильно коррелированных рядов.


11.6.4. Постоянство дисперсии

Сравнение дисперсий
Так же как при сравнении средних, при сравнении дисперсий последователь-
ность xt разбивается на две группы с числом наблюдений T1 и T2 = T ? T1 , для
каждой из них вычисляется несмещенная дисперсия s2 и строится дисперсионное
i
отношение:

s2
F = 2. (11.17)
s2
1


Этот критерий представляет собой частный случай критерия Голдфельда—
Квандта (см. п. 8.2).
Если дисперсии однородны и выполнено предположение о нормальности рас-
пределения исходного временного ряда (более точно — ряд представляет со-
бой гауссовский белый шум), то F -статистика имеет распределение Фишера
FT2 ?1, T1 ?1 (см. Приложение A.3.2).
Смысл данной статистики состоит в том, что, когда дисперсии сильно отли-
чаются, статистика будет либо существенно больше единицы, либо существенно
373
11.7. Лаговый оператор

меньше единицы. В данном случае естественно использовать двусторонний крите-
рий (поскольку мы априорно не знаем, растет дисперсия или падает). Это, конечно,
не совсем обычно для критериев, основанных на F -статистике. Для уровня ?
можно взять в качестве критических границ такие величины, чтобы вероятность
попадания и в левый, и в правый хвост была одной и той же — ? 2 .
Нулевая гипотеза состоит в том, что дисперсия однородна. Если дисперсионное
отношение попадает в один из двух хвостов, то нулевая гипотеза отклоняется.
Мощность критерия можно увеличить, исключив часть центральных наблюде-
ний. Этот подход оправдан в случае монотонного поведения дисперсии временного
ряда, тогда дисперсионное отношение покажет больший разброс значений.
Если же временной ряд не монотонен, например имеет U-образную форму,
то мощность теста в результате исключения центральных наблюдений существенно
уменьшается.
Как и в случае сравнения средних, критерий применим только в случае, когда
проверяемый процесс является белым шумом. Если же, например, ряд является
стационарным, но автокоррелированным, то данный критерий применять не сле-
дует.


11.7. Лаговый оператор
Одним из основных понятий, употребляемых при моделировании временных ря-
дов, является понятие лага. В буквальном смысле в переводе с английского лаг —
запаздывание. Под лагом некоторой переменной понимают ее значение в преды-
дущие периоды времени. Например, для переменной xt лагом в k периодов бу-
дет xt?k .
При работе с временными рядами удобно использовать лаговый оператор L,
т.е. оператор запаздывания, сдвига назад во времени. Хотя часто использование
этого оператора сопряжено с некоторой потерей математической строгости, однако
это окупается значительным упрощением вычислений.
Если к переменной применить лаговый оператор, то в результате получится лаг
этой переменной:

Lxt = xt?1 .

Использование лагового оператора L обеспечивает сжатую запись разностных
уравнений и помогает изучать свойства целого ряда процессов.
Удобство использования лагового оператора состоит в том, что с ним можно об-
ращаться как с обычной переменной, т.е. операторы можно преобразовывать сами
по себе, без учета тех временных рядов, к которым они применяются. Основное
374 Глава 11. Основные понятия в анализе временных рядов

отличие лагового оператора от обычной переменной состоит в том, что оператор
должен стоять перед тем рядом, к которому применяется, т.е. нельзя переставлять
местами лаговый оператор и временной ряд.
Как и для обычных переменных, существуют функции от лагового оператора,
они, в свою очередь, тоже являются операторами. Простейшая функция — сте-
пенная.
По определению, для целых m

Lm xt = xt?m ,

т.е. Lm , действующий на xt , означает запаздывание этой переменной на m пери-
одов.
Продолжая ту же логику, можно определить многочлен от лагового оператора,
или лаговый многочлен:
m
?i Lt?k = ?0 + ?1 L + · · · + ?m Lm .
?(L) =
i=0

Если применить лаговый многочлен к переменной xt , то получается

?(L)xt = (?0 + ?1 L + · · · + ?m Lm )xt = ?0 xt + ?1 xt?1 + · · · + ?m xt?m .

Нетрудно проверить, что лаговые многочлены можно перемножать как обыч-
ные многочлены. Например,

(?0 + ?1 L)(?0 + ?1 L) = ?0 ?0 + (?1 ?0 + ?0 ?1 )L + ?1 ?1 L2 .

При m > ? получается бесконечный степенной ряд от лагового оператора:
?
?i Li xt = (?0 + ?1 L + ?2 L2 + · · · )xt =
i=0
?
= ?0 xt + ?1 xt?1 + ?2 xt?2 + · · · = ?i xt?i .
i=0

Полезно помнить следующие свойства лаговых операторов:

1) Лаг константы есть константа: LC = C.

2) Дистрибутивность: (Li + Lj )xt = Li xt + Lj xt = xt?i + xt?j .

3) Ассоциативность: Li Lj xt = Li (Lj xt ) = Li xt?j = xt?i?j . Заметим, что:
L0 xt = xt , т.е. L0 = I.
375
11.8. Модели регрессии с распределенным лагом

4) L, возведенный в отрицательную степень, — опережающий оператор:
L?i xt = xt+i .

5) При |?| < 1 бесконечная сумма
(1 + ?L + ?2 L2 + ?3 L3 + . . . )xt = (1 ? ?L)?1 xt .
Для доказательства умножим обе части уравнения на (1 ? ?L):
(1 ? ?L)(1 + ?L + ?2 L2 + ?3 L3 + . . . )xt = xt , поскольку при |?| < 1
выражение ?n Ln xt > 0 при n > ?.

Кроме лагового оператора в теории временных рядов широко используют раз-
ностный оператор ?, который определяется следующим образом:

? = 1 ? L,

так что ?xt = (1 ? L)xt = xt ? xt?1 .
Разностный оператор превращает исходный ряд в ряд первых разностей.
Ряд d-х разностей (разностей d-го порядка) получается как степень разност-
ного оператора, то есть применением разностного оператора d раз.
При d = 2 получается ?2 = (1 ? L)2 = 1 ? 2L + L2 , поэтому ?2 xt =
= (1 ? 2L + L2 )xt = xt ? 2xt?1 + xt?2 .
Для произвольного порядка d следует использовать формулу бинома Ньютона:
d
d!
? = (1 ? L) =
d d
(?1)k Cd Lk , где Cd =
k k
,
k!(d ? k)!
k=0

так что ?d xt = (1 ? L)d xt = d kk .
k=0 (?1) Cd xt?k



11.8. Модели регрессии с распределенным лагом
Часто при моделировании экономических процессов на изучаемую переменную
xt влияют не только текущие значения объясняющего фактора zt , но и его ла-
ги. Типичным примером являются капиталовложения: они всегда дают результат
с некоторым лагом.
Модель распределенного лага можно записать следующим образом:


q
(11.18)
xt = µ + ?j zt?j + ?t = µ + ?(L)zt + ?t .
j=0
376 Глава 11. Основные понятия в анализе временных рядов

j
где q — величина наибольшего лага, ?(B) = q ?j L — лаговый многочлен,
j=0 j
?t — случайное возмущение, ошибка. Коэффициенты ?j задают структуру лага
и называются весами. Конструкцию q ?j zt?j часто называют «скользящим
j=0
10 .
средним» переменной zt
Рассмотрим практические проблемы получения оценок коэффициентов ?j
в модели (11.18). Модель распределенного лага можно оценивать обычным ме-
тодом наименьших квадратов, если выполнены стандартные предположения ре-
грессионного анализа. В частности, количество лагов не должно быть слишком
большим, чтобы количество регрессоров не превышало количество наблюдений,
и все лаги переменной zt , т.е. zt?j (j = 0, . . . , q), не должны быть коррелированы
с ошибкой ?t .
Одна из проблем, возникающих при оценивании модели распределенного лага,
найти величину наибольшего лага q. При этом приходится начать с некоторого
предположения, то есть взять за основу число Q, выше которого q быть не может.
Выбор такого числа осуществляется на основе некоторой дополнительной инфор-
мации, например, опыта человека, который оценивает модель. Можно предложить
следующие способы практического определения величины q.
1) Для каждого конкретного q оценивается модель (11.18), и из нее берется
t-статистика для последнего коэффициента, т.е. ?q . Эти t-статистики рассматри-
ваются в обратном порядке, начиная с q = Q (и заканчивая q = 0). Как только
t-статистика оказывается значимой при некотором наперед заданном уровне, то
следует остановиться и выбрать соответствующую величину q.
2) Следует оценить модель (11.18) при q = Q. Из этой регрессии берутся
F -статистики для проверки нулевой гипотезы о том, что коэффициенты при по-
следних Q ? q + 1 лагах, т.е. ?q , . . . , ?Q , одновременно равны нулю:

?j = q, . . . , Q.
H0 : ?j = 0,

Соответствующие F -статистики рассчитываются по формулам:

(RSSQ ? RSSq?1 )/(Q ? q + 1)
Fq = ,
RSSQ /(T ? Q ? 2)

где RSSr — сумма квадратов остатков из модели распределенного лага при q = r,
T — количество наблюдений. При этом при проведении расчетов для сопостави-
мости во всех моделях надо использовать одни и те же наблюдения — те, которые
использовались при q = Q (следовательно, при всех q используется одно и то же
T ). Эти F -статистики рассматриваются в обратном порядке от q = Q до q = 0
(в последнем случае в модели переменная z отсутствует). Как только F -статистика
10
Другое часто используемое название — «линейный фильтр».
377
11.9. Условные распределения

оказывается значимой при некотором наперед заданном уровне, то следует оста-
новиться и выбрать соответствующую величину q.
3) Для всех q от q = 0 до q = Q рассчитывается величина информационно-
го критерия, а затем выбирается модель с наименьшим значением этого инфор-
мационного критерия. Приведем наиболее часто используемые информационные
критерии.
Информационный критерий Акаике:
RSS 2(n + 1)
AIC = ln( )+ ,
T T
где RSS сумма квадратов остатков в модели, T — фактически использовавшееся
количество наблюдений, n — количество факторов в регрессии (не считая кон-
станту). В рассматриваемом случае n = q + 1, а T = T0 ? q, где T0 — количество
наблюдений при q = 0.
Байесовский информационный критерий (информационный критерий
Шварца):
RSS (n + 1) ln T
BIC = ln( )+ .
T T
Как видно из формул, критерий Акаике благоприятствует выбору более корот-
кого лага, чем критерий Шварца.


11.9. Условные распределения
Условные распределения играют важную роль в анализе временных рядов, осо-
бенно при прогнозировании. Мы не будем вдаваться в теорию условных распре-
делений, это предмет теории вероятностей (определения и свойства условных рас-
пределений см. в Приложении A.3.1). Здесь мы рассмотрим лишь основные пра-
вила, по которым можно проводить преобразования. При этом будем использовать
следующее стандартное обозначение: если речь идет о распределении случайной
величины X, условном по случайной величине Y (условном относительно Y ),
то это записывается в виде X|Y .
Основное правило работы с условными распределениями, которое следует за-
помнить, состоит в том, что если рассматривается распределение, условное отно-
сительно случайной величины Y , то с Y и ее функциями следует поступать так же,
как с детерминированными величинами. Например, для условных математических
ожиданий и дисперсий выполняется
E (?(Y ) + ?(Y )X|Y ) = ?(Y ) + ?(Y )E(X|Y ),
var (?(Y ) + ?(Y )X|Y ) = ? 2 (Y )var(X|Y ).
378 Глава 11. Основные понятия в анализе временных рядов

Как и обычное безусловное математическое ожидание, условное ожидание
представляет собой линейный оператор. В частности, ожидание суммы есть сумма
ожиданий:

E (X1 + X2 |Y ) = E(X1 |Y ) + E(X2 |Y ).

Условное математическое ожидание E(X|Y ) в общем случае не является де-
терминированной величиной, т.е. оно является случайной величиной, которая мо-
жет иметь свое математическое ожидание, характеризоваться положительной дис-
персией и т.п.
Если от условного математического ожидания случайной величины X еще
раз взять обычное (безусловное) математическое ожидание, то получится обычное
(безусловное) математическое ожидание случайной величины X. Таким образом,
действует следующее правило повторного взятия ожидания:

E (E(X|Y )) = E(X).

В более общей форме это правило имеет следующий вид:

E (E(X|Y, Z)|Y ) = E(X|Y ),

что позволяет применять его и тогда, когда второй раз ожидание берется не полно-
стью, т.е. не безусловное, а лишь условное относительно информации, являющейся
частью информации, относительно которой ожидание бралось первый раз.
Если случайные величины X и Y статистически независимы, то распределе-
ние X, условное по Y , совпадает с безусловным распределением X. Следова-
тельно, для независимых случайных величин X и Y выполнено, в частности,

E(X|Y ) = E(X), var(X|Y ) = var(X).


11.10. Оптимальное в среднеквадратическом
смысле прогнозирование: общая теория
11.10.1. Условное математическое ожидание
как оптимальный прогноз

Докажем в абстрактном виде, безотносительно к моделям временных рядов,
общее свойство условного математического ожидания, заключающееся в том, что
оно минимизирует средний квадрат ошибки прогноза.
Предположим, что строится прогноз некоторой случайной величины x на ос-
нове другой случайной величины, z, и что точность прогноза при этом оценивается
11.10 Оптимальное в среднеквадратическом смысле прогнозирование 379

на основе среднего квадрата ошибки прогноза ? = x ? xp (z), где xp (z) — про-
гнозная функция. Таким образом, требуется получить прогноз, который бы мини-
мизировал

E ? 2 = E (x ? xp (z))2 .

Оказывается, что наилучший в указанном смысле прогноз дает математическое
ожидание x, условное относительно z, т.е. E (x|z), которое мы будем обозначать
x(z). Докажем это. Возьмем произвольный прогноз xp (z) и представим ошибку
?
прогноза в виде:

x ? xp (z) = ? = (x ? x(z)) + (?(z) ? xp (z)) .
? x

Найдем сначала математическое ожидание квадрата ошибки, условное относи-
тельно z:

E ? 2 |z = E (x ? x(z))2 |z +
?

+ 2E [(x ? x(z))(?(z) ? xp (z))|z] + E (?(z) ? xp (z)t)2 |z .
? x x

При взятии условного математического ожидания с функциями z можно обра-
щаться как с константами. Поэтому

E (?(z) ? xp (z))2 |z = (?(z) ? xp (z))2
x x

и

E [(x ? x(z))(?(z) ? xp (z))|z] = E (x ? x(z)|z) (?(z) ? xp (z)) =
? x ? x
= (?(z) ? x(z))(?(z) ? xp (z)) = 0.
x ? x

Используя эти соотношения, получим

E ? 2 |z = E (x ? x(z))2 |z + (?(z) ? xp (z))2 .
? x

Если теперь взять от обеих частей безусловное математическое ожидание,
то (по правилу повторного взятия ожидания) получится

E ? 2 = E (x ? x(z))2 + E (?(z) ? xp (z))2 .
? x

Поскольку второе слагаемое неотрицательно, то

E (x ? xp (z))2 = E ? 2 ? E (x ? x(z))2 .
?
380 Глава 11. Основные понятия в анализе временных рядов

Другими словами, средний квадрат ошибки прогноза достигает минимума при
xp (z) = x(z) = E (x|z).
?
Оптимальный прогноз xp (z) = x(z) = E (x|z) является несмещенным. Дей-
?
ствительно, по правилу повторного взятия ожидания

E (E (x|z)) = E (x) .

Поэтому

E? = E (x ? xp (z)) = E (x) ? E (E (x|z)) = 0.


11.10.2. Оптимальное линейное прогнозирование

Получим теперь формулу для оптимального (в смысле минимума среднего квад-
рата ошибки) линейного прогноза. Пусть случайная переменная z, на основе кото-
рой делается прогноз x, представляет собой n-мерный вектор: z = (z1 , . . . , zn ) .
Без потери общности можно предположить, что x и z имеют нулевое математи-
ческое ожидание. Будем искать прогноз x в виде линейной комбинации zj :

xp (z) = ?1 z1 + . . . + ?n zn = z ?,

где ? = (?1 , . . . , ?n ) — вектор коэффициентов. Любой прогноз такого вида яв-
ляется несмещенным, поскольку, как мы предположили, Ex = 0 и Ez = 0.
Требуется решить задачу минимизации среднего квадрата ошибки (в данном
случае это эквивалентно минимизации дисперсии ошибки):

E (x ? xp (z))2 > min!
?

Средний квадрат ошибки можно представить в следующем виде:

E (x ? xp (z))2 = E x2 ? 2? zx + ? zz ? = ?x ? 2? Mzx + ? Mzz ?,
2


где ?x = Ex2 — дисперсия x, Mzx = E [zx] — вектор, состоящий из ковариаций
2

zj и x, а Mzz = E [zz ] — ковариационная матрица z. (Напомним, что мы рас-
сматриваем процессы с нулевым математическим ожиданием.) Дифференцируя по
?, получим следующие нормальные уравнения:

?2Mzx + 2Mzz ? = 0,

откуда
?1
? = Mzz Mzx .
11.10 Оптимальное в среднеквадратическом смысле прогнозирование 381

Очевидна аналогия этой формулы с оценками МНК, только матрицы вторых мо-
ментов здесь не выборочные, а теоретические.
Таким образом, оптимальный линейный прогноз имеет вид:
?1
xp (z) = z Mzz Mzx . (11.19)

Ошибка оптимального линейного прогноза равна
?1
? = x ? xp (z) = x ? z Mzz Mzx .

Эта ошибка некоррелирована с z, то есть с теми переменными, по которым
делается прогноз. Действительно, умножая на z и беря математическое ожидание,
получим
?1 ?1
E (z?) = E zx ? zz Mzz Mzx = Mzx ? Mzz Mzz Mzx ,

т.е.

E (z?) = 0.

Средний квадрат ошибки оптимального прогноза равен

E ? 2 = E (x ? xp (z))2 = ?x ? 2Mxz Mzz Mzx + Mxz Mzz Mzz Mzz Mzx .
2 ?1 ?1 ?1



После преобразований получаем

E ? 2 = ?x ? Mxz Mzz Mzx .
2 ?1
(11.20)

Несложно увидеть аналогии между приведенными формулами и формулами
МНК. Таким образом, данные рассуждения можно считать одним из возможных
теоретических обоснований линейного МНК.
Для того чтобы применить приведенные формулы, требуется, чтобы матрица
Mzz была обратимой. Если она вырождена, то это означает наличие мультиколли-
неарности между переменными z.
Проблема вырожденности решается просто. Во-первых, можно часть «лиш-
них» компонент z не использовать — оставить только такие, которые линейно
независимы между собой. Во-вторых, в вырожденном случае прогноз можно по-
лучить по той же формуле xp (z) = z ?, взяв в качестве коэффициентов ? любое
решение системы линейных уравнений Mzz ? = Mzx (таких решений будет беско-
нечно много). Средний квадрат ошибки прогноза рассчитывается по формуле:

E ? 2 = ?x ? Mxz ?.
2
382 Глава 11. Основные понятия в анализе временных рядов

В общем случае оптимальный линейный прогноз (11.19) не совпадает с услов-
ным математическим ожиданием E (x|z). Другими словами, он не является опти-
мальным среди всех возможных прогнозов. Пусть, например, z имеет стандартное
нормальное распределение: z ? N (0, 1), а x связан с z формулой x = z 2 ? 1.
Тогда, поскольку x и z некоррелированы, то ? = 0, и оптимальный линейный
прогноз имеет вид xp (z) = 0 при среднем квадрате ошибки прогноза равном
E (z 2 ? 1)2 = 2. В то же время прогноз по нелинейной формуле xp (z) = z 2 ? 1
будет безошибочным (средний квадрат ошибки прогноза равен 0).
В частном случае, когда совместное распределение x и z является многомер-
ным нормальным распределением:

? ? ?? ?? ??
2
?x? ?? 0 ? ? ?x Mxz ??
? ? N ??
? ?,? ?? ,
z 0n Mzx Mzz


оптимальный линейный прогноз является просто оптимальным. Это связано с тем,
что по свойствам многомерного нормального распределения (см. Приложение
A.3.2) условное распределение x относительно z будет иметь следующий вид:

?1 2 ?1
x|z ? N z Mzz Mzx , ?x ? Mxz Mzz Mzx .

?1
Таким образом, E (x|z) = z Mzz Mzx , что совпадает с формулой оптимального
линейного прогноза (11.19).



11.10.3. Линейное прогнозирование
стационарного временного ряда

Пусть xt — слабо стационарный процесс с нулевым математическим ожида-
нием. Рассмотрим проблему построения оптимального линейного прогноза этого
процесса, если в момент t известны значения ряда, начиная с момента 1, т.е. толь-
ко конечный ряд x = (x1 , . . . , xt ). Предположим, что делается прогноз на ? шагов
вперед, т.е. прогноз величины xt+? . Для получения оптимального линейного (по
x) прогноза можно воспользоваться формулой (11.19). В случае стационарного
временного ряда ее можно переписать в виде:


xt (? ) = x ??1 ? t,? , (11.21)
t
11.10 Оптимальное в среднеквадратическом смысле прогнозирование 383

где
? ?
· · · ?t?1 ?
? ?0 ?1
? ?
? ?
?? ?t?2 ?
···
?0
? ?
1
?t = ? ?
?. .?
. ..
?. .?
. .
?. . .?
? ?
?t?1 ?t?2 · · · ?0

— автоковариационная матрица ряда (x1 , . . . , xt ), а вектор ? t,? составлен из
ковариаций xt+? с (x1 , . . . , xt ), т.е.

? t,? = (?t+? ?1 , . . . , ?? ) .

Можно заметить, что автоковариации здесь нужно знать только с точностью до
множителя. Например, их можно заменить автокорреляциями.
Рассмотрим теперь прогнозирование на один шаг вперед. Обозначим через ? t
вектор, составленный из ковариаций xt+1 с (x1 , . . . , xt ), т.е. ? t = (?t , . . . , ?1 ) =
= ? t,1 . Прогноз задается формулой:
t
??1 ? t t
?t xt?i .
xt (1) = x =x? = i
t
i=1

Прогноз по этой формуле можно построить только если матрица ?t неособенная.
Коэффициенты ?t , минимизирующие средний квадрат ошибки прогноза, задаются
i
нормальными уравнениями ?t ? = ? t или, в развернутом виде,
t
?t ?|k?i| = ?k , k = 1, . . . , t.
i
i=1

Ошибка прогноза равна

? = xt+1 ? xt (1).

Применив (11.20), получим, что средний квадрат этой ошибки равен

E ? 2 = ?0 ? ? t ??1 ? t .
t


Заметим, что ?0 ? ? t ??1 ? t = |?t+1 | / |?t |, т.е предыдущую формулу можно пере-
t
писать как

<<

стр. 14
(всего 28)

СОДЕРЖАНИЕ

>>