стр. 1
(всего 28)

СОДЕРЖАНИЕ

>>

Оглавление



Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11



I Введение в социально-экономическую статистику 15

1. Основные понятия 17
1.1. Краткая историческая справка . . . . . . . . . . . . . . . . . . . . 17
1.2. Предмет статистики . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3. Экономические величины и статистические показатели . . . . . . . 20
1.4. Вероятностная природа экономических величин . . . . . . . . . . . 22
1.5. Проблемы измерений . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.6. Специфика экономических измерений . . . . . . . . . . . . . . . . 27
1.7. Адекватность экономических измерений . . . . . . . . . . . . . . . 29
1.8. Типы величин, связи между ними . . . . . . . . . . . . . . . . . . . 32
1.9. Статистические совокупности и группировки ............ 36
1.10. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2. Описательная статистика 48
2.1. Распределение частот количественного признака . . . . . . . . . . 48
2.2. Средние величины . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.3. Медиана, мода, квантили . . . . . . . . . . . . . . . . . . . . . . . 66

3
4 Оглавление

2.4. Моменты и другие характеристики распределения . . . . . . . . . . 70
2.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 83

3. Индексный анализ 89
3.1. Основные проблемы . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Способы построения индексов .................... 93
3.3. Факторные представления приростных величин . . . . . . . . . . . 100
3.4. Случай, когда относительных факторов более одного . . . . . . . . 104
3.5. Индексы в непрерывном времени . . . . . . . . . . . . . . . . . . . 106
3.6. Прикладные следствия из анализа индексов
в непрерывном времени . . . . . . . . . . . . . . . . . . . . . . . . 116
3.7. Факторные представления приростов в непрерывном времени . . . 123
3.8. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

4. Введение в анализ связей 129
4.1. Совместные распределения частот количественных признаков . . . 129
4.2. Регрессионный анализ . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.3. Дисперсионный анализ . . . . . . . . . . . . . . . . . . . . . . . . . 160
4.4. Анализ временных рядов . . . . . . . . . . . . . . . . . . . . . . . . 167
4.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 172


II Эконометрия — I:
Регрессионный анализ 179

5. Случайные ошибки 182
5.1. Первичные измерения . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.2. Производные измерения . . . . . . . . . . . . . . . . . . . . . . . . 192
5.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 194

6. Алгебра линейной регрессии 199
6.1. Линейная регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . 199
6.2. Простая регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.3. Ортогональная регрессия . . . . . . . . . . . . . . . . . . . . . . . 205
6.4. Многообразие оценок регрессии . . . . . . . . . . . . . . . . . . . 210
5
Оглавление

6.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 216

7. Основная модель линейной регрессии 222
7.1. Различные формы уравнения регрессии . . . . . . . . . . . . . . . 222
7.2. Основные гипотезы, свойства оценок . . . . . . . . . . . . . . . . . 226
7.3. Независимые факторы: спецификация модели . . . . . . . . . . . . 234
7.4. Прогнозирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
7.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 247

8. Нарушение гипотез основной линейной модели 257
8.1. Обобщенный метод наименьших квадратов
(взвешенная регрессия) . . . . . . . . . . . . . . . . . . . . . . . . 257
8.2. Гетероскедастичность ошибок . . . . . . . . . . . . . . . . . . . . . 258
8.3. Автокорреляция ошибок . . . . . . . . . . . . . . . . . . . . . . . . 265
8.4. Ошибки измерения факторов . . . . . . . . . . . . . . . . . . . . . 270
8.5. Метод инструментальных переменных . . . . . . . . . . . . . . . . 273
8.6. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 278

9. Целочисленные переменные в регрессии 289
9.1. Фиктивные переменные . . . . . . . . . . . . . . . . . . . . . . . . 289
9.2. Модели с биномиальной зависимой переменной . . . . . . . . . . . 295
9.2.1. Линейная модель вероятности, логит и пробит . . . . . . . . 296
9.2.2. Оценивание моделей с биномиальной зависимой
переменной . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
9.2.3. Интерпретация результатов оценивания моделей
с биномиальной зависимой переменной . . . . . . . . . . . 302
9.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 304

10. Оценка параметров систем уравнений 314
10.1. Невзаимозависимые системы . . . . . . . . . . . . . . . . . . . . . 314
10.2. Взаимозависимые или одновременные уравнения . . . . . . . . . . 318
10.3. Оценка параметров отдельного уравнения . . . . . . . . . . . . . . 324
10.4. Оценка параметров системы идентифицированных уравнений . . . 331
10.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 334
6 Оглавление

III Эконометрия — I:
Анализ временных рядов 345

11. Основные понятия в анализе временных рядов 347
11.1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
11.2. Стационарность, автоковариации и автокорреляции . . . . . . . . 351
11.3. Основные описательные статистики для временных рядов . . . . . 353
11.4. Использование линейной регрессии с детерминированными
факторами для моделирования временного ряда . . . . . . . . . . . 356
11.4.1. Тренды . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
11.4.2. Оценка логистической функции . . . . . . . . . . . . . . . . 358
11.4.3. Сезонные колебания . . . . . . . . . . . . . . . . . . . . . . 359
11.4.4. Аномальные наблюдения . . . . . . . . . . . . . . . . . . . 360
11.5. Прогнозы по регрессии с детерминированными факторами . . . . . 361
11.6. Критерии, используемые в анализе временных рядов . . . . . . . . 365
11.6.1. Критерии, основанные на автокорреляционной функции . . 366
11.6.2. Критерий Спирмена . . . . . . . . . . . . . . . . . . . . . . 369
11.6.3. Сравнение средних . . . . . . . . . . . . . . . . . . . . . . . 370
11.6.4. Постоянство дисперсии . . . . . . . . . . . . . . . . . . . . 372
11.7. Лаговый оператор . . . . . . . . . . . . . . . . . . . . . . . . . . . 373
11.8. Модели регрессии с распределенным лагом . . . . . . . . . . . . . 375
11.9. Условные распределения . . . . . . . . . . . . . . . . . . . . . . . . 377
11.10. Оптимальное в среднеквадратическом смысле
прогнозирование: общая теория . . . . . . . . . . . . . . . . . . . 378
11.10.1. Условное математическое ожидание
как оптимальный прогноз . . . . . . . . . . . . . . . . . . 378
11.10.2. Оптимальное линейное прогнозирование . . . . . . . . . . 380
11.10.3. Линейное прогнозирование стационарного
временного ряда . . . . . . . . . . . . . . . . . . . . . . . 382
11.10.4. Прогнозирование по полной предыстории.
Разложение Вольда . . . . . . . . . . . . . . . . . . . . . . 385
11.11. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . 388

12. Сглаживание временного ряда 391
12.1. Метод скользящих средних . . . . . . . . . . . . . . . . . . . . . . 391
7
Оглавление

12.2. Экспоненциальное сглаживание . . . . . . . . . . . . . . . . . . . 398
12.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 402

13. Спектральный и гармонический анализ 406
13.1. Ортогональность тригонометрических функций
и преобразование Фурье . . . . . . . . . . . . . . . . . . . . . . . . 406
13.2. Теорема Парсеваля . . . . . . . . . . . . . . . . . . . . . . . . . . . 411
13.3. Спектральный анализ . . . . . . . . . . . . . . . . . . . . . . . . . 412
13.4. Связь выборочного спектра с автоковариационной функцией . . . 414
13.5. Оценка функции спектральной плотности . . . . . . . . . . . . . . 417
13.6. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 422

14. Линейные стохастические модели ARIMA 426
14.1. Модель линейного фильтра . . . . . . . . . . . . . . . . . . . . . . 426
14.2. Влияние линейной фильтрации на автоковариации
и спектральную плотность . . . . . . . . . . . . . . . . . . . . . . . 429
14.3. Процессы авторегрессии . . . . . . . . . . . . . . . . . . . . . . . . 431
14.4. Процессы скользящего среднего . . . . . . . . . . . . . . . . . . . 452
14.5. Смешанные процессы авторегрессии — скользящего среднего . . 457
14.6. Модель ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
14.7. Оценивание, распознавание и диагностика
модели Бокса—Дженкинса . . . . . . . . . . . . . . . . . . . . . . 466
14.8. Прогнозирование по модели Бокса—Дженкинса . . . . . . . . . . 475
14.9. Модели, содержащие стохастический тренд . . . . . . . . . . . . . 485
14.10. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . 490

15. Динамические модели регрессии 500
15.1. Модель распределенного лага: общие характеристики
и специальные формы структур лага . . . . . . . . . . . . . . . . . 500
15.2. Авторегрессионная модель с распределенным лагом . . . . . . . . 506
15.3. Модели частичного приспособления, адаптивных ожиданий
и исправления ошибок . . . . . . . . . . . . . . . . . . . . . . . . . 509
15.4. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 513

16. Модели с авторегрессионной условной гетероскедастичностью 523
16.1. Модель ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524
8 Оглавление

16.2. Модель GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
16.3. Прогнозы и доверительные интервалы для модели GARCH . . . . . 531
16.4. Разновидности моделей ARCH . . . . . . . . . . . . . . . . . . . . 535
16.4.1. Функциональная форма динамики условной дисперсии . . . 535
16.4.2. Отказ от нормальности . . . . . . . . . . . . . . . . . . . . 536
16.4.3. GARCH-M . . . . . . . . . . . . . . . . . . . . . . . . . . . 537
16.4.4. Стохастическая волатильность . . . . . . . . . . . . . . . . 537
16.4.5. ARCH-процессы с долгосрочной памятью . . . . . . . . . . 538
16.4.6. Многомерные модели волатильности . . . . . . . . . . . . . 539
16.5. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 540

17. Интегрированные процессы, ложная регрессия и коинтеграция 546
17.1. Стационарность и интегрированные процессы . . . . . . . . . . . . 546
17.2. Разложение Бевериджа—Нельсона для процесса I(1) . . . . . . . 550
17.3. Ложная регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
17.4. Проверка на наличие единичных корней . . . . . . . . . . . . . . . 553
17.5. Коинтеграция. Регрессии с интегрированными переменными . . . . 558
17.6. Оценивание коинтеграционной регрессии:
подход Энгла—Грейнджера . . . . . . . . . . . . . . . . . . . . . . 560
17.7. Коинтеграция и общие тренды . . . . . . . . . . . . . . . . . . . . . 561
17.8. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 563



IV Эконометрия — II 567

18. Классические критерии проверки гипотез 569
18.1. Оценка параметров регрессии при линейных ограничениях . . . . . 569
18.2. Тест на существенность ограничения . . . . . . . . . . . . . . . . . 572
18.2.1. Тест Годфрея (на автокорреляцию ошибок) . . . . . . . . . 577
18.2.2. Тест RESET Рамсея (Ramsey RESET test)
на функциональную форму уравнения . . . . . . . . . . . . 578
18.2.3. Тест Чоу (Chow-test) на постоянство модели . . . . . . . . . 578
18.3. Метод максимального правдоподобия в эконометрии . . . . . . . . 582
18.3.1. Оценки максимального правдоподобия . . . . . . . . . . . . 582
9
Оглавление

18.3.2. Оценки максимального правдоподобия для модели
линейной регрессии . . . . . . . . . . . . . . . . . . . . . . 584
18.3.3. Три классических теста для метода максимального
правдоподобия . . . . . . . . . . . . . . . . . . . . . . . . . 587
18.3.4. Сопоставление классических тестов . . . . . . . . . . . . . 592
18.4. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 593

19. Байесовская регрессия 601
19.1. Оценка параметров байесовской регрессии . . . . . . . . . . . . . 603
19.2. Объединение двух выборок . . . . . . . . . . . . . . . . . . . . . . 606
19.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 607

20. Дисперсионный анализ 611
20.1. Дисперсионный анализ без повторений . . . . . . . . . . . . . . . . 612
20.2. Дисперсионный анализ с повторениями . . . . . . . . . . . . . . . 618
20.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 621

21. Модели с качественными зависимыми переменными 625
21.1. Модель дискретного выбора для двух альтернатив . . . . . . . . . . 625
21.2. Оценивание модели с биномиальной зависимой переменной
методом максимального правдоподобия . . . . . . . . . . . . . . . 627
21.2.1. Регрессия с упорядоченной зависимой переменной . . . . . 630
21.2.2. Мультиномиальный логит . . . . . . . . . . . . . . . . . . . 631
21.2.3. Моделирование зависимости от посторонних
альтернатив в мультиномиальных моделях . . . . . . . . . . 633
21.3. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 635

22. Эффективные оценки параметров модели ARMA 644
22.1. Оценки параметров модели AR(1) . . . . . . . . . . . . . . . . . . . 644
22.2. Оценка параметров модели MA(1) . . . . . . . . . . . . . . . . . . 647
22.3. Оценки параметров модели ARMA(p, q) . . . . . . . . . . . . . . . 651
22.4. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 652

23. Векторные авторегрессии 654
23.1. Векторная авторегрессия: формулировка и идентификация . . . . . 654
23.2. Стационарность векторной авторегрессии . . . . . . . . . . . . . . 658
10 Оглавление

23.3. Анализ реакции на импульсы . . . . . . . . . . . . . . . . . . . . . 660
23.4. Прогнозирование с помощью векторной авторегрессии . . . . . . . 662
23.5. Причинность по Грейнджеру . . . . . . . . . . . . . . . . . . . . . . 665
23.6. Коинтеграция в векторной авторегрессии . . . . . . . . . . . . . . 666
23.7. Метод Йохансена . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668
23.8. Коинтеграция и общие тренды . . . . . . . . . . . . . . . . . . . . . 674
23.9. Упражнения и задачи . . . . . . . . . . . . . . . . . . . . . . . . . . 676

A. Вспомогательные сведения из высшей математики 691
A.1. Матричная алгебра . . . . . . . . . . . . . . . . . . . . . . . . . . . 691
A.1.1. Определения . . . . . . . . . . . . . . . . . . . . . . . . . . 691
A.1.2. Свойства матриц . . . . . . . . . . . . . . . . . . . . . . . . 694
A.2. Матричное дифференцирование . . . . . . . . . . . . . . . . . . . . 700
A.2.1. Определения . . . . . . . . . . . . . . . . . . . . . . . . . . 700
A.2.2. Свойства . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
A.3. Сведения из теории вероятностей и математической статистики . . 703
A.3.1. Характеристики случайных величин . . . . . . . . . . . . . 703
A.3.2. Распределения, связанные с нормальным . . . . . . . . . . 709
A.3.3. Проверка гипотез . . . . . . . . . . . . . . . . . . . . . . . 712
A.4. Линейные конечно-разностные уравнения . . . . . . . . . . . . . . 714
A.4.1. Решение однородного конечно-разностного уравнения . . . 714
A.5. Комплексные числа . . . . . . . . . . . . . . . . . . . . . . . . . . 715

B. Статистические таблицы 717
Введение

Данный учебник написан на основе курсов, читаемых на экономическом фа-
культете Новосибирского государственного университета. С середины 1980-х го-
дов читался спецкурс, в котором излагались основы классической эконометрии,
относящиеся к регрессионному анализу. В это же время в рамках «Общей теории
статистики» достаточно развернуто начал изучаться материал анализа временных
рядов. На базе этих дисциплин в начале 1990-х годов был создан единый курс «Эко-
нометрия», который, постоянно совершенствуясь, читается как обязательный до
настоящего времени. Во второй половине 1990-х годов был разработан и введен
в практику преподавания обязательный курс «Эконометрия-II» для магистрантов.
В конце 1990-х годов на экономическом факультете был восстановлен — на прин-
ципиально новом уровне — курс «Общая теория статистики», дающий начальное
представление об эмпирических исследованиях.
Эконометрия (другой вариант термина в русском языке — эконометрика) —
это инструментальная наука, позволяющая изучать количественные взаимосвязи
экономических объектов и процессов с помощью математических и статистиче-
ских методов и моделей. Дословно этот термин означает «экономическое изме-
рение».
Эконометрия связывает экономическую теорию, прикладные экономические
исследования и практику. Благодаря эконометрии осуществляется обмен инфор-
мацией между этими взаимодополняющими областями, происходит взаимное обо-
гащение и взаимное развитие теории и практики.
Эконометрия дает методы экономических измерений, а также методы оценки
параметров моделей микро- и макроэкономики. При этом экономические теории
выражаются в виде математических соотношений, а затем проверяются эмпириче-
ски статистическими методами. Кроме того, эконометрия активно используется для
прогнозирования экономических процессов и позволяет проводить планирование
как в масштабах экономики в целом, так и на уровне отдельных предприятий.
В экономике (как и в большинстве других научных дисциплин) не существует
и не может существовать абсолютно точных утверждений. Любое эмпирическое
утверждение имеет вероятностную природу. В частности, экономические измерения
содержат различного рода ошибки. Таким образом, в прикладных экономических
исследованиях требуется использовать статистические методы.
Методы эконометрии, позволяющие проводить эмпирическую проверку тео-
ретических утверждений и моделей, выступают мощным инструментом развития
самой экономической теории. С их помощью отвергаются одни теоретические кон-
цепции и принимаются другие гипотезы. Теоретик, не привлекающий эмпирический
материал для проверки своих гипотез и не использующий для этого эконометриче-
12 Введение

ские методы, рискует оказаться в мире своих фантазий. Важно, что эконометриче-
ские методы одновременно позволяют оценить ошибки измерений экономических
величин и параметров моделей.
Экономист, не владеющий методами эконометрии, не может эффективно ра-
ботать аналитиком. Менеджер, не понимающий значение этих методов, обречен
на принятие ошибочных решений.
Эта книга адресована студентам, магистрантам и аспирантам экономических
факультетов классических университетов. Она соответствует требованиям госу-
дарственного образовательного стандарта по дисциплине «Эконометрика». Кроме
того, издание будет полезно преподавателям эконометрии, исследователям, рабо-
тающим в области прикладной экономики, специалистам по бизнес-планированию
и финансовым аналитикам.
Учебник предполагает определенный уровень базовой математической подго-
товки читателя, владение им основами линейной алгебры, математического анали-
за, теории вероятностей и математической статистики в объеме курсов для немате-
матических специальностей вузов. Некоторые наиболее важные сведения из этих
разделов высшей математики приведены в приложении к учебнику.
Необходимость в создании учебника по эконометрии вызвана отсутствием оте-
чественного варианта, который бы охватывал все основополагающие позиции со-
временной эконометрической науки. Появившиеся в последние годы учебные изда-
ния лишь частично покрывают программу курса, читаемого на экономическом фа-
культете Новосибирского государственного университета. В частности, эти учеб-
ники, посвященные в основном регрессионному анализу, не уделяют достаточного
внимания теории временных рядов. При создании настоящего учебника авторы
стремились систематизировать и объединить в рамках одного источника различ-
ные разделы экономической статистики и эконометрии.
Структура учебника примерно соответствует учебному плану экономическо-
го факультета НГУ. Соответственно, он состоит из четырех частей: «Введение
в социально-экономическую статистику», «Эконометрия-I: регрессионный ана-
лиз», «Эконометрия-I: анализ временных рядов», «Эконометрия-II». Каждая часть
покрывает семестровый курс. Соответствующие разделы читаются в качестве обя-
зательной дисциплины во втором, четвертом и пятом семестрах бакалавриата
и в первом семестре магистратуры. Полный курс эконометрии на ЭФ НГУ (вклю-
чая «Введение в социально-экономическую статистику») рассчитан на 152 часа
аудиторных занятий (45% лекций, 55% семинарских занятий).
В первой части «Введение в социально-экономическую статистику» представ-
лен материал, который более глубоко раскрывается в других частях учебника.
В данной части рассмотрены особенности экономических величин, изложены про-
13
Введение

блемы экономических измерений, приводится обсуждение основных описательных
статистик, рассмотрен индексный анализ, дан обзор основ анализа связей.
Вторая часть посвящена классическому регрессионному анализу. Здесь рас-
сматривается метод наименьших квадратов в разных вариантах (включая орто-
гональную регрессию), приведена основная модель линейной регрессии, излага-
ются методы оценки параметров регрессии в случаях, когда нарушаются требо-
вания основной модели (мультиколлинеарность, автокорреляция и гетероскеда-
стичность, наличие ошибок в переменных), рассматриваются способы включения
в регрессионное уравнение качественных переменных как для факторов (фик-
тивные или псевдопеременные), так и для зависимой переменной (модели логит
и пробит). Большое внимание уделяется применению основных критериев про-
верки статистических гипотез в регрессионном анализе (тестированию): крите-
рии Стьюдента, Фишера и Дарбина—Уотсона. Завершается вторая часть изло-
жением некоторых проблем и методов оценки параметров одновременных систем
уравнений. Особенность этого раздела учебника состоит в использовании матрич-
ного подхода, позволяющего достичь общности и лаконичности изложения мате-
риала.
Третья часть посвящена анализу временных рядов. В ней рассматривается как
классический инструментарий — выделение трендов, спектральный и гармониче-
ский анализ, модели Бокса—Дженкинса, так и более современные методы — ди-
намическая регрессия, ARCH- и GARCH- процессы, единичные корни и коин-
теграция, которые недостаточно освещены в отечественной литературе. Классиче-
ские методы излагаются исходя из стремления дать математическое обоснование
множеству утверждений, которые в существующих учебниках просто констатиру-
ются, что существенно затрудняет восприятие материала.
Заключительная четвертая часть содержит разделы, в большинстве своем неиз-
вестные русскоязычному читателю, однако без их знания практически невозмож-
но проведение качественного эконометрического исследования. Это классические
критерии проверки гипотез, метод максимального правдоподобия, дисперсионный
анализ, основы байесовских методов, модели с качественными зависимыми пере-
менными и более сложные разделы анализа временных рядов, в частности, вектор-
ная авторегрессия и подход Йохансена к анализу коинтеграционных связей.
Учебник содержит большое количество задач и упражнений. Кроме того, в каж-
дой главе приведен список литературы, которая может быть использована в каче-
стве дополнения к материалу главы.
Подготовка ученика осуществлялась при финансовой и методической поддерж-
ке программ TEMPUS (TACIS) JEP 08508–94: «Перестройка и совершенство-
вание подготовки экономистов в НГУ» (1994–1997гг.) и «Совершенствование
14 Введение

преподавания социально-экономических дисциплин в вузах» в рамках «Инноваци-
онного проекта развития образования (2002–2004гг.)».
В списке литературы после каждой главы звездочкой отмечены основные ис-
точники.
Авторский коллектив благодарит всех, кто помогал в работе над учебником.
Особая благодарность Владимиру Шину, который осуществил верстку оригинал-
A
макета в формате L TEX, а также Марине Шин, проделавшей большую работу
по редактированию и согласованию различных частей учебника.
Авторы будут признательны читателям за любые комментарии, сообщения
о недочетах и опечатках в этом учебнике.
Часть I

Введение
в социально-экономическую
статистику




15
Это пустая страница
Глава 1

Основные понятия


1.1. Краткая историческая справка

Практика статистики зародилась давно, по-видимому, вместе со становлением
элементов государственности. Не случайно во многих языках статистика и госу-
дарство — однокоренные слова. Государству в лице представителей госаппарата
всегда надо было хотя бы приблизительно знать численность населения страны, ее
экономический потенциал, фактическое состояние дел в разных сферах обществен-
ной жизни. Иначе нельзя сколько-нибудь эффективно собирать налоги, проводить
крупные строительные работы, вести войны и т.д.
Статистическая теория возникла как результат обобщения уже достаточно раз-
витой статистической практики. Начало ее становления обычно связывают с рабо-
тами английских политических арифметиков XVII века и, прежде всего, с именем
Вильяма Петти (1623–1687). В XVIII веке статистическая теория развивалась под
флагом государствоведения, зародившегося в Германии. Именно германские уче-
ные в конце XVIII века стали использовать термины «статистика», «статистик»,
«статистический» в смысле, близком к современному. Хотя слово «статистик» на-
много старше, его — в ином смысле — можно найти в произведениях Шекспира
(начало XVII века). Эти слова, по-видимому, происходят более или менее косвенно
от латинского слова «status» в том его смысле, который оно приобрело в средне-
вековой латыни, — политическое состояние.
Германские авторы, и вслед за ними известный английский ученый сэр Джон
Синклер, использовали термин «статистика» в смысле простого изложения заслу-
18 Глава 1. Основные понятия

живающих внимание данных, характеризующих государство. Причем форма из-
ложения являлась преимущественно словесно-текстовой. Для того времени такое
понимание было достаточно естественным, т.к. достоверных числовых данных было
еще очень мало. Лишь спустя несколько десятилетий с термином «статистика» ста-
ли связывать изложение характеристик государства численным методом. Но даже
после образования в Англии Королевского статистического общества в 1834 году
такое понимание статистики еще не стало обычным.
Одним из ярких представителей статистики XIX века является бельгийский
ученый Адольф Кетле (1796–1874) — создатель первого в мире центрального го-
сударственного статистического учреждения в Бельгии, организатор и участник
первых международных статистических конгрессов. Он установил, что многие мас-
совые явления (рождаемость, смертность, преступность и т.д.) подчиняются опре-
деленным закономерностям, и применил математические методы к их изучению.
В России первым общегосударственным органом статистики явилось Статисти-
ческое отделение Министерства полиции (1811), а затем — Министерства внут-
ренних дел (1819). Его начальником был один из первых российских статистиков
Герман К.Ф. (1767–1838) — автор первого русского оригинального труда по тео-
рии статистики — книги «Всеобщая теория статистики» (1809).
Корни современной теории статистики, прежде всего математической стати-
стики, могут быть прослежены в работах Лапласа и Гаусса по теории ошибок на-
блюдения, но начало расцвета самой науки относится только к последней четверти
XIX века. Значительную роль на этом этапе сыграли работы Гальтона и Карла
Пирсона.


1.2. Предмет статистики
В статистике собираются и систематизируются факты, которые затем анали-
зируются и обобщаются в «содержательных» общественных науках. Поэтому не
всегда бывает просто провести границу между собственно статистикой и той об-
щественной наукой, которую она «снабжает» информацией. И многие статистики
склонны расширять рамки своей дисциплины за счет «содержательной» тематики.
Это — их право, но в строгом смысле статистика является наукой о методах ко-
личественного (численного) отражения фактов общественной жизни. Именно
так понимается статистика в данной книге.
Требуется пояснить, почему в данном определении статистики она связывается
именно с науками об обществе.
Любая наука, основываясь на наблюдениях за реальными фактами, стремится
их систематизировать, обобщить, выявить закономерности, найти законы, постро-
ить теоретические модели, объясняющие наблюдаемую действительность. Други-
19
1.2. Предмет статистики

ми словами, наука стремится выявить и затем количественно определить структуру
причинно-следственных связей. Но события реальной жизни происходят под вли-
янием многих причин, и простое пассивное наблюдение далеко не всегда дает
возможность найти эти причины. Более того, такое наблюдение может привести
к выводам, прямо противоположным действительности. «Не верь глазам своим» —
фраза, резюмирующая многовековой опыт подобных наблюдений.
Однако, в так называемых точных науках научились проводить наблюдения так,
чтобы однозначно и, как правило, в количественной форме определять причинно-
следственные связи. Такая организация наблюдения называется экспериментом.
Ученые — физики, химики, биологи могут провести «натурный» эксперимент,
на входе которого фиксируются одна-две величины и определяется в результате,
на что и как они влияют «при прочих равных условиях». В точных науках ана-
лизируются и обобщаются, как правило, наблюдения-результаты экспериментов,
т.е. «рафинированные» экспериментальные данные. Прогресс в этих науках самым
непосредственным образом связан с целенаправленным развитием возможностей
экспериментирования, с развитием «синхрофазотронов».
Возможности проведения управляемых экспериментов в общественной жизни
крайне ограничены. Поэтому общественные науки вынуждены опираться на неэкс-
периментальные данные, т.е. на результаты пассивных наблюдений, в потоке кото-
рых трудно уловить, а тем более количественно определить причинно-следственные
связи. И статистика как раз и занимается методами сбора и подготовки таких дан-
ных к анализу, методами их первичного анализа, методами проверки теоретических
гипотез на основе таких данных.
Конечно, и во многих необщественных сферах знания остается большое поле
для статистики. Метеоролог строит свои прогнозы, основываясь в конечном сче-
те на статистических данных; возможности управляемого эксперимента все еще
ограничены в биологии и т.д. Но главным объектом статистики все-таки является
общественная жизнь.
Статистикой называют не только науку о методах организации пассивного
наблюдения, методах систематизации и первичного анализа таких наблюдений,
но и сами массивы этих наблюдений. Статистика рождаемости и смертности, ста-
тистика выпуска продукции и т.д. — это совокупности чисел, характеризующих
количество рождений и смертей, объемы выпуска продукции и т.д. В этом смысле
термин «статистика» эквивалентен термину «информация».
Английским эквивалентом слова «статистика» в указанных смыслах является
«statistics», т.е. слово во множественном числе. Это слово используется в ан-
глийском языке и в единственном числе — «statistic», как определенное число,
являющееся результатом некоторого статистического расчета. В этом смысле сло-
во «статистика» используется и в русском языке: статистика Фишера, статистика
20 Глава 1. Основные понятия

Стьюдента, статистика Дарбина-Уотсона — это определенные числа, полученные
в результате достаточно сложных расчетов, по величине которых судят о разум-
ности тех или иных статистических гипотез. Например, гипотезы о наличии связи
между изучаемыми величинами. Термин «статистики» (во множественном числе),
используемый также в русском языке, относится к совокупности таких чисел.


1.3. Экономические величины и статистические
показатели
Экономическая величина — есть некоторое количество определенного эконо-
мического «качества». Обычно экономические величины обозначают буквами ла-
тинского, реже — греческого алфавита. Когда говорят, что x — объем произ-
водства или объем затрат, или объем капитала, то подразумевают, что эта буква
обозначает некоторое количество произведенной продукции, осуществленных за-
трат, наличного капитала. Обозначенные таким образом экономические величины
используются обычно как переменные и параметры математических моделей эко-
номики, в которых устанавливаются зависимости между экономическими величи-
нами. Примером такой модели может являться межотраслевой баланс:

X = AX + Y,

где X и Y — вектор-столбцы объемов производства валовой и конечной продук-
ции по отраслям; A — квадратная матрица коэффициентов материальных затрат.
Или в покомпонентной записи:

aij xj + yi для всех i,
xi =
j

где aij — коэффициент затрат продукции i-го вида на производство единицы про-
дукции j-го вида.
Эта модель определяет зависимость между валовой, промежуточной и конеч-
ной продукцией, а именно: валовая продукция является суммой промежуточной
и конечной продукции. Кроме того, в этой модели определяется прямо пропорцио-
нальная зависимость текущих материальных затрат от валового выпуска.
Одна из возможных форм зависимости между выпуском продукции и использу-
емыми ресурсами устанавливается производственной функцией Кобба—Дугласа:

X = aC ? L? ,

где X — выпуск продукции; C — затраты основного капитала; L — затраты
труда; a, ?, ? — параметры функции.
21
1.3. Экономические величины и статистические показатели

В этих записях экономические величины выступают, прежде всего, как некие
теоретические понятия, то есть именно как «количества определенного эконо-
мического качества». Вопрос об измеримости этих величин непосредственно не
ставится, но предполагается, что этот вопрос в принципе разрешим.
Статистическим (экономическим) показателем является операциональное
определение экономической величины. Такое определение представляет собой ис-
черпывающий перечень операций, которые необходимо провести, чтобы измерить
данную величину. Этот перечень включает обычно и операции по сбору первичной
информации — первичных наблюдений. Операциональные определения экономи-
ческих величин-показателей, особенно обобщающего характера, таких как валовой
внутренний или валовой национальный продукт, являются сложными методиками
расчетов, далеко не все этапы которых безоговорочно однозначны. Эти операци-
ональные определения являются предметом изучения и построения в социально-
экономической статистике.
Одной экономической величине могут соответствовать несколько статистиче-
ских показателей, которые раскрывают разные стороны соответствующего теоре-
тического понятия. Так, например, понятию «цена» на практике соответствуют:
основные цены, цены производителей, оптовые и розничные цены, цены покупа-
телей и т.д. Даже такая, казалось бы, простая величина, как население, имеет
несколько «конкретизаций»: население на момент времени или в среднем за пери-
од, население постоянное или наличное.
Статистическим показателем называют также конкретное число — результат
измерения экономической величины, характеризующей определенный объект
в определенный момент времени. Например, чистая прибыль такого-то предприя-
тия в таком-то году составила столько-то миллионов рублей. В этом случае эконо-
мическая величина «чистая прибыль» характеризует данное предприятие в данном
году. С этой точки зрения понятно, почему в статистике экономические величи-
ны в привязке к объекту и времени иногда называют признаками этого объек-
та. В свою очередь статистический показатель-число называют статистическим
наблюдением. Все множество величин-признаков или показателей-наблюдений
можно обозначить следующим образом:
X = {xtij },
где t — индекс времени, i — индекс объекта, j — индекс признака, то есть но-
мер экономической величины в перечне всех экономических величин, которые
могут характеризовать изучаемые объекты.
Итак, экономическая величина-признак — теоретическое понятие, статисти-
ческий показатель-определение обеспечивает практическую измеримость теоре-
тической величины, статистический показатель-наблюдение — результат изме-
рения величины-признака конкретного объекта в конкретный момент времени.
22 Глава 1. Основные понятия

1.4. Вероятностная природа экономических
величин
Статистическое исследование строится в предположении, что все экономиче-
ские величины без исключения являются случайными с вполне определенными,
часто неизвестными, законами распределения вероятности. Наблюдаемые значе-
ния суть реализации соответствующих случайных величин, выборки из каких-то
генеральных совокупностей. Такое отношение к экономическим величинам долгое
время отрицалось в отечественной (советской) науке на том основании, что в соци-
алистической экономике, которая сознательно и планомерно организуется, не мо-
жет быть места случайной компоненте. В настоящее время такую позицию никто
практически не занимает, но определенные сомнения в вероятностной природе
экономических величин высказываются.
Некоторые экономисты не склонны признавать вероятностный характер не-
массовых, единичных и уникальных событий. На том основании, что такой немас-
совый, нерегулярно повторяющийся характер имеет большинство экономических
явлений, «отец» кибернетики Норберт Винер вообще отрицал возможность при-
менения количественных методов в экономических и социальных науках. Многие
ученые-статистики отрицают необходимость вероятностного подхода к изучению
даже массовых явлений, если для них можно провести сплошное наблюдение и по-
лучить в свое распоряжение — как они считают — полную генеральную совокуп-
ность. Они работают в рамках особого раздела статистики, который называется
анализом данных.
Нельзя не видеть, что высказываемые сомнения в вероятностной природе эко-
номических явлений имеют основания. Понятие вероятности, вероятностные под-
ходы к анализу зарождались и развивались в естественных науках, а мир физических
величин очень сильно отличается от «материи» экономической. В физике, химии
генеральные совокупности очень велики, многие из них, по-видимому, можно счи-
тать бесконечными. Очень велики и исследуемые выборки, и, что чрезвычайно
важно, их, как правило, можно неограниченно увеличивать в управляемом экс-
перименте, воспроизводя нужные условия в специальных физических установках,
в химической аппаратуре. В такой ситуации совершенно естественным кажется
определение вероятности как предела относительной частоты появления нужного
признака.
Но и в физическом мире многие явления представляются единичными и уни-
кальными, со всеми вытекающими отсюда трудностями для классического, «объ-
ективистского», «частотного» понимания вероятности. Например, как может от-
ветить на вопрос о том, какова вероятность жизни на Марсе, «объективист-
частотник»? Если он относится к Марсу как к уникальному явлению, единственной
в своем роде планете во вселенной, то в лучшем случае его ответ будет 0 или 1.
23
1.4. Вероятностная природа экономических величин

Если жизнь есть — 1, если ее нет — 0. Но, скорее всего, он просто отметит некор-
ректность этого вопроса, поскольку для него вероятность — это характеристика
совокупности, а не единичного явления.
В экономике подобных нарушений классических условий появления вероят-
ности — масса. Можно сказать, что вся экономика состоит из таких нарушений.
Мир людей, если к нему относиться «сильно материалистично», без некоторой
раскованности в мышлении, уникален и ограничен. Генеральные совокупности ко-
нечны и малы, так что многие массивы данных можно интерпретировать как исчер-
пывающие генеральные совокупности. Ряды наблюдений весьма коротки. И, что
сильно отличает экономику от физики, невозможно проведение натурных экспери-
ментов с воспроизводимыми условиями.
В таком положении полезным и продуктивным, по крайней мере внешне, пред-
ставляется подход субъективной вероятности. Субъективная вероятность — это
мера доверия исследователя к утверждению, степень уверенности в его справед-
ливости, наконец, мера готовности действовать в ситуации, связанной с риском.
«Субъективист» может давать вероятности любым, даже уникальным событиям,
включая их тем самым в строгий анализ. Основываясь на своих знаниях, опыте,
интуиции, он может определить вероятность жизни на Марсе, вероятность вхож-
дения России в число развитых стран, вероятность экологической катастрофы на
планете или мировой войны к середине столетия. Конечно, его оценки индивиду-
альны и субъективны, но если их несколько и даже много, то после своего согла-
сования они, несомненно, приобретут элемент объективности. Полезно понимать,
что и в таком случае подход к вероятности совершенно отличен от классического
«объективистски-частотного».
Направления субъективной и объективной вероятности развивались парал-
лельно. Если формальное определение объективной вероятности дано впервые
Пуассоном во второй четверти прошлого века (1837 год), то Бернулли еще в на-
чале XVIII века (1713 год) предположил, что вероятность — это степень доверия,
с которой человек относится к случайному событию, и что эта степень доверия за-
висит от его знаний и у разных людей может быть различной. Во второй половине
прошлого века Байес доказал известную теорему об условной вероятности и ин-
терпретировал используемые в ней параметры вероятности как степени уверенно-
сти. Эти идеи легли в основу современной теории принятия решений в условиях
неопределенности и, вообще, подхода субъективной вероятности, который часто
называется байесовским.
Бурное развитие этого направления началось в XX веке в связи с усилением ин-
тереса к наукам об обществе, к экономической науке. Следует назвать по крайней
мере двух ученых, внесших фундаментальный вклад в становление теории субъек-
тивной вероятности и связанных с ней теорий полезности — это Джон М. Кейнс
и Фрэнк П. Рамсей. В СССР в 40-х годах прошлого столетия проходила дискуссия
24 Глава 1. Основные понятия

о началах теории вероятностей. Представители субъективной школы потерпели
поражение.
Существует подход, объединяющий в определенном смысле идеи субъективной
и объективной вероятности. Он основан на понимании многовариантности разви-
тия общества вообще и экономики в частности. Имеется множество возможных
состояний экономики и путей ее развития, наблюдаемые факты в полном своем
объеме являются лишь выборкой из гипотетической генеральной совокупности,
образованной этим множеством. В рамках такого подхода снимается ряд проти-
воречий частотного понимания вероятностей в экономике. Так, например, вероят-
ность вхождения России в число развитых стран к 2050 году есть относительная
частота возможных вариантов развития страны, при которых «вхождение» состо-
ялось к 2050 году, в общем числе возможных вариантов. Вопрос остается толь-
ко в том, как можно найти эти варианты или хотя бы посчитать их количество,
т.е. как можно практически работать с гипотетическими генеральными совокуп-
ностями.
Современная экономическая наука располагает соответствующим инструмен-
тарием: это математическое моделирование. Всякая математическая модель пред-
ставляет бесконечное пространство возможных состояний экономики, расчет
по модели дает точку или траекторию в этом пространстве. Модель выступает
инструментом проведения экономических экспериментов почти в таком же смыс-
ле, как и в естественных науках. Конечно, главным при этом является вопрос
об адекватности модели. Но все это — темы других курсов.
По-видимому, «субъективист», хотя бы в некоторых ситуациях приписывая
вероятности тем или иным событиям, пользуется неявно частотным подходом при-
менительно к некоторым гипотетическим генеральным совокупностям. При этом
конструировать эти гипотетические совокупности и работать с ними помогают ему
его знания, опыт и интуиция.


1.5. Проблемы измерений

Методы измерения развивались на протяжении всей истории человеческой ци-
вилизации вместе с развитием математики и естественных наук. В прошлом веке
математизация социальных и экономических наук дала новый импульс этим про-
цессам. Проводилось серьезное переосмысление феномена измерений, осуществ-
лялись продуктивные попытки разработать общие теории измерения. Шел интен-
сивный поток литературы, посвященной этой проблематике. Следует назвать таких
ученых, как Н.Р. Кэмпбел, один из родоначальников современных теорий измере-
ния; С.С.Стивенс, одна из его книг, 2-х томная «Экспериментальная психология»,
в 1969 г. опубликована на русском языке; И. Пфанцагль, книга которого в соавтор-
25
1.5. Проблемы измерений

стве с двумя другими учеными «Теория измерений» вышла в нашей стране в 1971 г.;
П. Суппес и Дж.Л. Зинес, их работа «Основы теории измерения» опубликована
у нас в 1967 г. Существенный вклад в теорию экономических измерений внесен
работой Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое по-
ведение», вышедшей у нас в 1970 г. Характерно, что все эти исследователи, кроме
Кэмпбела, разрабатывали проблематику нефизических измерений.
Если взять «Большую Советскую Энциклопедию» или «Математическую Эн-
циклопедию» более позднего издания, то можно узнать, что измерение — это про-
цесс сопоставления измеряемого явления с единицей измерения. Такое определе-
ние достаточно поверхностно, оно не раскрывает существа возникающих проблем.
В настоящее время практически всеобщим признанием пользуется репрезен-
тативная теория, в соответствии с которой измерение есть процесс присваива-
ния числовых выражений объекту измерения для его репрезентации (представле-
ния), т.е. для того, чтобы осмысленно выводить заключения о свойствах объекта.
Это определение дано Кэмпбелом. Он делает акцент на целях измерения. Измере-
ние осуществляется не ради самого измерения, а с тем, чтобы можно было извлечь
пользу из его результатов.
По Стивенсу, измерение — это приписывание чисел вещам в соответствии
с определенными правилами. Он акцентирует внимание на измерительных опе-
рациях. Теорию измерения, развиваемую им, можно было бы назвать операцио-
нальной.
Следует привести также определение формальной теории, которое вытекает
из теории математических моделей А. Тарского. Измерить — значит установить
однозначное (гомоморфное) отображение эмпирической реляционной структуры
в числовую реляционную структуру. Реляционная структура — это множество объ-
ектов вместе со всеми отношениями и операциями на нем. В соответствии с этим
определением, если объекты находятся в реальной действительности (в эмпириче-
ской реляционной структуре) в некоторых отношениях друг с другом (одинаковы,
больше, меньше, лучше, хуже, являются суммой или разностью), то в этих же
отношениях должны находиться числа, приписанные им в результате измерения
(числовая реляционная структура). Это определение находится в русле репрезен-
тативной теории.
Множества чисел, в которых проводится измерение, образуют измерительные
шкалы. В концептуальном отношении Стивенсом выделено 4 основных типа шкал.
1) Номинальная шкала, шкала наименований, шкала классификаций. Объ-
ектам приписываются любые числа, которые играют роль простых имен и исполь-
зуются с целью различения объектов и их классов. Примеры: номера футболистов,
числовые коды различных классификаторов. Основное правило такого измерения:
не приписывать одно число объектам разных классов и разные числа объектам
26 Глава 1. Основные понятия

одного класса. В этой шкале вводится только два отношения: «равно» и «не рав-
но». В ней измеряются объекты, которые пока научились или которые достаточно
только различать. Понятно, что в данном случае речь идет об измерении в очень
слабом смысле. Результаты измерения X в этой шкале всегда можно изменить,
подвергнув их взаимнооднозначному преобразованию f . Говорят, что математиче-
ская структура этой шкалы определяется преобразованием f , таким что f = 0.
2) Ординальная или порядковая, ранговая шкала. В этой шкале измеряются
объекты, которые одинаковы или предпочтительнее друг друга в каком-то смысле.
Принимаются во внимание только три отношения, в которых могут находиться чис-
ла этой шкалы: «равно», «больше», «меньше». Математическая структура шкалы
определяется монотонно возрастающим преобразованием f : f > 0. Пример та-
кой шкалы дает теория порядковой полезности.
3) Интервальная шкала. Шкала используется для измерения объектов, отно-
сительно которых можно говорить не только больше или меньше, но и на сколько
больше или меньше. Т.е. в ней введено расстояние между объектами и, соответ-
ственно, определены единицы измерения, но нет пока нуля, и бессмысленнен во-
прос о том, во сколько раз больше или меньше. Математическая структура шкалы:
f = aX + b, где a > 0 (a — коэффициент изменения единицы измерения, b —
«сдвиг» нуля). В этой шкале измеряются некоторые физические величины, напри-
мер, температура. Если ночью по Цельсию было 5 градусов тепла, а днем — 10,
то можно сказать, что днем теплее на 5 градусов, но утверждение, что днем в 2 ра-
за теплее, чем ночью, бессмысленно. В шкале Фаренгейта или Кельвина данное
отношение совсем другое.
4) Шкала отношений. В ней, по сравнению с предыдущей шкалой, введен ноль
(естественное начало шкалы) и определено отношение «во сколько раз больше
или меньше». Математическая структура шкалы: f = aX (a — коэффициент
изменения единицы измерения), a > 0. Это обычная шкала, в которой проводится
большинство метрических измерений.
Первые два типа шкал неметрические, они используются в нефизическом из-
мерении (в социологии, психологии, иногда в экономике), которое в этом случае
называется обычно шкалированием. Метрическими являются шкалы двух послед-
них типов. Экономические величины измерены, как правило, в шкале отношений.
Существуют различные виды измерений. С точки зрения дальнейшего изло-
жения важно выделить два вида: прямые или первичные, которые в физических
измерениях иногда называют фундаментальными, и косвенные или производные.
Измерения 1-го вида сводятся к проведению эмпирических операций в непосред-
ственном контакте с измеряемым объектом. Это — опрос, анкетирование, наблю-
дение, счет, считывание чисел со шкал измерительных приборов. Измерения 2-го
27
1.6. Специфика экономических измерений

вида связаны с проведением вычислительных операций над первично измеренными
величинами.
Таким образом, в измерении используются и эмпирические, и вычислительные
операции. Некоторые теоретики измерения склонны минимизировать роль вы-
числения и отделить собственно измерение, как преимущественно эмпирическую
операцию, от вычислений. Однако грань между этими двумя понятиями достаточно
расплывчата, особенно при экономических измерениях.


1.6. Специфика экономических измерений
Специфические особенности экономических измерений можно свести в 5 групп:
1) Измеряться могут только операционально определенные величины. В эко-
номике разработка операциональных определений величин — это сложный и не-
однозначный исследовательский процесс теоретического характера. Теоретики по-
стоянно дискутируют на темы измерения общих итогов экономического развития,
экономической эффективности, производительности общественного труда, эконо-
мической динамики, инфляционных процессов, структурных сдвигов и т.д. Не вы-
работано строгой и единой системы операциональных величин, однозначно пред-
ставляющих эмпирическую экономическую систему. Одно из следствий такого по-
ложения, как уже говорилось, заключается в том, что каждому теоретическому
понятию, как правило, соответствует несколько операциональных величин, отра-
жающих различные точки зрения и используемых с разными целями.
Очень сильно различались системы статистического учета, сложившиеся
в СССР и в мировой практике. В России к концу прошлого столетия в целом завер-
шен переход на западные стандарты, но нельзя не видеть положительных моментов,
имевшихся и в отечественной системе статистики. В мировой практике статистики
к настоящему времени сложилась более или менее устойчивая, хотя и имеющая
национальные особенности, система статистического отображения экономической
действительности: Национальные счета на макроуровне, Бухгалтерский учет в фир-
мах. И эти вопросы не являются предметом активных дискуссий теоретиков. Но нет
сомнений, что под воздействием накапливаемых изменений в общественной жизни
«взрывы» таких дискуссий ожидают нас впереди.
Таким образом, экономические измерения, в отличие от многих физических,
в очень большой степени обусловлены теоретическими моментами.
2) Специфику экономических измерений создают и те особенности экономики,
которые обсуждались выше в связи с пониманием особенностей статистики как
науки и вероятностной природой экономических явлений. Короткие ряды наблюде-
ний и неэкспериментальный характер данных очень затрудняют процесс измерения
и нередко ставят под сомнение научную значимость его результатов.
28 Глава 1. Основные понятия

В процессе управляемого эксперимента можно изменить значение некото-
рой величины и определить, на что и каким образом она влияет, т.к. остальные
величины-факторы остаются неизменными. Неэкспериментальные данные исклю-
чают возможность анализа «при прочих равных». В потоке наблюдений за «всеми
сразу» величинами, как уже отмечалось, трудно уловить структуру взаимосвязей
и измерить их интенсивность. Чисто эмпирически это, пожалуй, невозможно сде-
лать. Это обстоятельство еще в бо? льшей степени увеличивает нагрузку на теорию,
«силу абстракции» исследователя. И оно не добавляет надежности результатам
измерения.
3) В экономике не существует таких объектов и не изобретено таких «линеек»,
совмещение которых позволило бы путем считывания чисел со шкалы определить
объем валового внутреннего продукта или темп инфляции. Экономические изме-
рения почти всегда косвенные, производные. Экономические величины опреде-
ляются путем расчета, исчисления, формула которого задается операциональным
определением величины. Более того, первичные измерения, имеющие в физике
фундаментальное значение, в экономике, как правило, экономического характе-
ра не имеют. Это — счет, физические измерения веса, объема, длины, первичная
регистрация цен, тарифов и т.д. Экономический характер они приобретают лишь
после своей свертки в экономические величины.
4) В естественных науках единицы измерения: килограмм, метр, джоуль, ватт
и т.д. — четко и однозначно определены. Специфические единицы экономических
измерений: цены, тарифы, ставки, единицы полезности — постоянно меняются.
Важно даже не то, что они меняются во времени, а то, что их изменения зависят
от объема и пропорций тех величин, которые они призваны измерять. Если в струк-
туре производства или в потребительском наборе доля какого-то продукта умень-
шается, то его цена или полезность, как правило, растет. И наоборот. Учет такого
рода зависимостей и изменчивости единиц измерения — очень сложная проблема,
совершенно неизвестная в физических измерениях.
5) В процессе измерения инструмент взаимодействует определенным образом
с объектом измерения, вследствие чего положение этого объекта может изме-
ниться, и результатом измерения окажется не та величина, которая имела место
до самого акта измерения. Пример: если попытаться в темной комнате на ощупь
определить положение бильярдного шара на столе, то он обязательно сдвинется
с места. Эта проблема так или иначе возникает в любых измерениях, но только
в экономических и, вообще, социальных измерениях она принимает угрожающие
масштабы.
Экономические величины складываются под воздействием определенной дея-
тельности человека и каким-то характеризуют образом эту деятельность. Поэтому
люди, как те, кто измеряет, так и те, чья деятельность измеряется, обязательно
заинтересованы в результатах измерения. Взаимодействия в процессе измерения,
29
1.7. Адекватность экономических измерений

возникающие по этим причинам, могут приводить к огромным отличиям получае-
мых значений измеряемых величин от их действительных значений. В физических
измерениях влияние этого субъективного фактора практически отсутствует.


1.7. Адекватность экономических измерений
Под адекватностью измерений обычно понимают степень соответствия изме-
ренных значений действительным или истинным. Разность этих значений образует
ошибку измерения. Теория ошибок, основанная на теории вероятностей и матема-
тической статистике, изучается в следующей части книги. Здесь рассматривается
значение учета ошибок экономических измерений, причины этих ошибок и приво-
дятся некоторые примеры.
Любые измерения, а экономические в особенности, содержат ошибки. Точ-
ные величины суть не более чем теоретические абстракции. Это происходит хотя
бы в силу случайного характера величин. Исследователи располагают выбороч-
ными значениями величин и могут лишь приблизительно судить об их истинных
значениях в генеральной совокупности. Измерения без указания ошибки доста-
точно бессмысленны. Фразу: «Национальный доход равен 10 600 млрд. руб.» —
если она не содержит сведений о точности или не подразумевает таких знаний
у читателя (например, судя по количеству приведенных значащих цифр, ошибка
составляет ±50 млрд. руб.), — всегда можно продолжить: «или любой другой ве-
личине». К сожалению, понимание этого элементарного факта в экономике пока
еще не достигнуто. Например, можно встретить такие статистические публикации,
в которых численность населения бывшего СССР дается с точностью до одно-
го человека. Кстати, «точные» науки знают меру своей неточности, и результаты
физических измерений обычно даются с указанием возможной ошибки.
Ошибки обычно подразделяют на случайные и систематические. Для экономи-
ки можно ввести еще один класс ошибок: тенденциозные. Случайные ошибки —
предмет строгой теории (см. гл. 5), здесь внимание сосредоточено на систематиче-
ских и тенденциозных ошибках.
В чем причины этих ошибок экономических измерений?
В предыдущем разделе приводились 5 особенностей экономических измере-
ний. Каждая из них вносит в ошибку свою лепту, и немалую, сверх «обычной»
ошибки физических измерений.
1) Ошибки теории. Операциональные определения экономических величин —
продукт теории. И если теория неверна, то, как бы точно в физическом смысле
не проводились измерения исходных ингредиентов, какими бы совершенными вы-
числительными инструментами не пользовались, ошибка — возможно очень боль-
шая — обязательно будет присутствовать в результатах измерения.
30 Глава 1. Основные понятия

О величине этих ошибок в практике нашей статистики можно судить лишь
косвенно. Если сравнивать показатели совокупного производства, которые ис-
пользовались в СССР и используемые в мировой практике, то можно отметить две
основные компоненты ошибки. В мировой практике используются показатели типа
конечной продукции, в советской статистике — типа валовой продукции, которые
сильно искажаются повторным счетом и другими «накрутками», содержащимися
в промежуточном продукте. И второе: в советской статистике расчет этих показа-
телей проводился только по так называемой материальной сфере. Бо? льшая часть
продукта, создаваемого в нематериальной сфере, не попадала в итоги.
2) Ошибки инструмента, в данном случае — принятых статистических проце-
дур расчета. Наибольшим дефектом в советской статистике страдали процедуры
оценки динамики цен. Они скрывали реальные темпы инфляции.
Пример. На практике применяется два метода расчета национального дохода
или валового внутреннего продукта (ВВП): потребительский — для определения
использованного национального дохода как суммы фактических объемов накопле-
ния и непроизводственного потребления, и производственный — для расчета про-
изведенного национального дохода как суммы чистой продукции (добавленной сто-
имости) по отраслям производства. Эти показатели жестко связаны между собой:
их разница равна величине потерь и сальдо экспорта-импорта. Такая зависимость
выдерживалась в государственной статистике только в текущих ценах. В сопостави-
мых ценах произведенный национальный доход устойчиво обгонял использованный
ежегодно на несколько миллиардов рублей. Если начать отсчет с начала 70-х годов,
то к концу 80-х разрыв между произведенным и используемым национальным дохо-
дом достигал 1 5 последнего. Эти 100 ? 150 млрд. руб. разрыва — одна из оценок
ошибки расчета национального дохода в сопоставимых ценах.
В настоящее время в государственной статистике возникла в некотором смыс-
ле обратная проблема. ВВП, рассчитанный по производству, оказывается заметно
меньшей величиной, чем рассчитанный по использованию. Причем разрыв также
достигал в отдельных случаях 1 5 ВВП. Это происходит потому, что часть продук-
ции производится в так называемой «теневой» экономике и не находит отражения
в официальной статистике. Использование же продукции учитывается в более пол-
ных объемах.
Страдали и страдают несовершенством и другие статистические процедуры.
Еще один пример — из области международных сопоставлений динамики итоговых
показателей развития. Если известны темпы роста национального дохода, напри-
мер, СССР и США, то можно легко установить, как менялось соотношение этих
показателей и насколько успешно СССР «догонял» США. Независимо от этого
в советской статистике проводились прямые сопоставления национальных доходов,
показывающие, какую часть национального дохода США составляет национальный
доход СССР. Долгое время оставался незамеченным факт серьезного несоответ-
31
1.7. Адекватность экономических измерений

ствия результатов этих двух расчетов: по данным динамики национального дохода
СССР догонял США гораздо быстрее, чем по данным прямых сопоставлений. Мож-
но не сомневаться в том, что искажены были и те и другие данные, но динамика
национального дохода была искажена в большей степени.
3) Тенденциозные ошибки. Являются следствием субъективного фактора
в процессе измерения. Искажение и сокрытие информации — элемент рациональ-
ной стратегии экономического поведения. Это общепризнанный факт, но в СССР,
в силу значительной идеологической нагрузки на статистику, искажение инфор-
мации, особенно итоговой, достигало удручающе больших размеров. По оценкам
Г.И. Ханина, реально национальный доход за период с начала 1-й пятилетки (кон-
ца 20-х годов прошлого столетия) до начала 80-х годов прошлого века вырос
не в 90 раз, как по официальной статистике, а всего в 7–8 (что тоже, кстати,
очень неплохо).
В современной официальной статистике в России такие ошибки также имеют
место. Но если во времена СССР совокупные объемы производства преувеличи-
вались, то теперь они занижаются. Это — результат «бартеризации» экономики,
выведения хозяйственной деятельности из-под налогообложения. Косвенным под-
тверждением этих фактов является то, что при резком сокращении общих (офи-
циальных) объемов производства в последнем десятилетии прошлого века объемы
потребления электроэнергии, топлива, тепла, объемы грузоперевозок уменьши-
лись гораздо в меньшей степени.
4) Ошибки единиц измерения. Имеется серьезное отличие понимания точ-
ности в физическом и экономическом измерении. Даже если измерения точны
в физическом смысле, т.е. правильно взвешены и измерены первичные величины,
использована бездефектная теория для свертки этих величин, ошибки в экономи-
ческом смысле могут присутствовать и, как правило, присутствуют. Дело в том,
что практически всегда искажены по сравнению со своими истинными значениями
наблюдаемые экономические единицы измерения: цены, тарифы и т.д. Особенно
велик масштаб этих деформаций был в централизованной экономике. Влияние их
на результаты измерения и далее на процессы принятия решений в СССР было
огромным. Это стало особенно очевидным в конце горбачевской «перестройки»,
когда разные республики и территории бывшего СССР начали выдвигать взаим-
ные претензии, рассуждая на тему о том, кому, кто и сколько должен. Если взять
Западную Сибирь, то по официальным данным на конец 80-х годов XX века ее
сальдо вывоза-ввоза было хоть и положительно, но очень невелико. Расчеты же
в равновесных ценах давали цифру плюс 15–20 млрд. руб., а в ценах мирового
рынка — плюс 25–30.
Доля ошибок такого рода была велика и в реформируемой России, когда це-
новые пропорции были неустойчивы и быстро менялись, значительно рос общий
32 Глава 1. Основные понятия

уровень цен. Сложной и не решаемой однозначно оказывается проблема «очистки»
итоговых за год показателей от факторов инфляции.


1.8. Типы величин, связи между ними
Экономические величины могут быть двух типов: экстенсивные, или объем-
ные, и интенсивные, или относительные. Первые обладают единицами измере-
ния, и их можно складывать, т.е. агрегирование проводится обычным сложени-
ем; вторые не имеют единиц измерения, а могут обладать только определенной
размерностью, и они не аддитивны, их агрегирование проводится путем расчета
средневзвешенных величин.
Экстенсивные величины, в свою очередь, могут иметь тип запаса или потока.
Величины типа запаса регистрируются на конкретный момент времени и имеют
элементарные единицы измерения: рубль, штука, тонна, метр и т.д. Примеры: ос-
новные фонды, материальные запасы, население, трудовые ресурсы. Величины
типа потока определяются только за конкретный период времени и имеют размер-
ность «объем в единицу времени»: рубль в год, штука в час и т.д. К этим величинам
относятся выпуск продукции, потребление, затраты, инвестиции, доходы и т.д.
Величины запаса и потока жестко связаны между собой:

Sb [v] + Pi [v t ]t = Se [v] + Po [v t ]t,

где Sb и Se — запасы на начало и конец периода (v — единица измерения),
Pi и Po — потоки по увеличению и уменьшению запаса (t — период).
Это соотношение лежит в основе большинства балансовых статистических
таблиц. Например, в балансе движения основных фондов по полной стоимости
Sb и Se — основные фонды на начало и конец года, Pi и Po — ввод и выбытие
основных фондов; в балансе (межотраслевом) производства и потребления продук-
ции Sb и Se — материальные запасы на начало и конец года, Pi — производство
и импорт продукции, Po — текущее потребление (производственное и непроиз-
водственное), инвестиции и экспорт.
Интенсивные величины являются отношениями экстенсивных или интенсив-
ных величин. Они могут иметь разное содержание, разную размерность или быть
безразмерными.
Примеры интенсивных величин как отношений объемных величин:

– в классе P/S: производительность труда, фондоотдача, коэффициенты рож-
даемости и смертности населения;

– в классе S/P : трудо- и фондоемкость производства;
33
1.8. Типы величин, связи между ними

– в классе S/S: фондовооруженность труда;

– в классе P/P : материало- и капиталоемкость производства, коэффициенты
перевода капитальных вложений во ввод основных фондов.

Размерность этих величин определяется формулой их расчета. Интенсивные
величины, получаемые отношением величин одного качества (экстенсивных или
интенсивных), размерности не имеют. К ним относятся темпы роста и прироста,
коэффициенты пространственного сравнения, показатели отраслевой и террито-
риальной структуры. Такие безразмерные относительные величины могут даваться
в процентах или промиллях (если a — относительная величина, то a · 100 o/o —
ее выражение в процентах, a · 1000 o/oo — в промиллях).
Если две величины y и x связаны друг с другом, то одним из показателей
этой связи является их отношение: y x — средний коэффициент связи (например,
трудо-, материало-, фондоемкость производства).
Иногда пользуются приростным коэффициентом (например, капиталоемкость
производства как приростной коэффициент фондоемкости): ?y ?x , где ?y
и ?x — приросты величин y и x за определенный период времени.
Если величины y и x связаны гладкой непрерывной функцией, то непрерыв-
ным (моментным) приростным коэффициентом является производная dy dx .
В этом же ряду находится так называемый коэффициент эластичности, пока-
зывающий отношение относительных приростов:

?y ?x x?y ?y x
·.
: = =
y x y?x ?x y

Непрерывным (моментным) коэффициентом эластичности является показа-
тель степени при степенной зависимости y от x :

dy y dy x
·.
y = ax? , т.к. = a?x??1 = ? , откуда ? =
dx x dx y

При наличии такой зависимости y от x моментный коэффициент эластичности
ln(y a )
рассчитывается как .
ln x
Это — примеры относительных величин, имеющих размерность. Далее приво-
дятся примеры безразмерных относительных величин.
Пусть y = yi . Например, y — совокупный объем производства на опреде-
i
ленной территории, yi — объем производства (в ценностном выражении) в i-й
отрасли; или y — общий объем производства какого-то продукта в совокупности
34 Глава 1. Основные понятия

регионов, yi — объем производства продукта в i-м регионе. Тогда yi y — коэф-
фициент структуры, отраслевой в первом случае, территориальной (региональной)
во втором случае.
Если yi и yj — значения некоторого признака (объемного или относитель-
ного) двух объектов (i-го и j-го), например, двух отраслей или двух регионов,
то yi yj — коэффициент сравнения, межотраслевого в первом случае, простран-
ственного (межрегионального) во втором случае.
Пусть yt — значение величины (объемной или относительной) в момент вре-
мени t. Для измерения динамики этой величины используются следующие пока-
затели:
?yt = yt+1 ? yt (или ?yt+1 = yt+1 ? yt ) — абсолютный прирост,
yt+1 y — темп роста,
t

?yt y = yt+1 y ? 1 — темп прироста.
t t
В случае, если динамика y задана гладкой непрерывной функцией y(t),
то непрерывным темпом прироста в момент времени (моментным темпом при-
d ln y(t) d ln y 1
роста) является , поскольку = , а непрерывным (моментным) аб-
dt dy y
dy(t) dy(t)
солютным приростом выступает . Последнее следует пояснить (почему
dt dt
выступает моментным абсолютным приростом в единицу времени). Пусть единич-
ный период времени [t, t + 1] разбит на n равных подпериодов, и в каждом из них
одинаков абсолютный прирост. Тогда абсолютный прирост в целом за единичный
период равен

1
? y (t)
y t+
n
,
1
n

dy(t)
и предел его при n > ?, по определению производной, как раз и равен .
dt
d ln y(t)/
Непрерывным (моментным) темпом роста является e dt (e — основа-

ние натурального логарифма). Действительно, пусть опять же единичный период
времени [t, t + 1] разбит на n равных подпериодов, и темпы роста во всех них
одинаковые. Тогда темп роста за этот период (единицу времени) окажется равным
? ?n
1
y t+ n
? ?,
y (t)
35
1.8. Типы величин, связи между ними


Таблица 1.1

За период (единичный) Моментный

Темп дискретн. непрерывный

t+1
d ln y (t ) y (t + 1) d ln y (t)
yt+1
exp = exp
Роста dt
y (t)
dt dt
yt
t

t+1
d ln y (t ) y (t + 1) d ln y (t) 1 dy (t)
yt+1
?1 dt = ln =
Прироста
y (t)
yt dt dt y dt
t




и переходом к пределу при n > ? будет получено искомое выражение для мо-
ментного темпа роста. Проще найти предел не этой величины, а ее логарифма.
То есть
1
? ln y (t)
ln y t + n
lim .
1
n>?
n

d ln y (t)
По определению производной, это есть , т.е. моментный темп при-
dt
роста. Следовательно, как и было указано, моментным темпом роста является e
d ln y (t)
в степени .
dt
Непрерывный темп роста за период от t до t + 1 определяется следующим
образом:
t+1
d ln y(t )
dt
dt
t
e .

В этом легко убедиться, если взять интеграл, стоящий в показателе:
t+1 t+1
d ln y (t ) y (t + 1)
dt = ln y t = ln ,
dt y (t)
t
t

и подставить результат (его можно назвать непрерывным темпом прироста за еди-
ничный период времени) в исходное выражение непрерывного темпа роста за пе-
риод:
y (t + 1)
ln
y (t) = y (t + 1) .
e
y (t)
36 Глава 1. Основные понятия

Построенные относительные показатели динамики сведены в таблице 1.1.
Относительные величины, с точки зрения их измерения, являются производ-
ными, т.е. их размер определяется путем расчета. Такой характер относительные
величины имеют и в других предметных науках. Но в экономике существуют интен-
сивные величины особого типа, имеющие первичный или фундаментальный харак-
тер. Это экономические единицы (измерения): цены продукции, тарифы за услуги,
ставки заработной платы, ставки процента, дивиденды, а также особые управля-
ющие параметры-нормативы, например, ставки налогов и дотаций. Эти величины
имеют разную размерность или безразмерны, но регистрируются они как величины
запаса — на определенные моменты времени.



1.9. Статистические совокупности и группировки

Статистической совокупностью, или просто совокупностью, называют множе-
ство объектов, однородное в определенном смысле. Обычно предполагается, что
признаки объектов, входящих в совокупность, измерены (информация имеется)
или по крайней мере измеримы (информация может быть получена). Полное мно-
жество величин-признаков или показателей-наблюдений было обозначено выше
как {xtij }. Совокупность объектов — это его подмножество по i.
Об однородности совокупности можно говорить в качественном и количествен-
ном смысле.
Пусть Ji — множество признаков, которые характеризуют i-й объект.
Совокупность однородна качественно, если эти множества для всех входящих
в нее объектов идентичны или практически идентичны. Такие совокупности обра-
зуют, например, сообщества людей, каждого из которых характеризуют имя, дата
и место рождения, пол, возраст, вес, цвет глаз, уровень образования, профессия,
место проживания, доход и т.д. В то же время понятно, что, чем большие сооб-
щества людей рассматриваются, тем менее однородны они в этом смысле. Так,
например, совокупность, включающая европейцев и австралийских аборигенов,
не вполне однородна, поскольку набор признаков для последних включает такие
характеристики, которые бессмысленны для первых (например, умение бросать
бумеранг), и наоборот.
Совокупность промышленных предприятий качественно достаточно однородна.
Но более однородны совокупности предприятий конкретных отраслей, поскольку
каждая отрасль имеет свою специфику в наборе всех возможных признаков.
Чем меньше общее пересечение множеств Ji , тем менее однородна в качествен-
ном смысле совокупность i-х объектов. Объекты, общее пересечение множеств
признаков которых мало, редко образуют совокупности. Так, достаточно бессмыс-
37
1.9. Статистические совокупности и группировки

ленна совокупность людей и промышленных предприятий, хотя все они имеют имя,
дату и место «рождения», возраст.
Допустимая степень неоднородности совокупности зависит, в конечном счете,
от целей исследования. Если, например, изучаются различия средней продолжи-
тельности жизни различных представителей животного мира, то в исследуемую
совокупность включают и людей, и лошадей, и слонов, и мышей.
Количественная однородность зависит от степени вариации значений призна-
ков по совокупности. Чем выше эта вариация, тем менее однородна совокупность
в этом смысле. В разных фрагментах количественно неоднородных совокупностей
могут различаться параметры зависимостей между величинами-признаками. Такие
совокупности иногда также называют качественно неоднородными. Для них невоз-
можно построить единой количественной модели причинно-следственных связей.
Так, например, люди с низким уровнем дохода увеличивают спрос на некоторые то-
вары при снижении своего дохода (малоценные товары) или/и при росте цен на эти
товары (товары «Гиффена»). Люди с высоким уровнем дохода реагируют на такие
изменения обычным образом — снижают спрос.
Однородные совокупности обычно имеют простое и естественное название:
«люди» или «население», «промышленные предприятия». Выделяются эти сово-
купности с целью изучения, соответственно, человеческого сообщества, промыш-
ленности и т.д.
Массив информации по совокупности часто называют матрицей наблюде-
ний. Ее строкам соответствуют объекты и/или время, т.е. наблюдения, столб-
цам — величины-признаки или переменные. Обозначают эту матрицу через X,
ее элементы — через xij , где i — индекс наблюдения, j — индекс переменной-
признака.
В конкретном исследовании все множество признаков делится на 2 части: фак-
торные признаки, или независимые факторы, — экзогенные величины и резуль-
тирующие (результативные) признаки, или изучаемые переменные, — эндоген-
ные величины. Целью исследования обычно является определение зависимости ре-
зультирующих признаков от факторных. При использовании развитых методов ана-
лиза предполагается, что одни результирующие признаки могут зависеть не только
от факторных, но и от других результирующих признаков.
В случае, если факторных признаков несколько, используют методы регресси-
онного анализа, если наблюдениями являются моменты времени, то применяются
методы анализа временных рядов, если наблюдения даны и по временным момен-
там, и по территориально распределенным объектам, то целесообразно применить
методы анализа панельных данных.
Если наблюдений слишком много и/или совокупность недостаточно однород-
на, а также для изучения внутренней структуры совокупности или при применении
38 Глава 1. Основные понятия

особых методов анализа связи, предварительно проводится группировка совокуп-
ности. Группировка — деление совокупности на группы по некоторым признакам.
Наиболее естественно проводится группировка по качественным признакам.
Такие признаки измеряются обычно в шкале наименований или в порядковой шка-
ле. Например, признак «пол»: 1 — мужской, 2 — женский (или ?1 и 1, 0 и 1,
1 и 0 и т.д.); «академическая группа»: 1 — студент 1-й группы, 2 — студент
2-й группы и т.д. (это — примеры использования шкалы наименований); «обра-
зование»: 1 — отсутствует, 2 — начальное, 3 — среднее, 4 — высшее (номи-
нальная шкала с элементами порядковой); оценка, полученная на экзамене: 1 —
неудовлетворительно, 2 — удовлетворительно, 3 — хорошо, 4 — отлично (по-
рядковая шкала с элементами интервальной).
Качественный признак принимает определенное количество уровней (напри-
мер: «пол» — 2 уровня, «образование» — 4 уровня), каждому из которых при-
сваивается некоторое целое число. Перестановка строк матрицы наблюдений по
возрастанию или убыванию (если шкала данного признака порядковая, то обыч-
но — по возрастанию) чисел, стоящих в столбце данного фактора, приводит к груп-
пировке совокупности по этому фактору. В результате строки матрицы, соответ-
ствующие наблюдениям-объектам с одинаковым уровнем данного качественного
фактора, оказываются «рядом» и образуют группу.
Группировка по количественному (непрерывному или дискретному) признаку
производится аналогичным образом, но после переизмерения этого признака в по-
рядковой (или интервальной) шкале. Для этого проводятся следующие операции.
Пусть xij , i = 1, . . . , N — значения j-го количественного признака в матри-
це N наблюдений, по которому проводится группировка — деление совокупности
на kj групп. Весь интервал значений этого признака [z0j , zkj j ], где z0j min xij ,
i
а zkj j max xij , делится на kj полуинтервалов [z0j , z1j ], (zij ?1, j , zij j ],
i
ij = 1, . . . , kj . Первый из них закрыт с обеих сторон, остальные закрыты справа
и открыты слева. Количество и размеры полуинтервалов определяются целями ис-
следования. Но существуют некоторые рекомендации. Количество полуинтервалов
не должно быть слишком малым, иначе группировка окажется малоинформатив-
ной. Их не должно быть и слишком много, так, чтобы большинство из них были
не «пустыми», т.е. чтобы в них «попадали» хотя бы некоторые значения количе-
ственного признака. Часто размеры полуинтервалов принимаются одинаковыми,
но это не обязательно.
Теперь j-й столбец матрицы наблюдений замещается столбцом рангов наблю-
дений по j-му признаку (рангов j-го признака), которые находятся по следующему
правилу: i-му наблюдению присваивается ранг ij , если xij принадлежит ij -му по-
луинтервалу, т.е. если zij ?1, j < xij zij j (если ij = 1, условие принадлежности
имеет другую форму: z0j xij z1j ). Таким образом, если значение наблюдения
39
1.9. Статистические совокупности и группировки

попадает точно на границу двух полуинтервалов (что достаточно вероятно, напри-
мер, при дискретном характере количественного признака), то в качестве его ранга
принимается номер нижнего полуинтервала. В результате данный признак оказы-
вается измеренным (пере-измеренным) в порядковой (ранговой) шкале с элемен-
тами интервальной шкалы, или — при одинаковых размерах полуинтервалов —
в интервальной шкале. В случае, если исходные значения данного признака потре-
буются в дальнейшем анализе, столбец рангов не замещает столбец наблюдений
за данным признаком, а добавляется в матрицу наблюдений.
Сама группировка осуществляется также перестановкой строк матрицы на-
блюдений по возрастанию ранга данного признака. В результате ij -ю группу об-
разуют наблюдения-объекты, имеющие ij -й ранг, а группы в матрице наблюдений

стр. 1
(всего 28)

СОДЕРЖАНИЕ

>>