стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>

И. Ф. ДЕВЯТКО


МЕТОДЫ
СОЦИОЛОГИЧЕСКОГО
ИССЛЕДОВАНИЯ






Екатеринбург
Издательство Уральского университета
1998




ББК С5в6
Д25


Издание осуществлено при участии
Института гуманитарных практик


Редактор М. Г. Тюлькина
Ответственный за выпуск Л. Е. Петрова



Девятко И. Ф.
Д25 Методы социологического исследования.- Екатеринбург: Изд-во Урал, ун-та, 1998.- 208 с.


ISBN 5-7525-0611-5


В данной книге рассматриваются ведущие методы социологического исследования - опрос, эксперимент, включенное наблюдение, биографический метод, а также специальные процедуры, применяемые для сбора, анализа и оценки качества социологических данных. Логика и методы социологического исследования рассматриваются в книге в контексте более широких исследовательских перспектив и моделей теоретического объяснения, предопределяющих выбор конкретных методических решений.
Книга может использоваться для подготовки и проведения социологических и маркетинговых исследований, а также в качестве пособия по курсу "Методология и методы социологического исследования". Книга предназначена для преподавателей, аспирантов и студентов факультетов социальных наук.


ББК С5в6


ISBN 5-7525-0611-5

? Девятко И. Ф., 1998

ПРЕДИСЛОВИЕ
Тема этой книги - логика и методы социологического исследования. Хотя основное внимание в ней уделено ведущим методам социологического исследования - опросу, эксперименту, включенному наблюдению, биографическому методу, а также детальному описанию специальных процедур, применяемых для сбора, анализа и оценки качества социологических данных,- многие разделы книги рассматривают процесс исследования в контексте более широких исследовательских перспектив и моделей теоретического объяснения, используемых социологами и влияющих на выбор конкретных методических решений. Взаимосвязь социологической теории и метода прослеживается здесь на разных уровнях - от выбора способа фиксации данных до идентификации используемой модели измерения.
В первой главе рассмотрены проблемы философии и логики научного исследования, взаимосвязи теоретического и методического знания в социальных науках. Главы 2 и З дают достаточно детальное представление об истоках, идейных предпосылках и конкретных применениях включенного наблюдения и биографического метода в социологии. Эти методы сравнительно недавно вошли в учебные планы и явно нуждаются в более полном и систематическом представлении отечественному читателю. Главы 4 и 5 рассказывают о классических и самых современных подходах к эксперименту и массовому опросу в социальных науках. Наконец, 6, 7 и 8 главы посвящены взаимосвязи теории, метода и измерения в социологических исследованиях, а также возможностям выборочного метода и статистического анализа данных. Этот круг вопросов нередко получал весьма упрощенную трактовку не только в учебных текстах, но и в обзорных монографиях. В главе 8, посвященной анализу данных, рассматриваются некоторые довольно сложные и продвинутые аналитические техники, однако ее чтение не требует подготовки, выходящей за пределы самых основных статистических представлений.
Книга может использоваться в качестве пособия по вводному курсу "Методология и методы социологического исследования" для студентов-социологов, а также служить вспомогательным источником по общеобразовательным и специальным курсам, затрагивающим вопросы планирования и проведения социологических исследований, измерения и анализа данных в социальных науках. Кроме того, она может стать своеобразным путеводителем для всех тех, кто намеревается выступить в роли квалифицированного "потребителя" или заказчика социологических исследований.
Здесь мне хотелось бы выразить признательность всем коллегам, читавшим книгу в целом, а также отдельные ее разделы, в частности проф. В. А. Ядову, высказавшему ряд полезных замечаний. Список тех, кто оказывал мне такого рода помощь и поддержку, слишком велик, чтобы приводить его в "Предисловии", и включает всех моих учителей и студентов. Мои основные литературные "долги" указаны в библиографических сносках и списках дополнительной литературы к отдельным главам. Я также признательна моим екатеринбургским коллегам из издательства Уральского государственного университета, которые способствовали выходу в свет этой книги, довольно продолжительное время ожидавшей публикации. Особая благодарность Л. Е. Петровой, оказывающей неоценимую интеллектуальную, техническую и моральную поддержку на все стадиях подготовки рукописи к печати, а также помогавшей мне в проведении библиографических разысканий.
Наконец, мне хотелось бы выразить благодарность моим родителям, которые ввели меня в самую суть методологической проблематики, показав, что как часто бывает важнее, чем что.

Москва, 1997


ГЛАВА 1. ЛОГИКА СОЦИОЛОГИЧЕСКОГО
ИССЛЕДОВАНИЯ

Методология и логика социологического исследования.
Возможно ли объективное и научное социальное знание?

Эта книга посвящена методам социологического исследования и рассчитана прежде всего на тех, кто проводит или собирается проводить такие исследования - в практических, прикладных целях либо ради удовлетворения так называемого академического интереса (последний, как известно, в более долговременной перспективе тоже служит практическим целям). Кроме того, она может быть полезна тем читателям, которые хотят стать грамотными потребителями результатов социологических исследований, в частности лицам, принимающим политические и социальные решения на основании социологических данных, заказчикам прикладных исследований (предвыборных, маркетинговых и т. п.), а также тем, кто формирует собственное либо даже общественное мнение, основываясь на цифрах и фактах, приводимых в исследовательских отчетах или газетных публикациях.
Совершенно очевидно, что достоверность фактов и выводов, полученных исследователем, зависит от того, каким способом последний пришел к данным фактам и выводам, т. е. от использованного им метода. В повседневной жизни мы также описываем факты, оцениваем их правдоподобие, выводим гипотетические закономерности или опровергаем выводы других людей. Однако в науке все эти повседневные методы получения нового знания подвергаются куда более тщательной разработке. В повседневной жизни, например, мы легко используем понятия "всегда", "никогда" или "очень часто", но такого рода оценки остаются субъективными и относительными, пока они полностью зависят от того, кто оценивает и какие события подвергаются оценке. Частота "один случай из двадцати" будет оцениваться как "очень часто", если речь идет о неудачных исходах хирургической операции (особенно если оценку производит пациент), и как "почти никогда", если эта частота соответствует шансам конкретного абитуриента поступить в университет. Чтобы сделать такого рода оценки более сравнимыми и объективными, в науке используются статистические критерии и методы статистического оценивания, позволяющие судить о вероятности реализации определенного события, о сугубо случайном или, наоборот, закономерном характере полученного результата (хотя, как мы увидим в дальнейшем, статистическая значимость научного факта не обязательно свидетельствует о его социальной и личностной значимости).
Современная наука - это коллективное предприятие, требующее к тому же немалых затрат. В силу этих обстоятельств, а также в силу присущих человеку стремления к истине (даже несовершенной и подверженной постоянным пересмотрам) и способности к критической оценке существующих точек зрения (большей или меньшей, но в общем поддающейся тренировке) проблема "Научного Метода", позволяющего получить достоверные и надежные результаты и на их основе прийти к объективным и хорошо обоснованным выводам, неизменно пользуется вниманием ученых. Хотя по мере развития науки у ученых оставалось все меньше оснований верить в существование единого и универсального "Метода", пригодного для решения всех без исключения научных задач, они, тем не менее, стремились разработать все более точные и надежные методы опытной проверки теоретических гипотез, а также определить критерии для оценки объективности и обоснованности нового знания, получаемого в результате проводимых ими исследований.
Методология науки - это дисциплина, изучающая и технические, "процедурные" вопросы организации исследования, и более общие вопросы обоснованности используемых методов, достоверности наблюдений, критериев подтверждения или опровержения научных теорий.
Такая "всеядность" методологии связана с тем, что большинство сугубо технических вопросов, возникающих в реальной исследовательской практике, не могут быть решены без обращения к более широким представлениям о том, что в данном случае может служить критерием истинности или обоснованности, какие факты следует считать релевантными, т. е. относящимися к проверяемой теории, а какие - случайными ошибками наблюдения и т. п. С другой стороны, непосредственным источником самих нормативных стандартов и критериев, используемых при оценке исследовательских процедур и результатов, служат не только абстрактные и универсальные конструкции формальной логики, но и реальная, "ситуативная" логика конкретного исследования, принимающая во внимание его цели, происхождение стоящей перед исследователем научной проблемы (теоретическое затруднение, практическая задача), доступные теоретические и технические ресурсы и, наконец, научный "фон" исследования - ту теоретическую перспективу или, если воспользоваться популярным обозначением, исследовательскую программу, в рамках которой и замысел, и методика, и результаты исследования приобретают свой подлинный смысл. Чтобы понять смысл и результаты, например, экспериментов физика А. Майкельсона по измерению относительной скорости света (вдоль и поперек потока "эфирного ветра"), нужно представлять себе суть спора между сторонниками различных теорий "светоносного эфира" и сторонниками теории относительности Эйнштейна1. Точно так же трудно оценить процедуру и результаты эксперимента, в котором психолог сначала помещает крыс в лабиринт, оставляя их там на некоторое время, а потом, установив в конце лабиринта кормушку с приманкой, измеряет с помощью секундомера время, затраченное крысами на прохождение лабиринта. Чтобы понять методику последнего эксперимента, следует представлять себе основные положения исследовательской программы бихевиоризма, весьма влиятельного направления в науках о поведении. (Только что описанный эксперимент2, в частности играет важную роль в споре о том, способны ли внутренние образы окружения, "когнитивные карты", оказывать реальное влияние на скорость выработки поведенческих навыков у животных. Для человека, не имеющего представления об этом споре, предварительное помещение крыс в лабиринт выглядит ничего не значащим фактом или, в худшем случае, методическим промахом экспериментатора; для сторонника же бихевиористской исследовательской программы - это логически необходимое условие для любых выводов относительно влияния предварительной ориентировки на обучение.)
До недавнего времени в философии и методологии науки господствовал упрощенный взгляд на логику и процедуру научного исследования, который можно обозначить как "традиционный образ науки". Этот взгляд игнорировал только что описанные сложные взаимосвязи между самыми общими философскими и теоретическими представлениями, входящими в определенную исследовательскую программу, и более частными предположениями, из которых явно или неявно исходит ученый, планирующий конкретное исследование. "Традиционный образ науки" представлял процесс исследования как простую линейную последовательность:
проверяемая общая теория, ? из которой выводится основная теоретическая гипотеза, ? определение основных теоретических понятий в терминах конкретных измерительных операций, т. е. их операционализация, ? решающий эксперимент, ведущий к ? однозначному принятию или отвержению гипотезы, а заодно и общей теории, из которой гипотеза была выведена.
Предполагалось, что отрицательный результат "решающего эксперимента", т. е. эмпирическая демонстрация ложности предсказаний, выведенных путем логической дедукции из теоретических предпосылок, свидетельствует о ложности этих предпосылок. На практике, однако, всегда можно приписать "неудачное" наблюдение либо неучтенным особенностям исходных условий конкретного эксперимента, либо ложности множества вспомогательных гипотез и предположений, используемых при проверке основной теоретической гипотезы. Так, в частности, негативный результат всегда может быть приписан не проверяемой гипотезе, а артефактам используемого метода или погрешностям в операционализации и измерении отдельных показателей3. Кроме того, в теоретическую гипотезу, вспомогательные предположения или, наконец, в самые общие теоретические предпосылки исследовательской программы, включающей в себя спорную теорию, почти всегда можно внести разного рода небольшие поправки или дополнения (так негативный результат упоминавшихся выше опытов Майкельсона с измерением "эфирного ветра" поначалу объяснялся тем, что движение эфира непосредственно у поверхности Земли столь незначительно, что использованная в опыте аппаратура не обладала достаточной точностью для его фиксации). Иными словами, "решающие эксперименты" чрезвычайно редки даже в точных науках: влиятельная и пользующаяся поддержкой многих ученых теория имеет большие шансы устоять даже при наличии нескольких контрпримеров - до тех пор, пока более широкая исследовательская программа, в которую включена теория, не уступит место новой, более плодотворной и привлекательной. Кроме того, "традиционный образ науки" игнорировал то обстоятельство, что далеко не всегда исходной точкой исследовательского процесса служит вполне сложившаяся абстрактная теория. Источником исследовательских гипотез и в социальных науках, и, например, в биохимии или физике часто становятся случайное наблюдение, личный "вненаучный" опыт ученого, неожиданные результаты, полученные при использовании новой методики или технического прибора. В попытках объяснить необычный факт исследователь формулирует пробные теоретические предположения, которые пока не могут быть привязаны ни к какой из существующих абстрактных теорий (и тем более не могут быть выведены из нее дедуктивно). Некоторые из возникших таким образом догадок повышают "теоретическую чувствительность" исследователя и ведут к формулировке новых рабочих гипотез, введению новых описательных понятий или даже, в конечном счете, к возникновению новых исследовательских программ4. Так, например, непосредственно в процессе включенного наблюдения за взаимодействием членов некоторой организации, проводимого социологом, у последнего могут возникнуть весьма полезные догадки, касающиеся существующей в этой организации статусной иерархии. (Подробнее о возможностях теоретического обобщения полевых данных говорится в гл. 25.) Таким образом, налицо значительное несоответствие между вышеописанным "традиционным образом науки" и реальной логикой исследования. Это несоответствие становится особенно очевидным, когда мы обращаемся к области социальных наук:
1) где существует сравнительно мало развитых формальных теорий, из которых можно было бы строгим образом вывести проверяемые гипотезы, а для каждой из таких гипотез уже в момент ее выдвижения можно найти множество контрпримеров;
2) где возможности экспериментального метода заведомо ограничены, а имеющиеся данные о естественно случающихся событиях либо о результатах специальных опросов редко позволяют разделить главные и побочные эффекты;
3) где, наконец, одновременно существует несколько очень влиятельных исследовательских программ (например, бихевиористская, интерпретативная и структуралистская), каждая из которых обладает собственным набором методологических норм, излюбленных исследовательских техник и образцовых теоретических интерпретаций6.
Воспользуемся наглядным примером, взятым из области социальных наук. В социальной психологии, социологии и экономике существуют довольно убедительные теории, относящиеся к единой исследовательской программе и описывающие поведение человека как эгоистическое, направленное на достижение максимального удовлетворения потребностей индивида. С точки зрения этих теорий, в частности, даже самые идеальные мотивы скрывают за собой рациональный расчет, направленный на увеличение личных "активов", в том числе материальных благ, социального престижа, политического влияния. Самым рациональным, таким образом, 'будет поведение, которое позволяет максимизировать доступные индивиду блага - материальные и нематериальные - для данного набора индивидуальных возможностей, т. е. ресурсов, которыми этот индивид располагает. Соответственно деятельность ученого, проводящего трудоемкие изыскания без какой-либо материальной поддержки, или поступок филантропа, жертвующего деньги на благотворительность, также рассматриваются с точки зрения скрытых вознаграждений, удовлетворяющих эгоистические потребности: ученый рассчитывает завоевать признание коллег, получить хорошо оплачиваемую работу в престижном университете; филантроп заинтересован в удовлетворении собственного тщеславия и создании благоприятного общественного мнения о себе. В конкретном исследовании данная исследовательская программа (назовем ее "концепцией экономического человека") принимает форму гипотез, описывающих ожидаемое поведение людей в ситуациях определенного типа (например, "Если в ситуации S для достижения максимального вознаграждения А нужно сделать В, то испытуемый X сделает В"). Получаемые в результате исследования данные могут соответствовать либо не соответствовать тому, что предсказывает гипотеза. Следовательно, результаты будут рассматриваться как подтверждающие или не подтверждающие выдвинутую первоначально гипотезу. Всякое удачное предсказание будет вести к относительному подтверждению гипотезы (для данного типа ситуаций). Интереснее, однако, то, что происходит, когда теоретические предсказания не сбываются или сталкиваются с контрпримерами7. "Концепция экономического человека", в частности, сталкивается с трудностями, если требуется предсказать поведение в ситуациях неопределенности, когда выбор основан на недостаточной информации и окончательная "цена" того или иного решения в принципе не может быть определена заранее. В таких ситуациях самой разумной с точки зрения "экономического" подхода стратегией обычно является случайное угадывание. Однако эксперименты и наблюдения за поведением отдельных людей или групп показывают, что они практически никогда не основывают свой выбор на простом подбрасывании монетки. Напротив, они всячески стремятся обосновать свой выбор и придумать какую-то "стратегию принятия решений", исходя при этом из ложных или заведомо непроверяемых представлений. Еще сложнее сторонникам описанного подхода справиться с другого рода контрпримерами, демонстрирующими слепое подчинение разума вполне неразумным целям либо рациональное стремление увеличить или уменьшить не собственное, а чье-либо еще благо. Человек, совершающий самоубийство, вполне способен осуществить задуманное самым экономичным и рациональным способом. Возможно, конечно, утверждать, что при этом он достигает максимального блага, или, если воспользоваться специальным жаргоном, реализует свое "наибольшее предпочтение", но в таком случае нам придется признать свою неспособность дать независимое определение того, что следует считать "разумным желанием" - рациональной будет выглядеть любая цель, мотивирующая реальное поведение. Более того, так как люди часто стремятся представить любые свои поступки в качестве разумных, "рационализировать" их, то нам будет весьма трудно отличить истинно расчетливые поступки от "рационализации", изобретаемых для оправдания уже свершенного. Трудности в определении ключевых понятий приведут к трудностям в их операционализации, и в результате эмпирическое подтверждение или отвержение отдельных гипотез, выводимых из "концепции экономического человека", будет полностью зависеть от используемых показателей или методов измерения рациональности поступков. Кроме того, результат, противоречащий теоретическим предсказаниям, всегда может быть отнесен на счет несовершенства этих методов. Существуют и такие контрпримеры, которым обсуждаемая концепция (являющаяся, напомним, не отдельной теорией, а обширной исследовательской программой) не может дать сколько-нибудь удовлетворительного объяснения. Так, иногда люди совершают добрые поступки анонимно (вносят благотворительные пожертвования, возвращают потерянные кошельки и т. п.). Ученый из вышеприведенного примера может тратить значительные силы не на собственные труды, а на то, чтобы любой ценой воспрепятствовать публикации трудов коллеги. "Концепция экономического человека" может многое объяснить в том, как люди расчетливо используют наличные средства для достижения максимально возможного счастья (так определял рациональное поведение Гоббс), но она малопригодна для объяснения того, как человек может руководствоваться стремлением к счастью или несчастью другого человека8. Такая "ограниченная подтверждаемость" (обратной стороной которой является "ограниченная опровергаемость") скорее типична для социальных наук. Сильная взаимосвязь между теорией, методом и получаемыми "на выходе" эмпирическими данными, характерная для реальной логики всякого научного исследования, здесь становится еще более очевидной в силу наличия конкурирующих теоретических перспектив, каждая из которых располагает большим количеством контрпримеров, ставящих под сомнение базисные предположения остальных9.
Приведенный пример показывает, что чрезмерно упрощенный "традиционный образ науки" и основанные на нем методологические рекомендации едва ли могут оказаться полезными при разработке и оценке исследовательских методов для социальных наук. Это, однако, не означает, что нам следует отказаться от разработки критериев рационального и объективного научного исследования, основанных на более адекватном представлении о научной практике.
Во-первых, всякое исследование в социальных науках направлено на поиски объяснения человеческого поведения, и, следовательно, ориентировано на поиск некоторой гипотетической закономерности, обладающей большей или меньшей степенью общности, но всегда требующей эмпирического подтверждения и критического сопоставления с другими альтернативными гипотезами. Источником таких гипотез, как мы уже видели, могут быть и сложившиеся научные концепции, и - реже - "обыденные теории". Далее, возможность объяснения и предсказания в общественных науках основана на признании причинной обусловленности объясняемых событий. Даже объясняя поведение людей их целями, представлениями и убеждениями, социолог стремится продемонстрировать работу некоторого причинного механизма, обеспечивающего взаимосвязь целей и идей (рациональных или иррациональных, истинных или ложных) с поведением. Изучение чисто логических отношений согласованности между целями и средствами деятельности, элементами системы верований или, например, брачными правилами, существующими в некотором сообществе, само по себе еще не позволяет объяснить, почему произошли или не произошли некоторые события. Логические отношения между идеями или высказываниями (отношения импликации) позволяют осуществлять логический вывод - от одного формально истинного высказывания к другому, но не позволяют предположить, что произойдет (или произошло) в действительности. Из совокупности высказываний можно логически вывести лишь другую совокупность высказываний. (Человек, логично рассуждающий о преимуществах любви к ближнему, как известно, не обязательно следует собственным рассуждениям на практике10.) Поэтому, вопреки рецептам некоторых сторонников "гуманистической модели" социальных наук, социологи не ограничиваются интерпретацией того, что люди говорят, либо того, во что они верят.
Оценка существующих теорий и гипотез в социальных науках, как и в науках естественных, предполагает введение определенных критериев эмпирической проверяемости и истинности теоретических высказываний, а также разработку и применение соответствующих этим критериям методов исследования.
Таким образом, процесс социологического исследования неизбежно включает в себя:
1) стадию осознания теоретической или практической недостаточности существующего знания (источники такого осознания, как говорилось выше, могут лежать и в области теории, и в области повседневного опыта или социальной практики);
2) стадию формулировки проблемы и выдвижения гипотетического объяснения, а также
3) стадию эмпирической проверки сформулированной гипотезы, за которой нередко следует
4) стадия переопределения и уточнения проблемы или гипотезы, дающая начало новому исследовательскому циклу.
Разнообразие существующих в социологии исследовательских программ, а также реальных контекстов исследования, т. е. теоретических и практических целей исследования, возможностей, которыми располагает исследователь, а также возникающих в исследовательской практике технических и этических ограничений, ведет к тому, что конкретные реализации описанного процесса исследования могут существенно различаться. Ведущие методы социологического исследования и представляют собой такие конкретные реализации, или стратегии, процесса социологического исследования.

Методы социологического исследования:
общий обзор
В этой книге рассматриваются основные методы социологического исследования - эксперимент, метод включенного наблюдения, биографический метод, массовый опрос, а также конкретные методики, используемые на разных стадиях исследовательского процесса (в частности, методики построения выборки, измерения и анализа данных, в силу своей относительной сложности и значимости выделенные в отдельные главы). Описания специфических процедур сбора, анализа и интерпретации данных, характерных для каждого из рассматриваемых методов, как и подробный анализ преимуществ и недостатков последних, будут представлены в соответствующих главах, здесь же имеет смысл ограничиться кратким обзором, позволяющим, прежде всего, проследить взаимосвязь основных социологических методов с теми исследовательскими программами, в рамках которых они первоначально формировались, а также с теми контекстами исследования, в которых они чаще всего используются.
Эксперимент - это метод, обеспечивающий наилучшие эмпирические данные для проверки гипотез о наличии причинной связи между явлениями, а также самое надежное средство решения многих практических задач, связанных с оценкой эффективности социальных и политических программ. Многомерный контролируемый эксперимент, как мы увидим в дальнейшем, соответствует самым строгим стандартам научного вывода и незаменим при сравнении объяснительных возможностей разных теорий. В некоторых отношениях процедура экспериментальной проверки гипотез даже превосходит эталоны вышеописанного "традиционного образа науки", так как возникающая при планировании эксперимента необходимость в формализации теоретической модели, операционализации переменных, определяющих "главный эффект", а также в нахождении инструментов контроля посторонних, смешивающих влияний, ведет не только к прояснению основной гипотезы, но и к анализу всех тех внешних условий и факторов окружения, для которых соблюдаются постулируемые теорией соотношения (такой анализ, как будет показано в гл. 4, призван гарантировать внешнюю валидность эксперимента). Недостатки экспериментального метода являются продолжением его достоинств (что, впрочем, верно и применительно ко всем остальным методам). Возникнув в натуралистической традиции социологического исследования, экспериментальный метод был изначально ориентирован на лабораторный или квазилабораторный исследовательский контекст, высокий уровень формализации проверяемых теорий и максимальные возможности измерения и контроля всех существенных переменных. Кроме того, сторонники экспериментального метода с самого начала отдавали предпочтение скорее абстрактным и общим понятиям научной теории в ущерб специфическим и уникальным понятиям, используемым при описании социального взаимодействия его непосредственными участниками или "непрофессиональными" наблюдателями. Иными словами, эксперимент оказался методом, пригодным скорее для проверки наиболее "сложившихся" и развитых социологических и социально-психологических теорий, чем для поисковых исследований, направленных на выработку адекватного теоретического языка и формулировку пробных гипотез, описывающих закономерности естественного протекания социальных процессов. Кроме того, следует помнить об этических проблемах, иногда возникающих при экспериментальном манипулировании переменными социального окружения. Эти проблемы могут касаться не столько гипотетического влияния нежелательных факторов, сколько возможного социального неравенства, возникающего в крупномасштабных полевых экспериментах при распределении участников по экспериментальным и контрольным группам, так как в результате члены контрольных групп не получают "позитивного" экспериментального воздействия (на оценку эффективности которого и направлен эксперимент), например, социального пособия, нового прогрессивного метода обучения и т. п. Наконец, экспериментальный метод мало пригоден для получения результатов, которые можно было бы распространить на общество в целом или на большие социальные группы, он не позволяет увидеть "срез" широкомасштабных социальных процессов. Результаты хороших лабораторных экспериментов обладают высокой надежностью, однако они довольно далеки от "реального мира" (справедливости ради нужно отметить, что социальным наукам далеко не всегда следует стремиться к отражению многообразия "живой жизни"). Результаты полевых экспериментов в целом характеризуются большей близостью к "реальному миру", однако это преимущество достигается ценой несколько меньшей надежности и большей подверженности всяческим смещениям. Качество данных, получаемых в широкомасштабных социальных экспериментах, далеко не всегда оправдывает их чрезвычайно высокую стоимость.
Массовый опрос является, пожалуй, самым популярным социологическим методом. Он превосходит эксперимент с точки зрения дескриптивных возможностей и служит не только сугубо академическим целям, являясь наилучшим средством получения социальной статистики. Именно опросы общественного мнения используются при изучении мнений и установок широких слоев общества, обеспечивая, при корректном применении, возможность "отслеживания" даже небольших изменений в самых разнообразных сферах общественной жизни - от распределения семейных бюджетов до динамики избирательских предпочтений. Современные подходы к построению выборки и анализу данных, о которых рассказывается в гл. 7 и 8, позволяют максимально приблизить возможности проверки причинных гипотез, предоставляемые методом массового опроса, к возможностям экспериментального метода. Недостатки опросного метода отчасти также совпадают с недостатками последнего. Речь идет прежде всего о низкой чувствительности этого метода к уникальным чертам исследуемой социальной ситуации, об относительно меньшем внимании к субъективным и индивидуальным характеристикам опыта исследуемых людей и групп, к их самоописаниям, интерпретациям и "обыденным теориям". Описанные недостатки, в свою очередь, являются обратной стороной стремления к теоретическому обобщению результатов и концептуальной строгости.
Преимущества включенного наблюдения и биографического метода заключены, прежде всего, в возможности получения детальной "дотеоретической" информации об изучаемых социальных явлениях. Непосредственная включенность исследователя в изучаемую социальную ситуацию, группу или культуру нередко позволяет получить уникальные сведения об используемых самими участниками значениях и символах, о локальных или субкультурных "языках взаимодействия", знакомство с которыми, как будет показано далее, является само собой разумеющимся условием их дальнейшего теоретического анализа. Хотя ученый не может "влезть в шкуру" других людей, особенно принадлежащих к чужой культуре или другой исторической эпохе, он может попытаться упорядочить и подвергнуть более глубокому и систематическому рассмотрению те слова, символы и культурные формы, посредством которых изучаемые им люди описывают и передают свой опыт, делая это зачастую непоследовательно, случайно или не вполне осознанно. Сравнительно абстрактные и высокосодержательные термины научного описания, в свою очередь, позволяют социологу или этнографу превратить спонтанное переживание и изменчивые культурные формы в предмет собственно теоретического анализа, сделать еще один шаг к увеличению достоверного, доступного коллективному пониманию и проверяемого научного знания. Наиболее очевидные недостатки включенного наблюдения и, в несколько большей степени, биографического метода связаны с излишне дескриптивным характером получаемых данных, опасностью подмены научных объяснений высокохудожественными и вполне субъективными повествованиями, в которых на смену внятным теоретическим представлениям и эмпирическим доказательствам приходят риторические фигуры и суггестивные авторские интонации.

Дополнительная литература
Батыгин Г. С. Обоснование научного вывода в прикладной социологии. М.: Наука, 1986.
Девятко И. Ф. Модели объяснения и логика социологического исследования. М.: ИСО РЦГО-TEMPUS/TACIS, 1996.
Лакатос И. Фальсификация и методология научно-исследовательских программ. М.: Московский философский фонд "Медиум", 1995.
Кун Т. Структура научных революций. М.: Прогресс, 1977.
Уинч П. Идея социальной науки и ее отношение к философии. М.: Русское феноменологическое общество, 1996.
Ядов В. А. Социологическое исследование: методология, программа, методы. 2-е изд., перераб. и доп. М.: Наука, 1987. Гл. 1.
Ядов В. А. Стратегии и методы качественного анализа данных // Социология: 4М. 1991. № 1.

ГЛАВА 2. ВКЛЮЧЕННОЕ НАБЛЮДЕНИЕ

Что такое включенное наблюдение?
Включенное наблюдение и этнографический метод:
определение и исторические истоки
Под "включенным наблюдением" в социологии обычно подразумевают либо особый метод сбора социологических данных (1), либо целостную исследовательскую стратегию, т. е. методологию социальных и гуманитарных исследований, качественно отличную от методологии естественных наук (2). "Включенное наблюдение-2", таким образом, шире по содержанию, чем "включенное наблюдение-1". Причина заключается в том, что за более широкой трактовкой наблюдения-2 стоит значительно большее количество явных и неявных теоретических предпосылок и предположений. Некоторые из этих предпосылок относятся к возможностям и ограничениям наших методов познания социального мира, некоторые же связаны с общими представлениями о том, как устроен сам этот мир.
Разумеется, выделенные нами две трактовки включенного наблюдения - это заведомая идеализация. Даже среди тех, кто убежден в том, что включенное наблюдение - ведущая методология социальных наук, нет полного единства мнений. Некоторые исследователи полагают, что преимущества включенного наблюдения связаны с возможностью уточнения и усовершенствования теоретических понятий в ходе непосредственного взаимодействия исследователя с описываемой им реальностью, что особенно существенно в том случае, когда сам исследователь исходно не принадлежит к изучаемой культуре или сообществу. В этом случае социолог-"аутсайдер" получает значительную часть своих теоретических представлений в прямом сотрудничестве с хорошо осведомленным информатором-"туземцем". Информатор здесь становится прямым источником содержательных представлений и понятий, которые социолог в дальнейшем подтверждает, уточняет или опровергает (например, это могут быть сведения о структуре взаимодействия в уличной шайке либо об отношениях родства или нормах этикета в индейском племени). Описанной исследовательской установке часто соответствует широкое понимание включенного наблюдения как этнографического метода описания человеческих сообществ11.
Несколько иной тип исследовательской установки при использовании метода включенного наблюдения имеет место в том случае, когда социолог стремится понять и принять точку зрения тех, кого он исследует, реконструировать субъективный смысл, который первые вкладывают в свои поступки, проникнуть в изменчивый символический мир социальных субъектов. Этот тип исследовательской установки особенно характерен для работ, выполненных в традиции символического интеракционизма, понимающего под включенным наблюдением прежде всего "отношение, которого не может избежать человек, ведущий наблюдение за другими человеческими существами, а именно - необходимость каким-то образом соучаствовать в опыте и поступках тех, кого он наблюдает"12.
Наконец, возвращаясь к тому, что мы обозначили как "включенное наблюдение-1", исследователь может придерживаться весьма жестких стандартов научного вывода, стремясь к построению обобщенных причинных объяснений и предсказаний, и вместе с тем использовать включенное наблюдение как метод сбора данных и эвристическую процедуру для формирования предварительных теоретических гипотез и понятий на ранних стадиях исследования13. По мере уточнения сферы теоретических интересов, сравнительной роли различных теоретических понятий и переопределения исследовательской проблемы социолог может постепенно перейти к использованию результатов включенного наблюдения для измерения, проверки более строгих гипотез или построения причинных моделей происходящего14.
Метод включенного (или полевого) наблюдения, таким образом, получает несколько различающееся толкование в различных теоретических перспективах, в зависимости от того, как понимаются природа и цели социологического исследования. Не менее разнообразны и сферы использования полевых наблюдений в социологии, те "жизненные миры", области социального опыта, которые могут стать предметом этнографического описания.
Классическим примером стало исследование У. Ф. Уайта, описавшего структуры взаимодействия и неявные статусные иерархии, организующие повседневную жизнь бедного итало-американского района в большом городе на восточном побережье США, и его обитателей - местных политиков, членов молодежных банд и ориентированных на карьеру способных студентов15.
Другой классический пример - проведенное Л. Фестингером и соавторами исследование небольшой секты, пророчившей скорое наступление конца света16. Заметим, что в исследовании Уайта социолог явно выступал в роли наблюдателя и не скрывал целей своего присутствия "в поле". Фестингер и соавторы полагали, что единственный способ проникнуть в замкнутую общину верующих, воспринимавших внешний мир как враждебный и нечувствительный к тайному откровению, заключался в том, чтобы стать полноправными членами секты и скрыть свою профессиональную роль социолога. В этом случае наблюдатели получили доступ в "поле", представившись путешествующими бизнесменами, слышавшими прежде о существовании группы, сочувствующими ее целям и желающими узнать о ней больше. Однако вскоре социологи, стремившиеся наблюдать сектантов в естественных условиях (важная предпосылка этнографического метода), столкнулись с тем, что их собственное присутствие интерпретировалось верующими как прямое подтверждение подлинности их откровения. Ситуация усугублялась тем, что один из социологов, стремясь придать большее правдоподобие своей "легенде", рассказал членам секты о якобы имевшемся у него опыте оккультной практики и сверхчувственного познания. Члены секты восприняли его "обращение" как важное событие. Таким образом, значительная часть "естественного" хода событий оказалась вольно или невольно сфабрикованной социологами.
К другим, сравнительно недавним образцам успешного использования метода включенного наблюдения в социологии можно отнести, - ограничившись лишь несколькими примерами, - исследования повседневной жизни "внутри" лабораторной науки17, исследования профессиональной социализации в хирургическом отделении больницы и способов оценки и контроля медицинских ошибок, совершаемых молодыми врачами18, изучение роли "кокаиновой экономики" в жизни маленьких сельскохозяйственных общин в перуанских Андах19, анализ процесса старения и способов, с помощью которых обитатели еврейского центра для престарелых в Калифорнии осмысливают и организуют свою жизнь20.
Мы будем рассматривать включенное наблюдение не как альтернативу другим исследовательским подходам, а как один из важных методов социальных наук, часто использующий элементы других методов и техник (например, анализ документов, клиническое интервью, квазиэксперимент) и, в свою очередь, позволяющий расширить содержательную интерпретацию результатов, полученных другими, более формализованными методами.
Включенное наблюдение основывается на широком круге источников информации. Наблюдатель "явно или неявно соучаствует в повседневной жизни людей в течение достаточно продолжительного времени, наблюдая за происходящим, прислушиваясь к сказанному, задавая вопросы. В сущности, он собирает любые доступные данные, которые могут пролить свет на интересующие его (или ее) проблемы"21.
В общем случае, включенное наблюдение чаще основано на неформализованных интервью, менее репрезентативных данных, нестатистическом подходе к обоснованию выводов и причинных моделей. Из сказанного, однако, не следует, что при использовании этнографических методов в социологии "все позволено", и исследователь может с легкостью отказаться от любой теоретической логики, стандартов репрезентативности или от обоснования своих выводов. Включенное наблюдение основывается на некоторых теоретических предпосылках и абстрактных идеях, понимание которых существенно для осмысленного использования этого метода.
Методология включенного наблюдения подчеркивает важность "логики открытия"22, не проводящей жесткой границы между формализованной теорией и эмпирическим знанием, между формально-логическим рассуждением и здравым смыслом в процессе поиска новых понятий, обобщений и теорий. Предполагается, что более гибкие способы определения исследовательской проблемы и теоретических гипотез и соответствующие методы сбора и оценки эмпирической информации создают предпосылки для построения теорий, укорененных в реальности конкретного социального опыта, в повседневных словах и поступках людей23.

Планирование исследования: определение проблемы,
отбор случаев, ситуаций и групп
На той стадии работы, которая предшествует полевому наблюдению, исследователь обычно определяет для себя ключевую проблему и соответствующую совокупность ключевых вопросов, на которые можно получить теоретически осмысленные, т. е. подлежащие и поддающиеся теоретическому осмыслению, ответы.
Социологи или этнологи (в отличие, например, от психологов или экономистов) довольно редко сталкиваются с ситуацией, когда их предварительные гипотезы можно строго вывести из развернутой и логически согласованной теории. Значительно типичнее ситуация, когда выбор проблемы определяется совокупностью более или менее отчетливых теоретических понятий и идей, совокупностью интересных и требующих объяснения фактов и, наконец, различными политическими, практическими и этическими соображениями. Включенное наблюдение, как и другие типы социологического исследования, часто начинается в ситуации, где в той или иной мере присутствуют все перечисленные компоненты: идеи, факты, политика, этический и практический интерес. Однако в случае этнографического исследования (мы будем иногда использовать последний термин как синоним "включенного наблюдения") исследователь обычно ставит своей целью не столько проверку гипотез, выводимых из существующей теории, сколько развитие новых теоретических представлений. Хорошим примером поиска теоретического объяснения уникального факта может служить известная работа М. Фрейлиха, посвященная роли социокультурных факторов в объяснении такого необычного (хотя и достаточно известного) явления, как "сверхпредставленность" индейцев-мохавков среди нью-йоркских монтажников-высотников24.
Личный опыт и интересы также нередко становятся предпосылками исследования. Так например, А. Стросс и Б. Глезер, незадолго до начала своего знаменитого исследования процесса умирания в больничных условиях, пережили потерю близких. Обстоятельства смерти их близких были таковы, что уже на предварительной стадии полевого исследования их внимание было приковано к рутинным процедурам обращения медиков с неизлечимыми пациентами и влиянию знания о безнадежном прогнозе на социальное взаимодействие больных, их родственников и персонала25. В. Боггз, исследовавший мир латиноамериканского джаза и особенно той его разновидности, которую иногда называют "сальса" (своеобразный синтез латиноамериканского бита и негритянского джаза), смог постепенно перейти от многолетнего увлечения и непосредственной включенности в это музыкальное движение к формулировке социологического проекта, направленного на анализ расовых и классовых аспектов музыки. Однако переход этот был нелегким и потребовал изрядных усилий: не существует легкого способа превращения личного интереса в профессиональную вовлеченность ученого26.
Уже на ранних стадиях исследования - при изучении литературы, анализе доступных документальных источников, ознакомлении с ситуацией "в поле" социолог часто меняет или уточняет исходную формулировку проблемы, некоторые теоретические предпосылки или рабочие понятия. Вполне может оказаться, что проблема в исходной своей формулировке пока - или в принципе - неразрешима, либо в исходных теоретических представлениях содержались существенные пробелы. В этой ситуации нет ничего необычного - ученому часто приходится вспоминать старую истину: задать правильный вопрос труднее, чем найти на него ответ27.
Особое значение неожиданностям, радикальным изменениям точки зрения исследователя и ощущению неадекватного понимания ситуации придает герменевтическая традиция. Не вдаваясь здесь в обсуждение сложных философских вопросов, мы лишь кратко опишем, как трактуется в этой традиции собственно "этнографическое понимание"28. Здесь особое значение придается тому обстоятельству, что социолог или культурный антрополог по сути сталкивается с чуждым, иным жизненным миром. (Даже если это мир его собственной культурной традиции, ученый стремится сделать его понятным для мира рационального научного знания, как если бы это был чужой мир.) Задача ученого, ведущего включенное наблюдение,- "показать, как социальное действие в одном мире может быть понято (осмыслено) с точки зрения другого мира"29.
Отсюда ясно, что недоумение, неясность, несоответствие теоретическим ожиданиям, иными словами, разрывы и "неисправности" в знании и взаимопонимании и являются исходным материалом для ученого. Задача этнографического понимания - обнаружить и зафиксировать разрыв, чтобы в дальнейшем дать объяснение, этот разрыв исключающее. Как только объяснение "странному обычаю" получено, разрыв перестанет восприниматься как таковой. И ученый, и читатели, к которым первый адресует свое изложение открывшегося ему смысла действия, перестанут воспринимать обычай как "странный", т. е., например, не будут больше расценивать как необычное то обстоятельство, что цыганки не гадают друг другу, что отец в традиционной кавказской семье никогда не берет ребенка на руки (хотя, по всей видимости, любит его) или что профессиональные ученые часто придают большее значение публикации результатов, чем собственно их получению.
Однако движение от разрыва и недоумения к пониманию - это не только коррекция исходной формулировки теоретической проблемы. Конечным результатом этнографического понимания является слияние двух или более культурных традиций - этнографа, изучаемого им сообщества, аудитории30. Наблюдатель становится посредником между различными социальными мирами, расширяющим горизонты культурных традиций и способствующим их коммуникации31.
Социолог в такой трактовке самым очевидным образом оказывается в одной из главных своих профессиональных ролей - посредника между социальными сообществами и культурами32.
Возвращаясь к обсуждению выбора теоретической проблемы и предмета включенного наблюдения, заметим, что описанные различия между группами, культурами и системами значений делают особенно важной проблему сравнения, т. е. выбора групп, ситуаций, условий для проведения этнографического исследования.
Какие "случаи" считать релевантными, значимыми, существенными для данной исследовательской проблемы? Прежде чем ответить на эти вопросы, отметим, что включенное наблюдение можно рассматривать как некую разновидность (возможно, самую распространенную) метода монографического "анализа случая" (case-study). Под последним принято понимать детальное, целостное описание индивидуального случая, включенного в более широкий социальный и культурный контекст. В качестве "случая" может рассматриваться культура, сообщество, субкультура, организация, социальная группа, а также такие явления, как верования, практики, формы взаимодействия, иными словами,- почти все аспекты человеческого существования33. Анализ случая может включать в себя интервьюирование, включенное наблюдение, анализ личных документов, литературных источников. Весь этот широкий круг методов объединяет идея максимально полного описания критически важного для прояснения данной исследовательской проблемы случая (или) нескольких случаев. В отличие от массовых опросов, ориентированных на сбор данных о больших популяциях, методология анализа случая не придает большого значения статистической репрезентативности полученных данных. Возможность обобщения и переноса выводов исследования в более широкий контекст здесь обосновывается через "типичность" случая, через возможность теоретического объяснения выбора данного объекта, места и времени его изучения.
Критики методологии "анализа случая" и соответственно включенного наблюдения часто (и справедливо) подчеркивают возможность систематических смещений и необоснованных обобщений, выводимых из исследования единичного явления. Особую остроту, таким образом, приобретает проблема отбора - случаев, ситуаций, групп - и обоснования переносимости результатов включенного наблюдения в более широкий контекст.
Самой успешной попыткой справиться с проблемой отбора в этнографическом методе стала последовательная разработка понятия теоретической выборки, впервые предпринятая Б. Глезером и А. Стрессом (1967)34. Выбор исследуемого явления здесь обосновывается через логику проверяемой теории, определяющей, какие особенности данного явления (случая, группы и т. п.) существенны с точки зрения содержательных, теоретических соображений. Хотя основанный на включенном наблюдении анализ случая обычно не подразумевает использования статистических процедур репрезентативного отбора, эти процедуры могут использоваться для селекции наблюдений "внутри" данного случая, построения сравнительных групп и т. п.
Чтобы проиллюстрировать эти несколько абстрактные соображения, обратимся к уже упоминавшемуся исследованию социальных контекстов умирания, проведенному Глезером и Стрессом35.
Исследование Глезера и Стросса проводилось в шести больницах, расположенных в прибрежном районе Сан-Франциско. В самой общей форме исследовательская проблема была следующей: какого рода события происходят вокруг пациентов, умирающих в американских больницах? На предварительной стадии исследования эта общая проблема сузилась до нескольких вопросов: "Каковы устойчивые типы взаимодействия между умирающим пациентом и персоналом больницы? Какого рода тактики использует медицинский персонал в отношении пациента? В каких организационных условиях внутри больницы эти типы взаимодействия и тактики имеют место и как они влияют на пациента, его семью, медиков, больницу как целое, всех тех, кто вовлечен в ситуацию, окружающую процесс смерти?"36. В поиске ответов на эти вопросы, исследователи пришли к формулировке следующей теоретической гипотезы: все происходящее может быть объяснено тем, как и в какой мере осознается судьба пациента каждой из взаимодействующих сторон в ситуации умирания. Можно сформулировать эту гипотезу еще проще: важно "кто-в ситуации умирания - что знает о вероятности фатального исхода для умирающего пациента"37. Ключевой теоретической переменной в исследовании Глезера и Стросса стало, таким образом, понятие контекста осознания (или "контекста знания") о приближающейся смерти.
Чтобы сделать яснее теоретическую логику этого подхода, заметим, что он основан на интерпретативной, интеракционистской традиции социологического мышления. Напомним, что с точки зрения этой традиции за любым социальным взаимодействием стоит постоянное осознание и осмысление людьми их повседневной жизни. Люди не просто пытаются осмыслить и осознать причины и последствия поступков и событий, они взаимодействуют и совершают поступки, основываясь на тех смыслах, которые они приписывают событиям повседневной жизни38.
Верно или неверно люди определяют ситуацию и толкуют события и намерения других людей, - что во многих случаях в принципе не поддается оценке, - они реально руководствуются своими мнениями и убеждениями в своих поступках. Если воспользоваться общеизвестной формулировкой: если люди определяют ситуацию как реальную, она реальна по своим последствиям39.
Глезер и Стросс, основываясь на своих представлениях о возможных "контекстах осознания" приближающейся смерти, осуществили теоретическую выборку мест, условий и ситуаций внутри больницы, относительно которых можно было предположить, что они представляют все типичные "контексты осознания" смерти и все типы взаимодействия, происходящие в этих контекстах. Например: "Когда пациента доставляют в больницу в необратимой коме и ставят диагноз неизбежной смерти, никто не предполагает, что пациент может когда-нибудь узнать о своем диагнозе. Не исключена возможность того, что врачи и медсестры могут по-разному определить статус пациента, но такое расхождение маловероятно. С другой стороны, когда пациент поступает в сознательном состоянии, и нельзя с полной определенностью сказать, умирает ли он, то, конечно, его собственное определение (ситуации) может резко расходится с определением, даваемым медиками, которые, в свою очередь, тоже могут разойтись во мнениях. То, что каждый из участников взаимодействия знает о том, как было определено состояние пациента, наряду с признанием каждым участником того, что другие участники знают о его собственном определении ситуации,- всю картину, как ее увидел бы социолог, - мы будем называть контекстом осознания. Это тот контекст, внутри которого люди взаимодействуют, в то же самое время осознавая его"40.
Соответственно исследователи осуществили отбор мест и условий наблюдения - от реанимационной палаты и онкологического отделения, где смерть является частым и в разной степени осознаваемым событием, до акушерского отделения, где неизбежность летального исхода обычно оказывается драматической неожиданностью не только для пациента и его близких, но и для медицинского персонала.
Еще раз повторим, что целью отбора (теоретической выборки) субъектов, групп, места, условий и времени наблюдения было нахождение всех теоретически сконструированных возможных значений главной объяснительной переменной - "контекста осознания". Возможные значения этой переменной (типы "контекстов осознания") были получены в результате комбинирования знания/незнания о состоянии пациента для каждой из сторон (медперсонал, пациент, родные) и учета возможного "притворства" - стремления скрыть от другой стороны свое осознание того, как эта другая сторона определяет ситуацию. Например, онкологический пациент может знать о том, что врачи считают его инкурабельным, однако вести себя так, чтобы не позволить врачам явным образом определить сложившуюся ситуацию; еще очевиднее случай, когда врач манипулирует "закрытым контекстом осознания" и скрывает от подозревающего правду пациента не только то, что "ничего больше нельзя сделать", но и свое осознание наличия подозрений у пациента. Построение такой своеобразной теоретической выборки помогло Глезеру и Строссу не только отобрать случаи и условия наблюдения, но и провести анализ полученных таким образом "сравнительных групп"41.
Идея теоретической выборки - или, выражаясь точнее, теоретического отбора,- относится, как мы увидели на примере работы Глезера и Стросса, не только к отбору случаев для изучения, но и к отбору внутри случаев, т. е. к отбору времени, места и людей для наблюдения. В приведенном нами примере отбор места для полевой работы - это отбор палат, отделений и служб внутри медицинской организации. Отбор времени для наблюдения также предполагает введение каких-то разумных ограничений: исследователь не может быть круглосуточным наблюдателем "в поле", даже если он все время находится там. (Впрочем, М. Агар вспоминает о своем опыте полевой работы: "После нескольких месяцев, проведенных в Индии, я как-то сидел в своей хижине, читая книгу при свете фонарика и расслабленно прислушиваясь к невнятным шумам сумерек в "танде". Внезапно дверь отворилась, и я услышал, - если перевести это очень приближенно, - следующее: "Где твоя записная книжка? У нас здесь как раз происходит важная церемония. Что случилось, ты не работаешь нынче вечером?""42). Такие разумные ограничения обычно также связаны с содержательт ными представлениями о том, что и в каком порядке обычно происходит в наблюдаемом сообществе, какие временные рутины и расписания определяют последовательность значимых и незначимых событий. Социолог, наблюдающий школьный класс и взаимоотношения детей во время уроков, по всей вероятности, будет вести свои наблюдения в дообеденное время; если же он изучает, скажем, изменения стилей управления в производственном подразделении, он постарается понаблюдать попеременно и за утренними, и за вечерними сменами. То же относится к большим временным циклам: сезонам, годам, смене поколений. Отбор людей - это обычно отбор интервьюируемых или информантов. Мы вернемся к этой теме, ограничившись пока замечанием, что и здесь определяющую роль играет теоретический контекст исследования. Существенными параметрами отбора могут быть такие категории, как пол, возраст, ранг в групповой иерархии, уровень осведомленности и т. п. Принято различать "исследовательскую категоризацию", конструируемую наблюдателем на основании признаков, существенных для принятой им теоретической перспективы, и "членскую категоризацию", т. е. ту классификацию, которую сами члены группы считают существенной в повседневной жизни43. Однако польза этого различения относительна: если считать, что преимуществом этнографического метода действительно является гарантируемая им особая близость точки зрения исследователя тому, что сами члены группы считают существенным и определяющим в своей жизни, исследовательская и членская категоризации не должны резко противостоять друг другу (не считая возможных терминологических и лексических расхождений).
Иногда говорят об отборе контекстов наблюдения. Контекст в данном случае представляет собой несколько абстрактное понятие, включающее в себя не только время, место и общую структуру взаимодействия, но и некую - обычно неявную - совокупность норм (нормативную структуру), регулирующих поведение людей в данных обстоятельствах места и времени. В этом смысле можно говорить о различных контекстах наблюдения во время рабочего совещания или в ходе неформального празднования какого-то события внутри одной и той же организации, или, скажем, о различии контекста семейного взаимодействия в присутствии гостей и на кухне. В еще более обобщенной форме различие контекстов социального взаимодействия может быть описано с помощью введенного И. Гоффманом противопоставления сценических и закулисных областей44. Именно "за кулисами" (хотя и не обязательно на кухне в физическом смысле) супруги выясняют отношения, не руководствуясь более нормативной структурой публичного поведения, и там же - не обязательно в географически определенном месте - выясняется, скажем, ранг ученого среди коллег. Разнообразие контекстов, которое следует принимать во внимание, - подчеркнем это еще раз - это разнообразие социально сконструированных45, а не физически заданных мест взаимодействия.
Выбор исследовательской проблемы и ситуации наблюдения - это результат предварительной стадии исследования. Завершение этой стадии ставит социолога перед другой совокупностью теоретических и практических вопросов, связанных с получением доступа в полевую ситуацию и непосредственным вовлечением во взаимоотношения с интересующими его группами.

Вхождение в ситуацию наблюдения, роли наблюдателя,
взаимоотношения "в поле"
Проблема получения доступа к полевым данным, - на первый взгляд, сугубо практическая, - играет ключевую роль в этнографическом методе.
Постольку, поскольку эта проблема может быть разрешена за счет личных психологических и социальных ресурсов и практических стратегий, которыми располагает социолог-наблюдатель, можно говорить о значении здравого смысла и знания повседневной жизни в использовании этнографического метода. С другой стороны, более или менее эффективные попытки включиться в ситуацию наблюдения, в том числе трудности, с которыми социолог сталкивается на этом пути, часто оказывают существенное влияние на теоретическую логику и степень понимания ученым того, что он наблюдает. Некоторые примеры позволяют прояснить эти соображениями.
Один из этих примеров относится не столько к социологии или этнографии, сколько к тому, что часто называют документальной журналистикой. Журналистское расследование ситуации нередко принимает форму включенного наблюдения, и неудивительно, что у истоков использования методов "анализа случая" в американской социологии стояла, помимо культурно-антропологической (этнографической) традиции, так называемая журналистика факта. Наш пример относится к 1960-м годам, когда молодой и честолюбивый журналист Том Вулф предпринял квазиэтнографическое исследование сообщества хиппи, называвших себя "веселыми шалунами". Ядро этой коммуны составляли Кен Кизи (автор знаменитого романа "Кто-то пролетел над гнездом кукушки") и его друзья-хиппи.
Позднее Вулф написал книгу о своем опыте общения с хиппи46. Однако в начале своего исследования Вулф демонстрировал определенную дистанцию по отношению к мало озабоченным благопристойностью, карьерой и "традиционными американскими ценностями" хиппи. Как-то раз он беседовал со своими новыми знакомыми в комнате, где Кизи красил потолок. На безукоризненный белый льняной костюм журналиста упала изрядная капля желтой краски, и, хотя последний вытер пятно, сохраняя невозмутимость истинного джентльмена, он не смог скрыть некоторого раздражения. Кизи философски изрек: "Уж так это устроено, Том. Если ты хочешь войти в это дело, тебе приходится немного в него вляпаться".
Иногда для того, чтобы получить доступ в ситуацию включенного наблюдения, достаточно просто "слоняться поблизости". Эллиот Лайбоу, участвовавший в большом исследовательском проекте по изучению практики воспитания детей в семьях с низким доходом, проводил включенное наблюдение за мужчинами из этих семей, чтобы дополнить данные семейного интервьюирования47. Первый день исследования оказался не очень продуктивным. Хотя Лайбоу и познакомился с одним из зевак, наблюдавших сцену препровождения шумно сопротивлявшейся женщины в полицейский участок, он не выполнил разработанного им заранее плана - приступить к сбору материала для выполнения трех или четырех исследовательских задач со сравнительно четкими границами между ними: "Завтра, - решил я, - я вернусь к моему исходному плану, еще ничего не потеряно. Но завтра никогда не наступило..."48. На следующий день, беседуя с тремя пьянчужками об уходе за щенком, которого один из них держал за пазухой, Лайбоу опять оказался у угловой "точки", торговавшей навынос. В этом угловом магазинчике, ближайшие окрестности которого стали неизбежным стратегическим центром всех его этнографических изысканий, Лайбоу познакомился с хорошо одетым чернокожим молодым человеком Толли Джексоном, ставшим его попечителем, доверенным лицом и другом и открывшим ему доступ в относительно закрытые области своего социального окружения. Книга, написанная Лайбоу на полученном материале, стала одной из ключевых работ по этнографии города.
Другой пример значимости неформального "попечительства" - взаимоотношения Уильяма Ф. Уайта с его ключевым информатором-лидером местной "братвы" Доком, сыгравшие решающую роль в проведенном Уайтом исследовании, упоминавшемся нами ранее49.
Иногда доступ к "попечителям" и ключевым информаторам открывается не в результате каких-то полевых импровизаций, а в ходе использования уже существующих социальных связей - профессиональных, дружеских, родственных и т. п., - а также через использование собственной идентичности исследователя50. Если вернуться к уже анализировавшимся нами примерам, то можно отметить, что Э. Моралес, изучавший "кокаиновую экономику" в Перу, проводил свое исследование в местах, где когда-то родился и рос, что - наряду со знанием местного диалекта и обычаев - обеспечило его проникновение в мир спрятанных в горах кокаиновых лабораторий и тайных троп, по которым местные крестьяне перевозили готовый продукт. Однако даже в этом случае личностная идентичность исследователя всегда недостаточна для того, чтобы получить автоматический доступ ко всем аспектам изучаемой ситуации. В частности, Моралес пишет: "Во время моего приезда в родной городок, весной 1980 года, я решил выполнить совет, данный мне профессором в колледже: "Езжай домой и посмотри, какие изменения произошли в общине". Ни в детстве, ни позднее, в ходе многочисленных приездов домой, я не отваживался выезжать за границы моей родной общины, Лламеллик. В юности я принадлежал к коренной культуре, но как взрослый визитер уже не располагал необходимыми навыками, чтобы понимать очевидное. Хотя я и был местным уроженцем, мое превращение в исследователя этнографии Анд было долгим. Я обнаружил, что очень трудно наблюдать за людьми, культура и общество которых представляют и твои собственные корни, трудно учиться у этих людей. Это оказалось возможным только тогда, когда я включил в свою повседневную жизнь более дисциплинированный подход"51.
Двойственность позиции исследователя, чья личностная идентичность в существенных чертах совпадает с идентичностью тех, кого он изучает, подчеркивает и Б. Майерхоф, проводившая исследование в еврейском доме для престарелых в Калифорнии. С одной стороны, ее собственные еврейские корни и предшествовавший научной карьере некоторый опыт социальной работы с пожилыми людьми облегчали ей доступ "в поле". С другой стороны, эти же факторы создавали определенные трудности в сохранении объективности и в построении роли исследователя, отличной от роли члена изучаемой общности. К тому же, как уже отмечалось, частичное совпадение личностной идентичности исследователя и исследуемых по определению не может быть полным: в случае Майерхоф эта неполнота проявляется в том, что она была молодой, имевшей мужа и детей, сравнительно здоровой и сделавшей довольно успешную научную карьеру американкой во втором поколении. При этом она изучала процесс старения и способы преодоления возрастных проблем среди одиноких стариков, перебравшихся в Америку, спасаясь от нацизма, часто говоривших между собой на идише, воспитанных в иудейской традиции и сохранивших специфическое мировоззрение восточно-европейского "галута"52. Майерхоф так описывает исходную ситуацию: "Я не принимала никаких сознательных решений исследовать свои корни или сделать яснее смысл моего происхождения. Я была одним из нескольких антропологов из университета Южной Калифорнии, вовлеченных в анализ "Этничности и старения". Сначала я планировала .изучать пожилых "чиканос"53, поскольку прежде я уже занималась полевой работой в Мексике. Однако в начале 1970-х в городской Америке этнические группы не очень приветствовали любознательных посторонних, и люди, к которым я обращалась, постоянно спрашивали меня: "Зачем вам работать с нами? Почему бы вам не изучать своих?" Эта идея была для меня новой. Я не была подготовлена к такому проекту. Антропологи обычно исследуют экзотические, отдаленные, дописьменные общества. Но такого рода группы становятся во все большей степени недоступны и часто - негостеприимны. В результате все больше антропологов вынуждены нынче работать у себя дома. Это неизбежно создает проблемы с объективностью и идентификацией, и я предвидела, что тоже получу причитающуюся мне долю этих проблем, работая с людьми, населявшими Центр. Но, возможно, будут и какие-то преимущества..."54.
Проблемы, с которыми столкнулась Майерхоф, были связаны с необходимостью соблюдения баланса между исследовательскими интересами, интересам" тех, кого изучает исследователь, этическими проблемами (зачем, например, изучать людей, нуждающихся в поддержке и участии, вместо того, чтобы просто, помочь им?) и задачей сконструировать свою личностную тождественность собственно исследовательской роли. Однако прежде чем осознать и отчасти решить эти проблемы, исследовательница прошла через ряд довольно драматических событий и изменений: "В начальных фазах моей работы с пожилыми я испытывала острое чувство вины. Оно периодически всплывало наружу, принимая самые разные формы в разное время. Поначалу оно фокусировалось на моей компетентности в решении задачи, за которую я взялась. Достаточно ли я знаю иудаику? Достаточно ли я знаю идиш? Не слишком ли я молода? Не слишком ли я эмоционально вовлечена в ситуацию? Не следует ли мне работать ради благополучия стариков, вместо того чтобы изучать их? И так далее. В ходе разговора с Шмуэлем - очень ученым человеком; ставшим в дальнейшем одним из главных моих информантов, - я призналась, что испытываю страх не разобраться должным образом с теми материалами, которые он мне дает. Было так много вещей, которых я не понимала. Как всегда, он ответил сурово, но справедливо: "Ты не понимаешь. Как ты могла ожидать, что поймешь? Ты спрашиваешь меня обо всех этих вещах, но сама ты ничего не знаешь. Ты не знаешь идиша. Ты не знаешь иврита. Ты не знаешь арамейского. Ты не знаешь ни русского, ни польского. Ты не присмотрелась внимательно ни к какой части того места, где мы живем. Как ты можешь ожидать, что поймешь?" Я согласилась с ним и чувствовала себя чудовищно растерянной... Я подумывала о том, чтобы бросить все. Казалось невыносимым безропотно принимать все те бесчисленные способы использования чувства вины, к которым прибегали обитатели Центра - часто несознательно, намереваясь не причинить вред, а лишь создать у себя ощущение могущества. Но после некоторого времени я приняла как факт, что никого нельзя "сделать" виновным, заставить испытывать чувство вины. Каждый соглашается на это добровольно. Пробуждение вины - это то, что я называю "стратегией интимности", одной из многих, используемых стариками из Центра. Бесполезная по отношению к чужаку, эта стратегия основывается на взаимосвязанности и взаимозависимости. Светлая сторона вины заключается в том, что она выражает чувство ответственности за благополучие другого человека. Когда я осознала это, я стала более отстраненно и даже с благодарностью воспринимать эти свои чувства"55.
В ситуации, когда исследователю требуется доступ в формальную организацию, ключевую роль начинают играть не столько добровольные "спонсоры", сколько обладающие высоким статусом и контролирующие "входы" в эту организацию влиятельные фигуры. Иногда таких лиц называют "стражниками": именно от них зависит удачный исход переговоров о формальном доступе в организацию.
Иногда довольно трудно решить, кто в данной ситуации является "стражником" - например, оперирующий главный врач в больнице может в действительности меньше участвовать в принятии административных решений, чем контролирующая все перемещения персонала, больных и оборудования главная медсестра.
Получение разрешения со стороны "стражников" и поддержки "попечителей" создает лишь минимальные предпосылки доступа к полевым данным. Однако цена, которую "платит" исследователь за получение исходного доступа, - это стремление ключевых фигур оказывать влияние на ход и результаты исследования. Первая возникающая здесь проблема носит скорее этический характер: насколько позволителен прямой обман или манипулирование собственным "имиджем" со стороны исследователя? Как правило, социологи легче идут на обман и полное или частичное сокрытие целей исследования в том случае, когда доступ жестко контролируется, и "стражники" по каким-либо причинам не заинтересованы в том, чтобы открыть посторонним какие-то, обычно скрываемые, сферы. Еще одним оправданием для полного или частичного сокрытия целей исследования в процессе ведения переговоров о доступе может служить уверенность исследователя в том, что на более поздней стадии, когда между социологом и ключевыми фигурами установится межличностное доверие, можно будет обсудить все открыто. В этом случае заверения в соблюдении анонимности и в исключении из публикации потенциально опасных для информантов материалов попадут на более благоприятную почву и будут встречены с большим доверием.
Вообще же, как справедливо замечают М. Хаммерсли и П. Аткинсон: ".. .даже если сообщение "всей правды" в ходе переговоров о доступе - как и в большинстве прочих социальных ситуаций - может оказаться не самой умной и даже не самой окупающей себя стратегией, обмана следует по возможности избегать. И дело здесь не только в сугубо этических причинах, но и в том, что обман может иметь неблагоприятные последствия позднее, в ходе полевой работы"56.
Наблюдатель, успешно включившийся в полевую работу, оказывается в определенный момент в положении "новичка" ("салаги" в армейском жаргоне). Он точно так же располагает статусно-детерминированным правом проявлять невежество, задавать вопросы, обнаруживать некомпетентность в простых, повседневных вещах. Однако социолог, в отличие от традиционного этнографа, редко может использовать до конца все преимущества роли "новичка". Если его профессиональная идентичность известна, его "попечители", информанты и прочие могут успешно навязывать ему роль знатока, эксперта, беспристрастного судьи и т. п.
Еще более важное разграничение исследовательских ролей во включенном наблюдении предложил Р. Гоулд57. Это разграничение основано на степени вовлеченности-отстраненности исследователя в ситуации наблюдения и соответственно на степени закрытости-открытости его собственно этнографической, научной деятельности. В этом случае принято выделять следующие роли:
1) полный участник;
2) участник как наблюдатель;
3) наблюдатель как участник;
4) полный наблюдатель.
В роли "полного участника" цели и статус исследователя остаются тайной для и всех остальных, поэтому эту ситуацию нередко называют ситуацией скрытого наблюдения. Выше мы уже приводили пример исследования Л. Фестингера и его соавторов. В отечественной социологии одним из самых известных примеров скрытого наблюдения является исследование В. Б. Ольшанского58. Этот подход, наряду с очевидными достоинствами, имеет и существенные недостатки: дело здесь не только в неразрешимости некоторых этических проблем, но и в невозможности гарантированного контроля над использованием наблюдателем своих актерских способностей, что, наряду с риском утраты профессиональной идентичности и необходимой исследователю дистанции, может вести к самым неожиданным результатам.
Находящаяся на противоположном полюсе роль "полного наблюдателя" подразумевает полное исключение реакций изучаемых людей на исследователя. Последний, как это бывает в некоторых психологических экспериментах, смотрит на обследуемых через одностороннее зеркало, ведет наблюдение скрытой камерой либо использует иные приемы оперативной разведработы. Как отмечают М. Хаммерсли и П. Аткинсон: "Парадоксальным образом полное наблюдение разделяет многие преимущества и недостатки полного участия. В их пользу говорит то, что оба метода минимизируют проблемы реактивности: ни в одном из случаев этнограф не будет взаимодействовать с теми, кого он изучает, как исследователь. С другой стороны, исследователь может столкнуться с сильными ограничениями на то, что подлежит или не подлежит наблюдению, при том, что расспросить участников будет невозможно. Принятие какой-либо одной из этих ролей может вести к большим сложностям в построении и строгой проверке теории, хотя обе могут оказаться полезными и приемлемыми стратегиями на отдельных стадиях полевой работы, а в некоторых ситуациях эти роли оказываются неизбежными"59.
Чаще же всего наблюдатель принимает роль, находящуюся между описанными крайними позициями. При этом, заметим, ситуация скрытого наблюдения чаще всего ведет к принятию уже существующей в наблюдаемой группе роли - например, рабочего или пациента психиатрической клиники. В случае открытого наблюдения часто - хотя и необязательно - исследователь участвует в конструировании своей роли в процессе явных и неявных переговоров с участниками.
Степень вовлеченности социолога в наблюдаемую ситуацию, играющая ключевую роль в описанной нами типологии ролей, тесно связана с другим противопоставлением: описание с точки зрения наблюдающего "чужака" - описание с точки зрения участвующего в событиях "своего" члена группы. Мы уже затрагивали этот вопрос раньше, отмечая, что чрезмерная включенность в происходящее может не только стимулировать, но и, напротив, сильно ограничивать возможности исследователя. Необходимость постоянно балансировать между доверительными отношениями и возможностью отстранения от происходящего, между "близостью" и "чуждостью", между следованием "туземным" правилам и собственным комфортом делает результаты применения этнографических методов чрезвычайно зависимыми от способности исследователя придерживаться пограничной, сбалансированной и, в сущности, маргинальной позиции. Эта особенность метода включенного наблюдения делает его весьма уязвимым для острой и отчасти обоснованной критики, о чем мы еще будем говорить позднее. Пока же обратимся к примеру.
Классик американской культурной антропологии Маргарет Мид во второй половине 1920-х годов проводила включенное наблюдение процесса взросления на Самоа. Материалы этого исследования стали основой для самой знаменитой и спорной книги Мид60, ставившей целью доказать "сильную" версию культурного детерминизма и идеи "суверенитета культуры" по отношению к биологическим предпосылкам человеческого существования. В этой книге, рассматривавшейся современниками как блестящее эмпирическое подтверждение взглядов учителя М. Мид и основателя американской традиции культурной антропологии - Ф. Боаса, Мид интерпретировала самоанскую культуру как нерепрессивную, несоревновательную, поощряющую скорее кооперацию, чем агрессию. Многие фактические утверждения Мид были позднее оспорены другими исследователями. Особую известность приобрела книга Д. Фримена61, где на материале многолетних наблюдений опровергаются ключевые положения М. Мид и детально реконструируется исторический фон написания ее труда. Фримен полагает, что основной причиной неточностей и прямых ошибок в интерпретации самоанской культуры, предложенной М. Мид, была предвзятая и жесткая теоретическая схема. Немалую роль, однако, сыграла и социальная и психологическая неискушенность двадцатитрехлетней аспирантки, неопределенность ее исследовательской роли. В частности, Мид, получившая изначально хорошие шансы доступа в поле (она была даже наделена почетным статусом "церемониальной девственницы", taupou), не решилась жить в самоанской хижине с туземной семьей и испросила у Боаса разрешения поселиться в единственной белой семье на острове (мотивируя это возможным снижением продуктивности исследовательской работы в результате непривычной диеты)62.
Приведенный пример еще не доказывает, что сохранение дистанции между социологом и теми, кого он наблюдает, заведомо хуже, чем полное участие. В действительности, как мы уже отмечали, полная включенность подразумевает принятие исследователем всех нормативных ограничений, которым следуют настоящие участники. Например, социолог, поступивший на военную службу для того, чтобы узнать, как новобранцы приспосабливаются к новой социальной роли, будет всегда оставаться "по одну сторону занавеса": сложившаяся рутина военной службы не подразумевает проявления особой любознательности со стороны рядового и таким образом он не может исследовать, как офицеры и старшины принимают решения, общаются между собой, определяют правила и нормы и т. п.
Иными словами, социологу, оказавшемуся в реальном полевом контексте, приходится использовать самые разные роли в поисках компромисса между объективностью, профессиональной автономией, эмпатической вовлеченностью и интеллектуальной честностью. Достигнуть такого компромисса удается далеко не всегда.

Процесс анализа и описания результатов
В результате включенного наблюдения, интервьюирования, неформализованных бесед с информаторами социолог получает изрядное количество данных, которые следует каким-то образом организовать, описать и проанализировать. Было бы ошибкой полагать, что анализ и описание в этнографии - это искусство загонять "сырые" факты в упорядоченные аналитические категории. Скорее речь идет об искусстве создавать некий мета-текст, интерпретирующий тексты интервью и наблюдений. Это искусство ничуть не менее важно, чем умение добывать сведения в полевых условиях, завоевывать доверие, интервьюировать и т. п.
Более того, именно в процессе анализа данных и написания отчета или статьи результаты этнографического исследования приобретают общезначимость и валидность, т. е. становятся чем-то большим, чем совокупность "здесь-и-сейчас" сделанных наблюдений. Эксперименты, массовые опросы - благодаря статистическому методу - позволяют получать результаты, которые уже являются некоторыми эмпирическими обобщениями, тогда как уникальность записей бесед и других данных, полученных в ходе наблюдения, очевидна. Возможность их дальнейшего использования прямо зависит от наличия теоретической категоризации, интерпретации и т. п.
Известный культурный антрополог К. Гирц пишет: "Способность убедить читателей (большинство из которых - это люди науки и практически все участвуют хотя бы на полставки в той особой форме существования, которую мы уклончиво называем "современной") в том, что читаемый ими текст - это подлинное объяснение, данное кем-то, знающим как устроена жизнь в некотором месте, в некоторое время, в какой-то группе, - это фундамент, на котором в действительности держится все остальное, чем стремится заниматься этнография - анализировать, объяснять, развлекать, смущать, прославлять, наставлять, оправдывать, удивлять, ниспровергать"63.
Анализу и описанию данных обычно предшествует их фиксация. Практически невозможно записать все данные, полученные в ходе полевой работы. Помимо возникающих здесь сугубо технических проблем, неизбежно существуют ограничения на способность исследователя осознать и словесно оформить свои "смутные впечатления", неявные догадки и подсознательные озарения. Однако существование таких ограничений не избавляет нас от необходимости максимально полно фиксировать и описывать все данные, на основании которых мы делаем определенные теоретические утверждения.
Нередко в ходе включенного наблюдения социологи используют видео- и аудио-технику, все большую популярность приобретает метод фотодокументального исследования64. Но основным источником эмпирического материала по-прежнему остаются полевые заметки. Их полнота и качество решающим образом зависят от использования некоторой заранее разработанной системы организации полевых заметок (записей). Важность использования такой заранее разработанной системы фиксации наблюдений усиливается тем обстоятельством, что при использовании этнографических методов исследования ученый, как правило, располагает значительно большими возможностями для "корректировки" полученных данных - с целью увеличения степени их соответствия теоретическим положениям,- чем при использовании более "жестких" методов.
Первая проблема организации данных - это проблема отбора. Если на предварительной стадии исследования ученый решает, что, где, когда и как наблюдать, то на полевой стадии ему нужно определить, что записывать, как записывать и когда записывать.
Методом записи чаще всего бывает письменный отчет, хотя во многих ситуациях предварительная запись осуществляется с помощью диктофона. Иногда используют также видеозапись и фотосъемку.
Не так просто принять решение о том, когда делать записи. Конечно, немедленная фиксация всех наблюдений предпочтительнее всего. На практике, однако, даже в случае открытого принятия исследовательской роли ("наблюдатель-как-участник" либо "полный наблюдатель") социолог не решается использовать метод прямой фиксации наблюдений, чтобы не нарушить естественный ход событий и не подорвать доверие к себе со стороны участников. Человек, который постоянно что-то записывает, действует на нервы окружающим, даже если он получил предварительное согласие с их стороны. Таким образом, большая часть полевых заметок, которые наблюдатель делает на месте, носит очень сжатый и фрагментарный характер и служит, по сути, лишь неким каркасом для описания беседы или ситуации, делаемого исследователем позднее "по памяти". Желательно, чтобы, воссоздавая по памяти некоторую сцену или разговор, ученый не только стремился к максимальной полноте и достоверности, но и использовал специальные отметки, указывающие, в частности, на пропуск некоторых слов или событий в записи, либо на то, что какая-то часть описания воссоздана с чьих-то слов, а не фиксирует его личные наблюдения. Полученные записи могут быть более или менее детализированными, но почти никогда не бывают дословными. Как правило, степень детализации и точности обратно пропорциональна охвату, широте воссоздаваемой картины событий.
Очень важной проблемой является сохранение "естественного словаря" участников. Эта проблема тем острее, чем больше разница между жизненными мирами самого исследователя и тех, кого он изучает. Реальный, ситуативно-привязанный язык, используемый участниками взаимодействия, позволяет узнать, как члены данной группы или данной культуры категоризуют, описывают и воспринимают события повседневной жизни. Определяя социальную реальность, люди "конструируют" ее: используемые классификации, "ярлыки" и способы означивания задают смысловые горизонты действия для членов данной социальной группы или культуры. Ведя полевые записи, исследователь нередко "подчищает", исправляет или дополняет реплики участников. Это происходит даже в случае расшифровки фонограммы, сделанной с помощью диктофона. По сути, такая первичная интерпретация сказанного не только неизбежна, но и полезна, так как именно пояснения и дополнения, внесенные исследователем, делают более понятными контекст и эмоциональную тональность происходившего. Важно, однако, организовать записи таким образом, чтобы исходный текст и более поздние комментарии можно было различить.
При ведении полевых заметок важную роль играет также фиксация невербального поведения. Мимика, позы, жесты часто обнажают коммуникативные намерения участников взаимодействия даже лучше, чем слова. Во многих культурах значимым и подлежащим интерпретации является пространственное расположение участников взаимодействия. Речь здесь идет не только о том, что, скажем, для большинства традиционных культур порядок расположения гостей за столом отражает социальный статус последних. Пространственная организация взаимодействия встроена во многие институты и культурные коды современных обществ: достаточно упомянуть, например, школьный класс, университетскую аудиторию или приемную высокопоставленного чиновника, - где секретарь обычно организует разметку открытых, полуоткрытых и конфиденциальных зон с помощью журнала записи посетителей, табличек, стульев, цветочных горшков и реплик типа "Туда нельзя!", - чтобы увидеть, как много существенных вещей в повседневной жизни "говорится" без помощи слов и жестов.
Отметим, что многие современные компьютерные программы, предназначенные для организации и первичного анализа качественных данных ("Ethnograph", "Ethno" и др.), позволяют вести дневник полевых наблюдений, в котором прямые цитаты отделены от сделанных исследователем описаний, аналитических ремарок и проясняющих дополнений. В этом случае при обращении к полевым данным реже возникают вопросы: "Кто из присутствовавших это сказал?" или "Действительно ли она явно признала это?"
Обычно исследователи фиксируют слова и действия таким образом, чтобы не оставалось никаких сомнений относительно того, где разворачивались события, в какое время, кто и при каких обстоятельствах в них участвовал?65. Своего рода контрольный лист для фиксации полевых наблюдений был предложен Дж. Спрэдли. Он включает девять ключевых признаков - "маркеров", фиксация которых дает возможность достаточно полно описать контекст происходящего66:
1) пространство: физическое местоположение или местоположения;
2) актор (деятель): люди, участвующие в происходящем;
3) деятельность: совокупность взаимосвязанных действий, совершаемых людьми;
4) объект: наличествующие физические предметы;
5) акт: отдельные действия, совершаемые людьми;
6) событие: множество взаимосвязанных деятельностей, ведущихся людьми;
7) время: временное упорядочивание происходящего;
8) цель: то, чего люди стремятся достичь;
9) чувства: ощущаемые и выражаемые эмоции.
Записывая или воссоздавая по памяти полевые наблюдения, исследователь нередко придумывает и тут же теряет гениальные гипотезы, объяснения и догадки. Поэтому ведение полевых записей требует отчетливой фиксации и выделения - по меньшей мере графического - не только реплик участников и сделанных наблюдателем описаний, но и аналитических примечаний. Аналитические примечания могут выделяться скобками либо выноситься на поля в качестве маргиналий.
Так как исследователь должен стремиться к сохранению и "сырых" данных полевого наблюдения, и аналитических примечаний, и смысловых категорий, использованных им при первичной фиксации и сортировке материала, возникает необходимость поиска компромисса между эпизодической и семантической организацией полевых данных. В первом случае доступ к полевым заметкам обеспечивается через указание места и времени наблюдения, тогда как сами первичные описания остаются "нетронутыми" и неклассифицированными. Во втором случае поиск нужных материалов в дальнейшем осуществляется через созданную исследователем систему смысловых категорий. Все эти категории становятся элементарными единицами аналитического указателя. Скажем, обратившись к аналитическому указателю социолог может найти все случаи (а при более дробной категоризации - даже отдельные реплики), относящиеся, например, к теме "Стратегии обмена комплиментами в женском коллективе". Каждое из найденных таким способом "сырых" описаний содержит какой-то материал, касающийся отношений обмена комплиментами между женщинами. При последующем анализе каждая категория может быть разбита на некоторое количество более дробных субкатегорий посредством введения дополнительных "измерений", т. е. дополнительных оснований для классификации67. Скажем, стратегии обмена комплиментами могут быть эквивалентными (т. е. рассчитанными на ответный комплимент или сходное вознаграждение) либо неэквивалентными и основанными на отношениях доминирования и зависимости. Обмен комплиментами может быть детерминирован стандартной социальной ситуацией или наоборот - спровоцирован нормативной неопределенностью и неясностью намерений и ожиданий другой участницы и т. д.
В принципе следует стремиться к максимальному числу первичных категорий. Даже самые странные и необычные способы категоризации могут оказаться неожиданно продуктивными при более глубоком анализе. Наименования категорий могут изобретаться исследователем, заимствоваться из специальной литературы или иметь своим источником ту систему обозначений, которую используют сами информанты.
Если исследователь предпочел использование аналитического указателя, он помечает каждую полевую запись словами или значками, позволяющими определить, какие из категорий имеют отношение к данному событию, наблюдению, разговору.
Другой способ заключается в физической сортировке первичных записей по разным аналитическим категориям. В последнем случае каждая полевая запись может быть неоднократно скопирована, разрезана на более мелкие фрагменты, включена в разные разделы отчета и т. п. Иными словами, физическая сортировка требует почти неограниченных возможностей копирования. Наилучшим выходом является использование уже упоминавшихся компьютерных программ анализа текстовых этнографических данных, позволяющих производить комментирование, сортировку и фрагментирование без использования клея и ножниц, да и безо всякого ущерба для "сырых" данных.
Собственно анализ данных этнографического исследования часто неотделим от фиксации результатов и их описания. В отличие от эксперимента или опроса включенное наблюдение редко предваряется явной формулировкой гипотез, признаков, типологий. Последние возникают и уточняются и на стадии полевого наблюдения, и на стадии описания результатов.
В качестве примера мы можем обратиться к одному из подходов в анализе социальной интерпретации - анализу разговора (conversation analysis). Этот подход вырос из этнометодологической традиции, придающей центральное значение тому, как повседневное общение между людьми организует и определяет социальную реальность. В анализе разговора очень большое значение придается точной и детальной фиксации коммуникативного поведения. Для того, чтобы выводы одного аналитика могли быть проверены другими, используется тщательно разработанная методика записи высказываний, включающая в первую очередь сложную систему обозначений. В частности, используются следующие знаки68:
1) одновременно подаваемые реплики - двойная либо одинарная левая квадратная скобка ([[). Например,

Андрей: И меня удивляет ее упрямство...
Ольга: Она делает вид, что не слышит меня;

2) высказывания, частично накладывающиеся друг на друга, - начало отмечается левой квадратной скобкой, конец взаимонакладывающихся реплик отмечается правой квадратной скобкой. Пример:

С.: Я привыкла рассчитывать только [на себя] и дома, и на работе.
К.: [Ум-м-гу...];

3) если реплики участников следуют друг за другом непрерывно - но не накладываясь друг на друга, - их связывают в записи знаком равенства:

К.Л.: Я подожду, пока прозвенит звонок =
Учительница: = Только не стойте у двери.

Знак равенства используется также при продолжении записи высказывания на следующей строке либо при соединении непрерывного речевого потока, перебитого репликой другого участника:

Том: Я раньше курил больше =
Боб: Ты раньше курил Том
Том: = Но я никогда не затягивался;

4) паузы, возникающие в ходе разговора, измеряются в секундах и десятых долях секунд и отмечаются в круглых скобках внутри высказывания одного участника или между высказываниями. Например:

Ольга: Со стороны можно было
= подумать (0,7), что они незнакомы (1,2)
Алла: Так ты была там;

5) знаки пунктуации обычно используются не столько для разделения синтаксических единиц, сколько для характеристики интонационно-мелодического рисунка речи. В частности:
• двоеточие (:) характеризует удлинение звука или слога, после которого оно стоит;
• точка (.) отмечает завершающее понижение тона, не всегда совпадающее с окончанием предложения;
• запятая (,) указывает на продолжающую, "соединяющую" интонацию (необязательно между подчиненными и сочиненными частями сложного предложения);
• вопросительный знак (?) характеризует восходящую интонацию, в том числе и вопросительную;
• восклицательный знак (!) обозначает эмоционально насыщенный тон, необязательно собственно восклицание;
• тире (-) указывает на разрывы, запинки, внезапные обрывы и т. п.
Для обозначения восходящей и нисходящей интонаций используются направленные вверх либо вниз стрелки (??), смысловое ударение передается подчеркиванием, громко произнесенные слова выделяются прописными буквами.
Отчетливо слышимые вдохи и выдохи также фиксируются (ххху' - выдох, 'уххх - вдох):
Алла: 'уххх О! спасибо !
Неанализируемые внеречевые звуки заключаются в двойные круглые скобки: ((чихает)).
Одинарными скобками отмечают сомнительные места в транскрипции, в том числе альтернативные версии расшифровки.
Иногда используют также обозначения направления взгляда (подчеркивание над строкой говорит о том, что взгляд говорящего направлен на слушающего, под строкой - взгляд слушающего направлен на говорящего). Аплодисменты обозначают последовательностью латинских букв "X": строчные указывают на умеренные аплодисменты, прописные-на громкие. Их длительность также может быть указана в круглых скобках.
Знакомство с этой системой обозначений необходимо нам для того, чтобы проиллюстрировать ранее высказанное положение: теоретические представления, используемые при анализе данных качественного исследования, не только определяют процесс фиксации данных и их истолкование, но и "производятся", явно или неявно оформляются в этом процессе. Так, этнометодологический анализ разговора направлен на выявление тех методов, которые обычные люди (люди-с-улицы) систематически используют для организации и совместного упорядочения своего общения. Эти методы, с точки зрения этнометодологов, не просто могут быть описаны формально с какой-то внешней точки зрения. Они сами представляют собой множество формальных процедур, устойчиво используемых обычными людьми для достижения взаимопонимания и создания возможности для взаимодействия69. Существуют, в частности, устойчивые способы (методы) для взаимного согласования предмета беседы, для гарантированного получения ответа, способы неявного выражения несогласия через смену предмета обсуждения, способы провоцирования аплодисментов при публичном выступлении и т. п. Вот, например, некоторые образцы данных, используемых для анализа "устройств" и техник для постепенного выхода из разговора о неприятностях70. Помимо резкого прекращения беседы как радикального средства выхода из неприятного или неловкого разговора люди часто используют менее радикальные средства. Например, переход к завершающим фразам нередко позволяет не только постепенно уйти от неприятной темы, но может служить и для подкрепления ранее достигнутых соглашений, и для отсылок к будущей совместной деятельности:

1. "П.: 'уххх Но я надеюсь это само сгладится,
2. M.: Я почти уверена в этом
3. П.: Увидимся во вторник?"71


1. "Дж.: Так что: м-м-все будет хорошо и- =
2. П.: = Хорош о
3. Дж.: М:ожет'ухх может если в =
4. = следующий выходной Вы с Фредди зайдете"72.

Иной прием - это "перезапуск разговора", когда разговор каким-то образом начинается заново, либо происходит переключение на новую тему:

1. "Дж.: Да, не очень Хорошо. ( ) -
2. М.: 'ухх Не очень.
3. Дж.: Нет::.
4. М.: 'ухх Так что ты поделывал на прошлой =
5. = неделе?"73

Наш пример показывает, что для иллюстрации некоторых теоретических представлений в анализе разговора используются лишь определенные "куски" данных, отпрепарированные в согласии с некими правилами. Этнометодолог, стремящийся доказать, что существуют устойчивые методы выхода из неприятного разговора, в действительности сам использует такие способы фиксации и анализа данных, которые предполагают и привносят искомую характеристику в его данные. Он игнорирует какие-то обстоятельства контекста (скажем, присутствие наблюдателя), осуществляет скорее произвольную временную разметку (как "обычные люди" мы знаем, что к прежнему разговору можно вернуться и на следующий день, и через год), не производит систематических сравнений между разными фрагментами разных разговоров о разных неприятностях. Эмпирический материал, с которым он имеет дело, безусловно обнаруживает некую упорядоченность. Однако эта упорядоченность не существует сама по себе, как некий "факт".
Важный вывод, следующий отсюда, таков: данные естественного наблюдения, результаты использования этнографического метода не следует считать "более естественными", натуральными, чем данные, получаемые в эксперименте или опросе. Они в той же мере подвержены влиянию теоретических (и не только теоретических) представлений социолога. Столь же сильно зависит от теоретических убеждений и истолкование "фактов" в ходе анализа. Применительно к культурной антропологии эта мысль точно формулируется Н. Томасом: "Нельзя предполагать, что существует какая-то определенная вещь типа "человеческой культуры", содержащая головоломки, которые попросту составлялись различными антропологическими школами по-разному. Та вещь, о которой идет речь, и те виды головоломок, которые имеют значение, производятся и производились интеллектуальными и политическими интересами. Вновь возникающая совокупность интересов будет переопределять объект и устранять некоторые старые головоломки. От споров чаще отказываются, чем разрешают их. Те же, кто затевают пересмотры или более радикальные концептуальные изменения, предположительно верят, что это приведет к более правильным объяснениям либо истолкованиям - в зависимости от их интересов,- ведущим к более совершенной науке или к более совершенному пониманию, если их субъективные предубеждения являются соответственно позитивистскими или релятивистскими"74.
Возможности теоретического анализа в этнографическом исследовании определяются двумя крайними подходами:
1) проверка определенных гипотез о причинных связях и влияниях, поиск подтверждения неких априорных представлений о существовании устойчивых закономерностей;
2) поиск интерпретации, стремление понять смысл событий с точки зрения их участников.
Реальная исследовательская практика, как уже говорилось, обычно находится между этими крайними позициями.
Первый из очерченных подходов (иногда называемый "априорным", так как гипотезы и предположения формулируются заранее) ориентирован на максимальное приближение к идеальной модели каузального вывода. Эта идеальная модель причинного вывода, как мы увидим позднее, полнее всего воплощена в эксперименте. Выборочные обследования достигают приближения к экспериментальной модели с помощью принципа рандомизации и статистического вывода.
При использовании данных включенного наблюдения для создания таких условий используют метод аналитической индукции, позволяющий исследователю формулировать обобщения, приложимые ко всем эмпирическим случаям, относящимся к данной теоретической проблеме. Аналитическая индукция предполагает систематические сравнения между группами, подвергавшимися и не подвергавшимися воздействию интересующих исследователя причинных факторов. У. Робинсон описал последовательность процедур, необходимых для осуществления аналитической индукции75:
"1. Формулировка приблизительного определения того явления, которое надлежит объяснить.
2. Формулировка гипотетического объяснения этого явления.
3. Изучение одного конкретного случая с целью проверки соответствия гипотезы фактам.
4. Если гипотеза для данного случая не соответствует фактам, то следует либо переформулировать гипотезу, либо так переопределить изучаемое явление, чтобы опровергающий случай оказался исключенным из теоретической выборки.
5. Достаточная для практических целей степень подтверждения может быть достигнута в результате проверки небольшого числа случаев, однако обнаружение негативных (опровергающих гипотезу) случаев доказывает ошибочность данного объяснения и требует его переформулировки.
6. Эта процедура проверки случаев, переопределения изучаемого явления и переформулировки гипотез продолжается до тех пор, пока универсальное отношение не установлено, при том что каждый негативный пример требует дальнейшего переопределения или переформулировки".
Легко видеть, что в обосновании метода аналитической индукции решающую роль играют именно негативные случаи, не подтверждающие исследовательскую гипотезу. А. Линдсмит, одним из первых использовавший этот метод в изучении наркомании, развил эту идею: "Руководящим принципом отбора случаев для проверки теории должна быть максимизация шансов для обнаружения решающего негативного примера. Исследователь, располагающий рабочей гипотезой, которая относится к его данным, начинает осознавать, какие конкретные области критически важны. Если его теория ошибочна или неточна, он знает, что ее слабые места будут выявлены отчетливее и скорее при переходе к исследованию этих критических областей"76.
Исследуя механизмы наркотической зависимости от опиатов, сам Линдсмит поначалу выдвинул гипотезу о том, что эта зависимость формируется как собственно психологическая, и те пациенты, которые не знают о том, что получают наркотикосодержащие препараты, не станут от них зависимы. И наоборот, люди становятся зависимыми, если знают, какие препараты принимали, и принимают их достаточно долго, чтобы ощутить признаки "синдрома отмены" (абстиненции) при лишении их наркотиков77. Однако почти сразу были обнаружены случаи довольно длительного осознанного приема морфиносодержащих препаратов, не приведшие к возникновению зависимости.
Линдсмит уточнил исходную гипотезу, предположив, что для формирования зависимости важно также осознание дискомфорта, связанного с отменой наркотикосодержащих препаратов, как собственно "синдрома отмены". И в этом случае были обнаружены негативные случаи - люди, переживавшие "синдром отмены" вполне осознанно, однако не использовавшие наркотики для снятия физического дискомфорта. В конечном счете Линдсмит пришел к следующему объяснению: 1) зависимость возникает в результате "синдрома отмены", а не в результате физико-химических изменений, вызванных приемом наркотика; 2) условием формирования зависимости является использование наркотикосодержащих препаратов для снятия абстинентного синдрома, причем последний осознается и явно интерпретируется как таковой и связывается с культурными образцами наркозависимого поведения.
В некоторых отношениях метод аналитической индукции дает приемлемое приближение к идеальной модели причинного вывода. Однако систематическая оценка метода аналитической индукции с точки зрения этой модели обнаруживает его существенные недостатки.
Во-первых, предлагаемая методом аналитической индукции стратегия подразумевает, строго говоря, введение все новых объясняющих переменных для каждого негативного наблюдения. Как мы увидим далее при обсуждении логики статистического вывода (гл. 8), такой подход может, конечно, объяснить "свыше 100%" разброса наблюдений, однако он делает бессмысленным само понятие "опровержение". Даже самая нелепая первоначальная гипотеза имеет хорошие шансы уцелеть в результате исследования, если для того, чтобы подогнать ее к уже добытым данным, будет принято как угодно много вспомогательных гипотез - более или менее правдоподобных,- которые, собственно, не были сформулированы в качестве априорных и подлежащих самостоятельной проверке. Так как изначальные предположения могут совершенствоваться и дополняться как угодно долго, исследователь просто не имеет никаких оснований - кроме здравого смысла - после какого-то случая счесть рабочую гипотезу окончательно опровергнутой и принять другую.
Второй из недостатков аналитической индукции связан с первым.
Модель причинной взаимосвязи, полученная в результате исследования, должна содержать в себе некие предсказания относительно того, когда найденное отношение будет выполняться либо не выполняться. Но процедура аналитической индукции, как мы уже видели, не требует явной формулировки такого рода теоретических предсказаний (хотя и не исключает их). Так, в исследовании Линдсмита не проверялись теоретические прогнозы о том, кто станет и кто не станет принимать наркотики, или о том, как "синдром отмены" будет переживаться разными группами пациентов. Поэтому социолог, использующий аналитическую индукцию, должен особое внимание уделить разработке теоретических прогнозов, которые подлежат проверке.
Наконец, третья проблема, возникающая при использовании аналитической индукции, - это преимущественная ориентация на описание качественных механизмов взаимосвязи, создающая, по выражению Н. Дензина, "проблемы, когда изучаемые процессы включают в себя непрерывные переменные, проявляющиеся лишь до какой-то степени"78. Указание на то, какие количественные значения теоретических переменных являются "пороговыми" или "достаточными", чтобы изучаемые отношения наблюдались, обычно отсутствуют.
Включенное наблюдение, как и другие методы социологического исследования, сталкивается с проблемами внешней и внутренней валидности, т. е., как и в случае эксперимента или выборочного обследования, социолог должен каким-то образом определить, могут ли его результаты быть обобщены и перенесены на другие подобные группы (внешняя валидность). Он должен также убедиться в том, что его результаты не являются побочным продуктом самого процесса наблюдения (внутренняя валидность), т. е. следует учесть возможные источники смещений, детально обсуждаемые в последующих главах: историческое развитие, "созревание" респондентов в ходе исследования, реактивные эффекты и т. п. (Здесь в значительной мере применимы те подходы к валидации, о которых говорится в главах 4 и 6.)
Выше мы упомянули другой, интерпретативный, подход к теоретическому анализу результатов включенного наблюдения. Этот подход ориентирует исследователя на поиск смысла социального поведения с точки зрения самих деятелей, на создание наблюдателем теории, отражающей собственные "теории" наблюдаемых. Если воспользоваться формулировкой К. Гирца, целью здесь является "не экспериментальная наука, ищущая закон, а интерпретативная наука, нацеленная на поиск смысла"79. Обсуждая подходы к определению теоретической проблемы включенного наблюдения, мы уже говорили о том, какой смысл здесь придается этнографическому пониманию. Теперь нам достаточно будет рассмотреть, каким способом понимание смысла человеческого действия может достигаться в ходе теоретического анализа результатов включенного наблюдения.
Отказ от абстрактных, формальных теорий не означает отказа от теоретических понятий и перехода к прямой фиксации обыденного опыта. Интерпретация осмысленных социальных действий также не требует от исследователя какой-то сверхъестественной способности сопереживания и "вчувствования" в чужой опыт. Смыслы и нормы социального действия по своей сути интерсубъективны, т. е. не могут быть сведены к неповторимым индивидуальным состояниям, переживаниям или мнениям. Они изначально ориентированы на возможность понимания, коммуникации и сотрудничества и неотделимы от языка, используемого для их описания. Исследователь имеет дело с совокупностью значений и символов, используемых людьми для самоописания и самоанализа своих поступков, и обладает возможностью их понимания, поскольку сам постоянно включен в этот процесс производства смыслов. Выбирая из нескольких возможных интерпретаций верную, он анализирует наблюдаемую социальную практику приблизительно так же, как комментатор анализирует текст. Альтернативных интерпретаций текста много, но не бесконечно много. Последнее верно и для социальной практики, и для социальных институтов, порождаемых этой практикой и ее воплощающих. Они открыты для понимания, поскольку с самого начала нацелены на понимание, ориентированы на других людей.
Если представить данное исследователем описание символической формы и смысла каких-то событий как "внешнее" описание, а то описание своего видения ситуации, которое дают участники, как "внутреннее", возникает вопрос о соотношении теоретических и обыденных понятий, используемых в этих двух типах описания. Для решения этого вопроса сторонники интерпретативного подхода обычно используют разграничение "отдаленных-от-опыта" и "близких-к-опыту" понятий.
"Близкими-к-опыту", в формулировке К. Гирца, можно назвать те понятия, которые сам исследуемый (субъект, информант) мог бы "естественно и без специальных усилий использовать для определения того, что он сам или его ближние видят, чувствуют, думают, представляют себе и т. п., и которые он мог бы без труда понимать, когда эти понятия сходным образом применяются другими"80. "Отдаленными-от-опыта" являются те понятия, которые "разного рода специалисты - психоаналитик, экспериментатор, этнограф, и даже священник либо идеолог, - используют в достижении своих научных, философских или практических целей. "Любовь" - это близкое-к-опыту понятие; "фиксированность либидо на определенном объекте" - отдаленное-от-опыта. "Социальная стратификация" и, возможно, для большинства людей даже "религия" (не говоря уж о "религиозной системе") являются отдаленными-от-опыта, тогда как "каста" или "нирвана" - по крайней мере, для буддистов и индуистов - это близкие-к-опыту понятия"81.
Исследовательская роль имеет определенные преимущества: хотя ученый и не может "влезть в шкуру" других людей, он может попытаться упорядочить и подвергнуть более глубокому и систематическому анализу те слова, символы и культурные формы, посредством которых изучаемые им люди описывают и передают свой опыт, делая это зачастую непоследовательно, случайно или не вполне осознанно. Сравнительно абстрактные, отдаленные-от-опыта понятийные конструкции позволяют ученому превратить живой опыт и изменчивые культурные формы в предмет собственно теоретического анализа, сделать еще один шаг к увеличению достоверного, доступного коллективному пониманию и проверяемого научного знания. Возникающие здесь возможности и границы теоретического понимания в науках о человеке могут быть очерчены одной меткой фразой: "В стране слепых, которые не так ненаблюдательны, как кажутся, одноглазый - не король, а зритель"82.

Дополнительная литература
Девятко И. Ф. Модели объяснения и логика социологического исследования. М.: ИСО РЦГО-TEMPUS/TACIS, 1996.
Ионин Л. Г, Основания социокультурного анализа. М.: Изд-во РГГУ, 1995.
Козина И. М. Особенности применения стратегии исследования и случая (case study) при изучении производственных отношений на промышленном предприятии // Социология: 4М. 1995. № 5-6.
Маслова О. М. Качественная и количественная социология: методология и методы (по материалам круглого стола) // Социология: 4М. 1995. № 5-6.
Никишенков А. А. Из истории английской этнографии: Критика функционализма. М.: Изд-во МГУ, 1986. С. 48-90. Гл. 2.
Ольшанский В. Б. Личность и социальные ценности // Социология в CCCР. М.: Наука, 1966. Т. 1. С. 242-251.
Ряжский И. А. Опыт использования включенного наблюдения для изучения жизни производственного коллектива // Социологические исследования. 1975. № 3. С. 92-99.
Ядов В. А. Стратегии и методы качественного анализа данных // Социология: 4М. 1991. № 1. С. 14-31.

ГЛАВА 3. БИОГРАФИЧЕСКИЙ МЕТОД

Определение и истоки биографического
метода в социологии
Биографические данные в социологии - это основной источник детальных и мотивированных описаний "истории" отдельной личности. И значимые социальные связи, и мотивы действий получают здесь убедительное освещение "с точки зрения деятеля". Чаще всего источником биографических данных становятся личные документы (мемуары, записки, дневники и т. п.) либо материалы интервью и бесед.
Лишь в очень редких случаях исследователь имеет дело с жизнеописанием, включающим в себя все события "от первого крика до последнего вздоха". Обычно основное внимание уделяется конкретным аспектам или стадиям жизни - карьере, межличностным отношениям и т. п. Некоторые авторы даже предлагают взамен широко употребляемых терминов "биографический метод" или "история жизни" использовать термин "история отдельного случая" ("individual case history"), подчеркивающий избирательный, селективный характер жизнеописания83.
В социологии "истории жизни" чаще всего использовались для изучения социальных меньшинств - тех групп, которые довольно трудно поддаются пространственной и временной локализации (и, следовательно, менее доступны для масштабных выборочных обследований).
В 1920-1940-х гг. биографический метод широко применялся представителями Чикагской школы. Так, например, в 1920-е гг. чикагский социолог К. Шоу изучал подростковую преступность, используя написанные по его просьбе автобиографические заметки юного правонарушителя, дополненные полицейскими и судебными документами, результатами медицинских освидетельствований и т. п. Всю совокупность этих данных он рассматривал как "историю случая"84.
Биографический метод имеет очень много общего с методом включенного наблюдения и по сути является еще одной разновидностью этнографического подхода к "анализу случая". Отличием биографического метода можно считать большую сфокусированность на уникальных аспектах истории жизни человека (иногда - группы, организации) и на субъективном, личностном подходе к описанию человеческой жизни, карьеры, истории любви и т. п. В центре внимания социолога здесь оказывается документальное, или устное, описание событий с точки зрения самого "случая", т. е. те сведения, которые в медицине называют субъективным анамнезом. Как и метод включенного наблюдения, биографический метод имеет "этнографические" корни. Культурные антропологи и историки часто опирались (и опираются) на "устные истории" или дневниковые записи и мемуары, когда им приходится изучать соответственно "доисторические", не имеющие письменной традиции сообщества, либо "закулисные" политические механизмы. Еще очевиднее тот вклад, который внесли в развитие биографического метода документальная журналистика и мемуаристика. (Достаточно вспомнить о столь раннем примере использования сравнительно-биографического метода, как "Жизнеописания" Плутарха.)
Первой собственно социологической работой, "узаконившей" использование личных документов, писем и автобиографий в анализе социальных процессов, стала опубликованная в 1918-1920 гг. книга У. Томаса и Ф. Знанецкого "Польский крестьянин в Европе и в Америке". Один из томов этой книги составила автобиография польского эмигранта Владека, описавшего свой путь из провинциального Копина в Чикаго. Этот путь включил в себя и учебу в деревенской школе, и работу помощником в лавке, и выезд в Германию в поисках заработка, предшествовавшие эмиграции в США. Томас и Знанецки первыми выступили с обоснованием использования биографического метода в рамках интерпретативного подхода в социологии (о чем уже говорилось в главе 2, посвященной методу включенного наблюдения). Они полагали, что социальные процессы нужно рассматривать как результат постоянного взаимодействия сознания личности и объективной социальной реальности. В этом взаимодействии личность и "ее" определения реальности выступают и как постоянно действующий детерминант, и как продукт социального взаимодействия. Следовательно, изучение сознания и самосознания - необходимое условие анализа социального мира. Кроме того, Томас и Знанецки предполагали, что исследование, базирующееся на "историях жизни", позволит выйти к более широким обобщениям, касающимся социальных групп, субкультур, классов и т. п.
Н. Дензин дал одно из самых популярных определений биографического метода (метода "историй жизни", "жизнеописаний"): "...биографический метод представляет переживания и определения одного лица, одной группы или одной организации в той форме, в которой это лицо, группа или организация интерпретируют эти переживания. К материалам жизненной истории относятся любые записи или документы, включая "истории случая" социальных организаций, которые проливают свет на субъективное поведение индивидов и групп. Такие материалы могут варьировать от писем до автобиографий, от газетных сообщений до протоколов судебных заседаний"85.
Предположение о необходимости учета "перспективы деятеля", его смыслового горизонта и определения ситуации играет ведущую роль при использовании биографического метода. Так как целью здесь в конечном счете оказывается понимание тех или иных аспектов "внутреннего мира" субъекта, необходимым становится и предположение о том, что исследуемые располагают достаточно сложной структурой субъективного опыта и способны отделить собственный "образ Я" от образа окружающего мира, способны "воспринять себя в качестве активного субъекта своей собственной истории жизни, отличного от социального мира"86.
Следующая фундаментальная особенность биографического метода - его направленность на воссоздание исторической, развернутой во времени, перспективы событий. Используя биографический метод, социолог становится в некотором роде социальным историком. История социальных институтов и социальных изменений здесь раскрывает себя через рассказы людей об их собственной жизни. Это открывает дополнительные возможности для пересмотра "официальных" версий истории, написанных с позиций властвующих классов и групп и сопоставления этих версий с основанным на повседневном опыте знанием социальной жизни, которым располагают непривилегированные и "безгласные" социальные группы. "Кто говорит и кого слушают - это политические вопросы; факт, становящийся особенно очевидным, когда голос получают люди, обладающие низким статусом и властью"87.
Вот, например, как описывает свои отношения с начальством женщина-работница, проинтервьюированная Дж. Уитнер в ходе исследования "биографии" игрушечной фабрики в Чикаго (эта работа, кстати, может служить примером использования биографического метода в исследовании организаций):
"Один мастер - он прежде служил лейтенантом или еще кем-то там в армии - все время доводил работавших на его участке контролеров качества до слез, потому что он кричал на них и они расстраивались. (Вопрос: Почему он кричал на них?) Потому что они отказывались что-нибудь делать, а он не терпел, чтобы кто-то отказывался на его участке, и мы тушевались. Он накричал на меня. Я сказала ему, что мне наплевать. Тогда он побежал к начальству, чтобы пожаловаться, что я вела себя непочтительно. Он хотел от меня объяснительной. Но разве кто-то не покрикивал на меня? Я не собака"88.
Особое внимание проблеме предоставления права голоса "безгласным" уделяет традиция символического интеракционизма. Здесь эта проблема рассматривается не столько в политическом, сколько в теоретическом аспекте. Предполагается, что во всяком обществе существует определенная "иерархия правдоподобия" в производстве и распространении значений и социального знания. Те, кто находятся на "верхнем этаже" этой иерархии, имеют преимущество в формулировке правил, используемых для приписывания смысла действиям и определения ситуации. В результате кто-то диктует правила и нормы в соответствии со своими интересами, а кто-то, также следуя своим интересам, нарушает эти правила и нормы, оказываясь в положении аутсайдера, маргинала или преступника. Если социолог принимает одну, господствующую точку зрения при описании фрагмента социальной реальности, он заведомо игнорирует те интересы, знания и смыслы, которые определяют поступки другой стороны. Биографический подход с точки зрения символического интеракционизма увеличивает шансы исследователя в понимании нестандартных или "отклоняющихся" от общепринятого смысловых перспектив, хотя именно в этом случае его нередко обвиняют в одностороннем или тенденциозном анализе:
"Когда мы обвиняем себя или коллег-социологов в необъективности? Я думаю, что рассмотрение типичных примеров показало бы, что эти обвинения возникают - если обратиться к одному важному классу таких случаев, - когда исследователь оказывает сколько-нибудь серьезное доверие перспективе подчиненной группы в некоем иерархическом отношении. В случае девиантов таким иерархическим отношением оказывается отношение морали. Здесь в положении превосходства оказываются те участники отношения, которые представляют силы официальной и одобряемой морали, а подчиненными становятся те, кто якобы нарушил эту мораль... (другими словами), обвинения в предвзятости, относящиеся к нам или к другим, провоцируются отказом проявлять доверие и почтение к сложившемуся статусному порядку, где право быть услышанным и доступ к истине распределены неравномерно"89.
Естественно предположить, что направленность биографического метода на то, чтобы представить субъективный опыт деятеля через его собственные категории и определения, требует какого-то переосмысления критериев объективности исследования. Действительно, социолог здесь должен прежде всего определить, какова "собственная история", личная трактовка субъекта. То, как субъект сам определяет ситуацию, в данном случае важнее, чем то, какова ситуация "сама по себе" (мы уже говорили об этом в главе 2). Эта "собственная история" может и должна быть дополнена сведениями о том, как определяют ситуацию другие участники. Сопоставление точек зрения и сведений, полученных с помощью разных методов и (или) из разных источников, позволяет полно и достаточно объективно воссоздать не только внешнюю картину событий, но и их субъективный смысл для участников. Такой тип исследовательской стратегии в социологии принято обозначать как множественную триангуляцию90. (Термин "триангуляция" призван подчеркнуть сходство со способом определения удаленности или месторасположения некоторого объекта, используемым в геодезии или радиопеленгации.) Множественная триангуляция помогает в анализе различающихся определений ситуации, относящихся к одним и тем же элементам опыта.

Сбор биографического материала
Любой устный или письменный рассказ субъекта о событиях его жизни может рассматриваться в качестве биографического материала. При определенных условиях для воссоздания "истории жизни" могут использоваться и вторичные источники - мемуары других лиц, письма, официальные документы и т. п. Например, если обратиться к исследованиям "истории жизни" организаций, К. Литлер изучал трудовые отношения в двух британских компаниях в 1930-е гг. Интервьюирование профсоюзных активистов, участвовавших в событиях того времени, было дополнено материалами архивов этих компаний и газетными сообщениями, касавшимися трудовых конфликтов, которые там происходили91.
В недавнем совместном исследовании британских и российских ученых92 изучалась, в частности, кадровая политика на предприятиях разного типа ("неблагополучных", "благополучных", "новых"). Помимо анализа документов кадровой и экономической статистики использовались полуструктурированные интервью с работниками предприятий, основной темой которых стали трудовые биографии респондентов (всего было проведено 260 интервью на 12-ти предприятиях).
Важно, однако, различать биографические (автобиографические) истории и так называемые устные истории. "Устная история" - это фактуально точное воссоздание определенных исторических событий. В ее фокусе - не субъективный опыт деятеля, а историческое знание о событиях, процессах, движущих силах и причинах. Устные истории, рассказанные участниками событий, используются для накопления такого исторического и фактического знания. Историческое знание "с точки зрения очевидца" необходимо, например, антропологу, стремящемуся воссоздать историю разделения труда между соседними племенами или историю вражды между кланами. Историк - представитель школы "Новой социальной истории" - также сможет использовать устные истории, например, описывая бурные политические изменения "снизу" как изменения повседневной жизни простых людей93.
В социологии принято различать три основных типа "историй жизни": полные, тематические и отредактированные.
Полная "история жизни" в идеале очерчивает весь жизненный опыт субъекта - от колыбели до могилы (что само по себе не требует большого объема и степени детализации).
Тематическая "история жизни" отличается от полной тем, что она относится преимущественно к одной стороне или фазе жизненного цикла субъекта. Например, Э. Сазерленд написал книгу о профессиональной карьере "вора в законе", который выступил в качества соавтора произведения94. Сазерленд подготовил опросник, позволивший структурировать письменный рассказ своего соавтора, провел ряд дополнительных интервью и прокомментировал получившуюся "историю жизни". Однако он не использовал никакие дополнительные источники.
Отредактированная "история жизни" может, вообще говоря, быть и полной, и тематической. Ее основная особенность - ведущая роль социолога-интерпретатора, явно организующего биографический материал в соответствии с теоретической логикой, избирательно редактирующего и интерпретирующего исходный рассказ (или рассказы) субъектов для того, чтобы ответить на поставленные в исследовании вопросы. Нередко множество отредактированных "историй жизни" становится иллюстративным или доказательным материалом в теоретическом по сути исследовании. Примером может служить знаменитая работа И. Гофмана "Стигма". Под "стигмой" здесь понимается свойство (атрибут), рассматриваемое как порочащее, неуместное для представителя определенной социальной категории и отличающее его от социально определяемой "нормы" (например, значительный физический дефект, моральное "уродство" наподобие алкоголизма, принадлежность к "не той" расе и т. п.). Так, в главе, посвященной типам "духовной карьеры" стигматизированных людей, Гофман использует десяток различных автобиографических источников, мемуаров, "жизненных историй", чтобы показать, как влияют на личностную идентичность время и обстоятельства осознания субъектом своей стигмы, ее очевидность для окружающих и т. п. Субъектами "жизненных историй" здесь оказываются и человек, заболевший в юности полиомиелитом, и профессиональная проститутка, и слепая девушка, и гомосексуалист.
Основными источниками биографических данных, как уже говорилось, служат, помимо опросов и интервью, публичные и частные архивные материалы. Интервью, опросники и дословные записи устных сообщений неизменно играют ведущую роль в получении значимых для социологии "историй жизни". Их применение гарантирует релевантность получаемых сведений той теоретической проблеме, которая стоит перед социологом (хотя эта "социологическая релевантность", по мнению некоторых, достигается ценой меньшей спонтанности и непосредственности изложения). Процедуры интервьюирования и опросники, используемые в этом случае, по сути отличаются от традиционных для социологии лишь тем, что они отчетливо структурированы временной перспективой человеческой жизни как целого. Опросник, или "биографический путеводитель", используемый при интервьюировании, позволяет субъекту упорядочить свой рассказ и уделить достаточное внимание всем фазам жизненного цикла (детство, юность и т. п.) и всем сферам жизненного опыта (семья, карьера и т. п.), которые значимы для него и (или) интересуют социолога. Помимо того, что опросник или тематический путеводитель позволяют не позабыть или не пропустить существенные сведения, они полезны и самому исследователю как средство отчетливой и явной операционализации тех понятий, которые он собирается использовать в теоретическом анализе.
Заметим здесь, что нередко биографический материал собирается в ходе вполне традиционного выборочного обследования. В большинстве случаев выборка такого исследования представляет какую-то возрастную когорту или профессиональную группу. Разумеется, исходя из практических соображений стоимости широкомасштабного интервьюирования и доступности "редких" совокупностей (см. гл. 6), исследователи чаще всего ограничиваются квотной выборкой. Например, в осуществленном в 1970-е гг. исследовании социальных изменений в канадской провинции Квебек, было собрано 150 биографических интервью с теми, кто начинал свою профессиональную карьеру в 1940-е гг.95. Даже в тех случаях, когда социолог проводит серию глубинных ("клинических") интервью без использования жесткого плана беседы или "путеводителя", он ориентируется на какую-то совокупность теоретически значимых тем, пунктов беседы и постоянно возвращается к их обсуждению. В качестве примера мы можем использовать известную работу "отца-основателя" этнометодологии Г. Гарфинкеля, посвященную анализу "индивидуального случая" изменения полового статуса96. Основной эмпирический материал здесь - это многочисленные интервью с Агнессой, девятнадцатилетней девушкой, рожденной и воспитывавшейся до 17 лет как мальчик и сознательно решившей сменить пол. Агнесса к моменту поступления в университетскую клинику уже два года жила в облике девушки и успешно скрывала от окружающих свой секрет. По ее собственным словам и некоторым косвенным данным, она всегда хотела стать нормальной женщиной и ощущала себя девушкой, рассматривая свои нормальные мужские гениталии как "злую шутку природы", превратность судьбы. С точки зрения генетики, анатомии и эндокринного статуса Агнесса представляла собой редкий случай "чисто гормональной" (тестикулярной) феминизации в подростковом возрасте: физиологически и анатомически нормальные мужские органы соседствовали с вполне отчетливыми женскими вторичными половыми признаками, и внешне, для неосведомленных наблюдателей, Агнесса выглядела как привлекательная юная девушка. Конечно, Гарфинкеля интересовал не сам по себе "медицинский случай". Его интересовала та тонкая социальная "работа", направленная на достижение и сохранение избранного сексуального статуса, которую приходилось осуществлять Агнессе. Любая ошибка, нарушение нормативных ожиданий окружающих, отклонение от "социально-понятных" ролевых моделей привели бы Агнессу к краху ее идентичности и к полной маргинализации. Однако Агнесса не только "управилась" с необходимостью вести обычный, социально-принятый образ жизни молоденькой девушки, иметь подруг и поклонников и т. п., но и добилась сложной хирургической операции, которая позволила избавиться от мужских гениталий и обрести - средствами пластической хирургии - "минимальный анатомический набор", необходимый, чтобы стать "обычной женщиной" (конечно, лишенной собственно репродуктивной функции). Именно сложная "жизненная история" Агнессы дала возможность проанализировать те механизмы конструирования и поддержания "правильного", рационального и "объяснимого-с-точки-зрения-других-людей" статусно-ролевого поведения, которые в повседневной жизни "нормальных" мужчин и "нормальных" женщин не осознаются и действуют автоматически.
Гарфинкель в беседах с Агнессой постоянно обращался к тем темам ("пунктам") ее биографии, которые позволяли пролить свет на определенные теоретические проблемы: "наивное" восприятие разделения полов как однозначного, абсолютного и морально-нагруженного порядка вещей; идентификация сексуального статуса посредством культурно-детерминированных знаков отличия, воспринимаемых в обыденном сознании как естественные и т. п. Одной из тем, интересовавших исследователя, была тема ретроспективного конструирования личностью согласованной с избранным статусом автобиографии: все события, поступки, атрибуты, отношения прежней жизни Агнессы, воспитывавшейся в качестве мальчика, последовательно интерпретировались ею как история "ошибочно воспринимавшейся окружающими в качестве мальчика" девочки. Разумеется, такая автобиография была не лишена каких-то пропусков и труднообъяснимых фактов, но в главном отличалась незаурядной согласованностью: "Уже сама выраженность преувеличений в ее женской биографии, в описании маскулинности ее друга (за которого Агнесса собиралась выйти замуж), "бесчувственности" ее мужских гениталий и т. п. представляет постоянно подчеркиваемую черту: последовательно женскую идентификацию"97.
Случай Агнессы, проанализированный Гарфинкелем, еще раз демонстрирует те трудности в оценке объективности данных, которые возникают при использовании биографического метода: любые искажения фактов здесь могут оказаться и результатом их намеренного сокрытия, и вполне "искренним" механизмом защиты личной самотождественности (т.е. неотъемлемой частью реального "образа Я"), и результатом простой неосведомленности.
Так, Гарфинкель отметил, что Агнесса поразительно мало знала о мужской гомосексуальности и при неоднократных попытках обсуждения этой темы, несмотря на явный интерес и эмоциональность восприятия разговора, просто не могла объяснить, как она воспринимала признаки гомосексуальных интересов у других мальчиков. Она также отказывалась провести какие-либо сравнения между собой и гомосексуальными мужчинами либо трансвеститами, хотя легко и охотно сопоставляла свой статус со статусами нормального мужчины или нормальной женщины. Исследователь был лишен возможности услышать рассказы других участников событий, однако добросовестно зафиксировал особое мнение одного из урологов, не участвовавших непосредственно в лечении Агнессы. Этот человек полагал, что решение об операции было медицинской и этической ошибкой, результатом мистификации, ссылаясь на весьма неоднозначные медицинские признаки и даже на то, что у случайно встреченного им жениха Агнессы была отнюдь не мужественная внешность. Изрядно времени спустя, когда исследовательский проект был успешно завершен, книга Гарфинкеля находилась в печати, а бывшая пациентка уже более пяти лет вела активную жизнь молодой, привлекательной и сексуально благополучной женщины, Агнесса посетила ученых и сообщила, что никогда не имела абсолютно никаких биологических дефектов, которые вели бы к феминизации в подростковом возрасте. Просто с 12 лет она тайно принимала эстрогены (женские половые гормоны), прописанные ее матери после серьезной хирургической операции.
К частным архивным материалам, используемым при изучении "истории жизни", относят преимущественно личные записи и документы. Основной тип частного документа - это автобиография. (К автобиографиям относятся и те детальные жизнеописания, которые создаются по просьбе исследователя.) Существуют заметные различия между автобиографией, написанной в расчете на дальнейшую публикацию, и автобиографией, обращенной лишь к узкому кругу близких. Если в первом случае преимуществом является большая фактическая достоверность и "читабельность" изложения, то во втором обычно имеет место высокая степень раскрытия личного отношения к пережитому, особое стремление мотивировать совершенные выборы и поступки.
Как и основанные на автобиографических сведениях "истории жизни", сами автобиографии могут быть разделены на полные, тематические и отредактированные. Тематические автобиографии, в отличие от полных, ориентированы на определенную сферу личного опыта или период жизни (ср., например: "Моя жизнь в искусстве" и "Подлинная история моей жизни"). Достоинство автобиографий - большая достоверность в описании личностной "подкладки" событий. Однако нужно всегда помнить о том, что автобиография - это реконструированная субъектом в определенный момент жизни история. Здесь особенно вероятны смещения и ошибки, вызванные и стремлением рационально мотивировать любой поступок с точки зрения "сегодняшнего" мировосприятия, и необходимостью придать повествованию некоторую литературную форму. Методологическая триангуляция, о которой говорилось выше, становится единственным средством достижения достоверности и объективности при анализе "историй жизни", основанных на автобиографических данных. Иными словами, автобиографические данные должны интерпретироваться в контексте сведений, полученных из иных источников.
К частной архивной документации относятся также дневники, частные записи, мемуары, личные письма, записи разговоров и т. п. Дневник и мемуарные записки иногда трудно различимы: можно считать, что мемуары в целом отличает более безличный стиль изложения и необязательность линейного и упорядоченного описания сменяющих друг друга во времени событий. Повышение достоверности "историй жизни", основанных на такого рода личных (иногда говорят - "экспрессивных") документах, как дневниковые и мемуарные записи, требует, как и в ранее описанных случаях, привлечения дополнительных источников, использования специальных приемов критического анализа (в том числе критической оценки экспрессивного документа как исторического источника, как литературного текста и т. п.). Важным подспорьем здесь могут оказаться не столько экспрессивные, сколько функциональные личные документы - расписания, черновики, планы работы, записи финансовых поступлений и расходов.
Личные письма также могут рассматриваться как важный источник биографических данных. Письмо может рассказать достаточно важные вещи не только об его авторе, но и о получателе и взаимоотношениях между первым и вторым. И стиль, и способ изложения, и частота переписки могут быть столь же информативны, как и собственно содержание письма. К сожалению, современная социология довольно мало внимания уделяет этому типу личной документации, хотя литературоведение и история дают немало примеров использования личной переписки в качестве полезного источника данных.
Важным дополнительным источником биографических данных являются также официальные архивные документы: записи актов гражданского состояния (рождения, смерти, браки), правительственные документы, данные социальной статистики, архивы политических, общественных организаций и административных органов. В ведомственных архивах могут быть обнаружены важные биографические документы, связанные, в первую очередь, с профессиональной карьерой: личные листки по учету кадров, сведения о наградах и взысканиях, характеристики. Большой интерес представляет документация медицинских учреждений, органов юриспруденции, однако в этом случае необходимо принимать во внимание и существующие обычно жесткие ограничения на доступ к таким источникам, и этические соображения.

Анализ и интерпретация биографического материала
В начале этой главы мы говорили о том, что "истории жизни", биографический метод - это, по сути, разновидность этнографического метода, имеющая дело с анализом "индивидуального случая". Поэтому нам нет нужды детально обсуждать возможности анализа и интерпретации этнографических данных, рассмотренные в главе, посвященной включенному наблюдению. Все, что было сказано об интерпретативном подходе, аналитической индукции, типах понятий и требованиях к валидности в полной мере применимо и к биографическому методу. Здесь мы остановимся лишь на тех проблемах, которые возникают в связи с "индивидуальной" природой биографических данных.
Применение причинных моделей к анализу "историй жизни" требует использования процедур аналитической индукции. Роль негативных, опровергающих примеров в этом случае особенно существенна: обобщения, построенные на нескольких "историях жизни", могут быть уточнены, дополнены или опровергнуты лишь при сопоставлении с новыми, отобранными по теоретически-релевантным признакам, случаями. Излишне говорить о необходимости обоснования "типичности", репрезентативности отобранных для изучения индивидуальных случаев. Здесь применимы идеи теоретической выборки, рассмотренные в главе о включенном наблюдении. Например, в исследовании изменения семейных взаимоотношений и циклов семейной жизни98, сбору "историй жизни" предшествовал детальный анализ доступных демографических данных о межклассовых и поколенческих различиях по таким параметрам, как размер семьи, время рождения самого младшего ребенка и его отделения от родительской семьи и т. п. В результате исследователи сочли возможным ограничиться 130-ю биографическими интервью с мужчинами и женщинами, рожденными в конце 1890 - начале 1900-х гг. в канадском городке Гамильтон (Онтарио) и его окрестностях. Квотная выборка репрезентировала три типичные социальные группы - городской средний класс, городских рабочих и фермеров.
Те соображения, которые ранее были высказаны применительно к внешней и внутренней валидности этнографических данных, применимы и к "историям жизни". В целом биографический метод особенно уязвим для критики, указывающей на наличие таких угроз внутренней валидности, как субъективные смещения и историческая эволюция субъектов. Все респонденты, рассказывающие свои "жизненные истории", анализируют свое прошлое (и предугадывают будущее) с точки зрения конкретного, "вот этого", момента своего личностного развития, обычно стремясь дать социально-одобряемую и согласованную картину жизни как целого. К тому же социолог должен помнить о том, что сама форма биографического повествования - литературная по сути и корням - подталкивает субъекта к использованию популярных биографических канонов, расхожих "сценариев" (например, "история успеха", "рассказ о поиске личностной идентичности", "жизнь прирожденного неудачника" и т. п.). С этой точки зрения "хорошая" биография не должна быть излишне согласованной во всех деталях.
Использование интерпретативных моделей в анализе биографических данных, как мы неоднократно отмечали выше, ориентировано не столько на выведение общих объяснений и причинных закономерностей, сколько на понимание субъективного смысла событий с точки зрения деятеля. Однако и в этом случае достоверность интерпретации зависит от сопоставления сведений, полученных из разных источников, и критической оценки личных сообщений. Фактически биографический метод ведет исследователя к тем же проблемам, что и метод историографический. Здесь часто необходимы и оценка достоверности и подлинности личного документа, и соотнесение с другими свидетельствами, а иногда - и установление авторства. Биографический метод по определению историчен - используя документы прошлого, он стремится к созданию убедительного исторического объяснения полученных сведений. Поскольку историографией называют всякую попытку реконструкции прошлого на основе документальных данных, "история жизни" - тоже форма историографии99. Источники данных в историографии принято делить на первичные и вторичные. К первичным относят те источники, которые содержат непосредственные свидетельства очевидцев или прямых участников событий, а ко вторичным - свидетельства или рассказы тех, кто не присутствовал при описываемых событиях. В историографии принято считать более надежными те документы, автор которых ближе включен в описываемую ситуацию и дает описание "из первых рук". Кроме того, выше ценятся свидетельства более опытного и искушенного наблюдателя, иными словами, - эксперта. Многие авторы полагают, что достоверность и надежность документов тем выше, чем уже аудитория, к которой адресуется автор100, т. е. по мере роста предполагаемой аудитории автор все больше оказывается под влиянием тенденции описывать события в апологетическом и драматическом ракурсе: интимная исповедь постепенно превращается в пропаганду.
Для социолога, использующего личные документы, определенный интерес представляют и те приемы критики источников и установления их подлинности, которые традиционно применяются в историографии101. Во-первых, речь идет о проверке подлинности (несфальсифицированности) текста установлении его авторства. Если для социолога, имеющего дело с "живым" рассказом, эти проблемы сравнительно малозначимы, то использование личных документов "в отсутствие" субъекта выдвигает их на первый план. Исследователь должен убедиться в том, что документ является именно тем, за что его принимают (например, предсмертной запиской, а не наброском поэмы), а также определить принадлежность документа данному автору. Для такой проверки используются и внешние материальные признаки - почерк, бумага, место хранения, и формальные характеристики текста - стиль изложения, лексические характеристики, отсутствие анахронизмов.
Немаловажное значение имеет обоснованность интерпретации текста с точки зрения его характера, целей написания, предполагаемой аудитории и - шире - его социального контекста.
Наконец, даже последовательно интерпретативная трактовка биографического метода не избавляет от необходимости проверить фактическую правдивость содержащихся в биографических документах сведений. Как известно, даже один из основателей интерпретативного подхода в социологии (У. Томас) полагал, что самые радужные перспективы для социологии откроются по мере развития надежной государственной системы учета личных сведений о гражданах.
Конечно, и расшифровка смысла документа, и установление его подлинности никогда не бывают окончательными. Наша способность к пониманию биографических и - шире - исторических событий всегда ограничена и доступным нам смысловым горизонтом социального действия, и принимаемыми теоретическими схемами. Один из подходов к объективному анализу исторических данных и поступков деятеля - это известная концепция "идеальных типов".
М. Вебер понимал под идеальным типом некую социокультурную модель, служащую орудием теоретического понимания. Идеальный тип - это не гипотеза, и не исторически конкретное описание фактов, а сугубо теоретическая, абстрактная конструкция, которая может и не существовать в реальности, но позволяет ученому понять и объяснить реальность. Идеальный тип - это отнюдь не что-то более совершенное и идеально соответствующее норме. Это скорее намеренно преувеличенное и одностороннее описание собственной точки зрения социолога, его видения смысла поступков деятелей: "Этот мысленный образ сочетает определенные связи и процессы исторической жизни в некий лишенный внутренних противоречий космос мысленных связей. По своему содержанию данная конструкция носит характер утопии, полученной посредством мысленного усиления определенных элементов действительности... Задача исторического исследования состоит в том, чтобы в каждом отдельном случае установить, насколько действительность близка такому мысленному образу или далека от него..."102. Примерами идеальных типов могут служить "нуклеарная семья", "капитализм", "целерациональное действие" и т. п.
Конструирование "идеально-типических" понятий (всегда "далеких-от-опыта", см. предыдущую главу) может стать шагом к построению собственно эмпирически проверяемых гипотез.
Н. Дензин предложил общую схему анализа и описания "историй жизни":
"Шаг 1: Отберите исследовательские проблемы и гипотезы, которые могут быть исследованы и проверены с помощью истории жизни.
Шаг 2: Отберите субъекта или субъектов и определите, в какой форме будут собраны биографические данные.
Шаг 3: Опишите объективные события и переживания из жизни субъекта, имеющие отношение к интересующей вас проблеме. Эти события подлежат оценке с точки зрения различных источников и перспектив (триангуляция) таким образом, чтобы противоречия, непоследовательность и нерегулярность стали очевидны.
Шаг 4: Получите от субъекта его интерпретации этих событий, следуя естественному, или хронологическому, порядку.
Шаг 5: Проанализируйте все утверждения и сообщения с точки зрения их внутренней и внешней валидности... (Проверьте достоверность источников).
Шаг 6: Примите окончательное решение о достоверности вышеупомянутых источников и установите приоритетные источники для последующей проверки гипотез.
Шаг 7: Начните проверку предварительно сформулированных гипотез, поиск опровергающих примеров. Продолжайте модифицировать эти гипотезы, выдвигать новые и проверять их.
Шаг 8: Составьте черновой набросок всей "истории жизни" и ознакомьте с ним исследуемых, чтобы узнать их реакцию.
Шаг 9: Переработайте исследовательский отчет, изложив события в их естественной последовательности и учтя замечания исследуемых субъектов. Представьте в отчете те гипотезы и предположения, которые получили подтверждение. В заключении остановитесь на теоретической значимости ваших выводов и перспективах дальнейшего исследования"103.
Эта схема может служить ориентиром в работе с биографическими данными.

Дополнительная литература

Альмодавар Ж.-П. Рассказ о жизни и индивидуальная траектория // Вопросы социологии. 1992. Т. 1. № 2.
Бургос М. История жизни. Рассказывание и поиск себя // Вопросы социологии. 1992. Т. 2. № 2.
Блок М. Ремесло историка, или Апология истории. 2-е изд., доп. М.: Наука, 1986. Гл. 3.
Журавлев В. Ф. Нарративное интервью в биографических исследованиях // Социология: 4М. 1993-1994. № 3-4.
Знанецкий Ф. Мемуары как объект исследования // Социологические исследования. 1989. № 1.
Козина И. М. Поведение работников на рынке труда. Способы трудоустройства и личные стратегии занятости // Реструктурирование занятости и формирование локальных рынков труда в России. М., 1996. С. 84-107.
Козлова Н. Н. Крестьянский сын: Опыт биографического исследования // Социологические исследования. 1994. № 6. С. 112-123.
Оболенская С. В. "История повседневности" в историографии ФРГ // Одиссей. Человек в истории. М., 1990. С. 182-197.
Рождественский С. Подходы к формализации жизненных историй качественными методами // Судьбы людей: Россия XX век. Биографии людей как объект социологического исследования / Отв. ред. В. Семенова, Е. Фотеева. М., 1996. С. 412-422.
Тернер Р. Сравнительный контент-анализ биографий // Вопросы социологии. 1992. Т. 1.№ 1.
Томпсон П. Гуманистическая традиция и жизненные истории в Польше // Биографический метод в социологии: история, методология, практика / Ред. колл.: В. В. Семенова, Е. Ю. Мещеркина. М., 1993. С. 51- 62.
Томпсон П. История жизни и анализ социальных изменений // Вопросы социологии. 1993. № 1-2. С. 129-138.
Фукс-Хайнритц В. Биографический метод // Биографический метод в социологии: история, методология, практика / Ред. колл.: В. В. Семенова, Е. Ю. Мещеркина. М., 1993. С. 11-41.
Хоффман А. Достоверность и надежность в устной истории // Биографический метод в социологии: история, методология, практика /Ред. колл.: В. В. Семенова, Е. Ю. Мещеркина. М., 1993. С. 42-50.

ГЛАВА 4. ЭКСПЕРИМЕНТ В СОЦИАЛЬНЫХ
НАУКАХ
Эксперимент - это опытное исследование воздействия отдельного фактора (или нескольких факторов) на интересующую исследователя переменную. Экспериментальное исследование строится в соответствии с правилами индуктивного вывода о наличии причинно-следственной связи между событиями, во-первых, демонстрируя регулярный характер появления события-"отклика" после предшествующего по времени события-воздействия и, во-вторых, исключая посредством особых приемов экспериментальной изоляции и контроля альтернативные объяснения появления "отклика" с помощью посторонних влияний и конкурирующих каузальных гипотез104. Соответственно данные экспериментального исследования представляют собой наилучшее приближение к модели статистического вывода о наличии причинной взаимосвязи между воздействием и "откликом" или, в более привычных терминах, между независимой и зависимой переменными.
В главах, посвященных массовым опросам и статистическому анализу результатов социологического исследования, обсуждаются возможности и ограничения неэкспериментальных, сугубо статистических методов анализа связи между переменными. В частности, речь идет о случаях ложной корреляции между переменными, а также о том, что в неэкспериментальных исследованиях часто невозможно однозначно упорядочить изучаемые переменные во времени и, следовательно, задать направление причинной связи105. Основанная на эксперименте модель статистического вывода в значительной степени лишена этих недостатков, хотя ее использование в социальных науках во многих случаях также сталкивается с существенными техническими, этическими и прочими ограничениями.

Определение и виды эксперимента.
Основные принципы экспериментирования
в социальных науках
Экспериментальный метод пришел в социальные науки из естественных наук, где он примерно с XVII века стал основным способом опытной проверки научных теорий106. Самым популярным видом эксперимента в точных науках был и остается лабораторный эксперимент, получивший распространение также в науках о человеческом поведении.
Лабораторный, или истинный, эксперимент нацелен на проверку теоретической гипотезы и осуществляется в условиях максимального контроля над уровнем воздействия независимой переменной и очищения (изоляции) этого воздействия от посторонних влияний, оказываемых внешними, т. е. иррелевантными с точки зрения проверяемой гипотезы, переменными. Экспериментальный контроль и изоляция позволяют отвергнуть иные возможные объяснения наблюдаемого эффекта - конкурентные гипотезы. Немаловажным условием обоснованности, валидности результатов, получаемых в лабораторном эксперименте, является возможность достаточно надежного измерения зависимой переменной. В этом случае при бесконечном количестве испытаний результаты неизбежных случайных возмущений в зависимой переменной "погасят" друг друга и исследователь получит точную оценку интересующего его воздействия.
На практике описанные требования к истинному эксперименту могут быть полностью воплощены лишь в бесконечном идеальном эксперименте, при проведении которого внешние, так называемые экзогенные переменные остаются неизменными, и изменяется лишь независимая переменная, что обеспечивает полную валидность выводов о изучаемом соотношении между независимой и зависимой переменными107. Идеальный эксперимент - это эталон, относительно которого могут оцениваться и сопоставляться эксперименты реальные, однако буквальное выполнение всех его требований обычно невозможно или даже бессмысленно с точки зрения конкретной научной задачи, стоящей перед исследователем.
Дональд Кэмпбелл приводит в качестве примера эксперимент Николсона и Карлслайла, которые продемонстрировали явление гидролиза, всего лишь "взяв в мае 1880 г. образец воды в районе Сохо (образец очень частный, характерный для местных условий и данного периода) и опустив в него весьма специфичный кусок медной проволоки, по которой пропускался электрический ток..." Влиянием посторонних факторов (прежде всего примесей) на протекание гидролиза в данном эксперименте можно было пренебречь, так как целью было подтверждение теоретически предсказанной закономерности, а не измерение скорости гидролиза или изучение особенностей его протекания в различных средах108.
В социальных науках от лабораторного эксперимента принято отличать полевой эксперимент, проводимый в естественных условиях и в большинстве случаев имеющий своей целью не столько проверку научной гипотезы о причинной связи между переменными, сколько оценку эффективности различных программ или методов воздействия.
Для многих прикладных социологических исследований, ориентированных на разработку и оценку социальных программ, социальное экспериментирование столь же типично, сколь типичны лабораторные эксперименты для социальной психологии или социологии малых групп. Социальное экспериментирование позволяет ответить на самые разнообразные вопросы, относящиеся преимущественно к сфере практической политики и администрирования - например, как влияет отмена смертной казни на показатели преступности, растет ли посещаемость музеев при снижении цен на входные билеты, во всех ли случаях повышение размера вознаграждения ведет к росту производительности труда и т. п.
Например, в исследовании воздействия детского сериала "Улица Сезам" на культурное и интеллектуальное развитие американских дошкольников109 полевой эксперимент охватил детей и родителей, проживавших в городах (Бостон, Дарэм, Феникс), а также в сельских районах Калифорнии и Филадельфии. В ходе эксперимента детей и их родителей побуждали к просмотру сериала (независимая переменная), фиксируя изменения в когнитивном развитии дошкольников с помощью тестов достижений и тестов общего развития (зависимые переменные). Двухлетний полевой эксперимент позволил продемонстрировать заметный обучающий эффект, связанный с просмотром сериала, особенно очевидный в группе детей из неблагополучных семей.
Полевой эксперимент - ведущий метод ориентированных на практику оценочных исследований (evaluative research)110. Однако далеко не всегда оценка эффективности новой, компьютеризованной системы обучения или, скажем, нового танкового прицела происходит в реальных полевых условиях. Иногда исследователи проводят эксперимент в условиях, имитирующих реальность или даже представляющих некоторые особенности реальной ситуации - обучения, вождения танка и т. п. - в преувеличенном, "очищенном" виде. Р. Готтсданкер предложил различать два типа полевых экспериментов - эксперименты, дублирующие реальный мир (т. е. уже описанные "натурные" эксперименты), и эксперименты, улучшающие реальный мир111. Эксперименты, улучшающие реальный мир, прежде всего позволяют повысить валидность и надежность данных. Так, данные "натурного" эксперимента по эффективности нового метода обучения вождению автомобиля будут подвержены влиянию множества трудноконтролируемых различий в условиях видимости, ландшафте, состоянии дорог и используемых автомобилей, тогда как данные тренажерных испытаний будут меньше подвержены такого рода смещениям. Кроме того, надежность эксперимента в "улучшенных" условиях также повысится за счет возможности контролировать частоту "встречного движения" на экране тренажера, соблюдать четкий временной режим, исключающий утомление оператора, и т. д.
Для того чтобы понять, чем руководствуются социологи, осуществляя выбор одного из перечисленных видов эксперимента и конкретного плана построения экспериментального исследования, нам следует сначала рассмотреть ключевые понятия и принципы, лежащие в основе современного подхода к социальному экспериментированию.
Суммируя вышеизложенное, можно сказать, что в лабораторном эксперименте обоснованность выводов экспериментального исследования, т.е. их валидность и надежность, обеспечиваются благодаря трем принципам планирования эксперимента: 1) контролю над уровнем независимой переменной, 2) изоляции основного эффекта (т. е. собственно воздействия независимой переменной на зависимую переменную) от влияния посторонних, смешивающих факторов, а также 3) многократному воспроизведению полученных результатов, которое позволяет нивелировать случайные изменения результата112 отдельных испытаний, связанные с несистематическими колебаниями фона, случайными ошибками, усталостью и т. п. При этом первые два принципа планирования лабораторного эксперимента позволяют обеспечить валидность как соответствие эксперимента его цели, измерение именно того эффекта, который предполагалось измерить. Идеальный, т. е. совершенно валидный эксперимент, фиксирует лишь то отношение между переменными, которое и планирует изучить экспериментатор, и "отсекает" любые другие источники систематической вариации результатов. Валидность эксперимента, следовательно, определяет достоверность выводов о наличии либо отсутствии предполагаемой причинной связи и о подтверждении либо неподтверждении проверяемой в эксперименте теоретической гипотезы (рис. 1). Третий принцип обеспечивает надежность результатов - защиту от случайной ошибки, являющуюся, как говорилось выше, необходимым условием валидности.
Однако большая часть экспериментов в социальных науках (как, впрочем, и в ряде инженерных дисциплин или агробиологии) происходит в условиях, когда перечисленные принципы не могут быть реализованы полностью. Возникающие здесь ограничения имеют технический, а иногда - скорее принципиальный характер. Если, например, в социологическом эксперименте независимыми переменными служат раса или социальное происхождение, то мы даже технически - не говоря уже о соображениях морали - не можем осуществлять полный контроль над этими переменными, т. е. совершенно произвольно определять их значение для каждого отдельного случая (субъекта). И даже если бы эту трудность можно было бы каким-то образом преодолеть на время проведения испытаний, нам было бы трудно изолировать интересующий нас основной эффект от влияния сопутствующих, "закоррелированных" с независимой переменной факторов, - связанного с расой или происхождением специфического социального опыта, соответствующих социальных навыков и т. п. (Со схожими трудностями сталкивается и агробиолог, оценивающий урожайность нового сорта пшеницы и пытающийся отделить главный фактор от прочих, также влияющих на урожайность: различий в освещенности опытных участков, в составе почвы и т. п.).



Рис. 1. Типы экспериментов

Знаменитый английский статистик Р. Фишер первым обосновал возможность применения несколько иного подхода к планированию полевых экспериментов, лабораторных экспериментов с неполным контролем, а также квазиэкспериментов (о последних речь пойдет позднее). Этот подход основан на целенаправленном использовании законов случая и теории вероятности. Он требует введения в планирование эксперимента принципа рандомизации.
Рандомизация - это стратегия случайного распределения субъектов по различным условиям (режимам) эксперимента и экспериментальным группам.
Воспользуемся в качестве иллюстрации тем же простым примером психофизического опыта, которым пользуется сам Фишер при обсуждении роли принципа рандомизации в планировании эксперимента113.
Представим себе, что некая леди взялась угадать, в какие четыре из восьми чашек чая с молоком сначала налили молоко, а в какие - чай. Экспериментальная гипотеза состоит, таким образом, в том, что испытуемая обладает описанной способностью различения. Если воспользоваться простейшей формулой из комбинаторики, то общее число способов выбрать четыре чашки из восьми равно числу размещений А:


Иными словами, если бы испытуемая не обладала способностью отличать "молочно-чайные" чашки от "чайно-молочных" и прибегла к случайному угадыванию, то вероятность правильно определить 4 чашки составила бы 1/70 (из 70 существующих различных способов выбрать 4 чашки из 8 лишь один является правильным). Говоря точнее, при достаточно длинной серии испытаний частота правильных ответов приближалась бы к 1/70. Если же частота правильных ответов существенно, с точки зрения избранного статистического критерия, превышает частоту случайного угадывания, то мы вправе сделать вывод о том, что интересующая нас специальная способность действительно существует.
Однако описанная схема испытания явно не соответствует тем требованиям, которые предъявляются к уровню контроля над переменными и изоляции основного эффекта в лабораторном эксперименте. Возможные угрозы валидности наших статистических выводов носят довольно очевидный характер. Во-первых, мы не обладаем никакими средствами прямого измерения зависимой переменной - способности вкусового различения. Правильные угадывания - это лишь косвенные индикаторы такой способности и могут отражать влияние "посторонних" переменных, даже превосходящее основной эффект. Если, например, во все чашки, в которые сначала было налито молоко, был добавлен сахар, ясно, что все они будут безошибочно опознаны. Статистические выводы о значимости окажутся, таким образом, невалидными, т. е. не имеющими отношения к нашей экспериментальной гипотезе (хотя и подтверждающими конкурентную гипотезу о способности распознавать сладкий вкус). Систематическое постороннее влияние, составляющее угрозу валидности статистического вывода, может носить и другой характер: "молочные" и "чайные" чашки могут отличаться друг от друга толщиной, температурой, цветом. Чтобы устранить перечисленные угрозы валидности и нивелировать возникающие систематические смещения, экспериментатор должен использовать принцип рандомизации, т. е. обеспечить случайный порядок предъявления стимулов-чашек и их оценки, определяемый, например, с помощью таблицы случайных чисел или жребия. В идеале и отбор испытуемых для каждой серии опытов, и распределение уровней независимой переменной между чашками ("молоко-чай" или "чай-молоко") должны основываться на законах случая.
При планировании конкретного экспериментального исследования описанные принципы находят воплощение при разработке плана, или схемы, эксперимента, определяющего порядок предъявления испытуемым (или их группам) различных уровней (условий) независимой переменной для адекватной проверки экспериментальной гипотезы114.

Основные экспериментальные планы с контрольной
группой и рандомизацией
В социологии, психологии и других поведенческих науках особую роль играет использование принципа рандомизации при распределении испытуемых по группам. В эксперименте с неполным контролем или в полевом эксперименте, происходящем в естественных условиях (т. е. в условиях школьного класса, промышленной организации, городского района и т. д.) часто нужно доказать не только наличие ожидаемого эффекта в результате некоторого воздействия Х, но и отсутствие того же эффекта в тех случаях, когда воздействия не было. Например, исследователь, изучающий воздействие просмотра антивоенных фильмов на изменения установок студентов, случайным образом отбирает из некоторой совокупности студентов экспериментальную группу, которой будет показан антивоенный фильм, а также контрольную группу, которой он продемонстрирует нейтральный фильм, никак не связанный с изучаемыми установками. План этого простейшего рандомизированного эксперимента с предварительным и итоговым тестированием и контрольной группой (RT1-2C) будет выглядеть таким образом:
R О1 Х О2
R О3 О4

где R - процедура рандомизации (случайного распределения по группам), О1,2 - уровни установок в экспериментальной группе до и после просмотра фильма X, O3,4 - уровни установок в контрольной группе, не смотревшей фильма. Использование контрольной группы позволяет устранить некоторые важнейшие угрозы валидности эксперимента. Во-первых, если бы исследователь отказался от использования контрольной группы и ограничился тестированием, т. е. измерением установок "до-после" просмотра, то обнаруженные изменения в уровне установок можно было бы приписать влиянию на испытуемых самого по себе факта участия в эксперименте. Испытуемые, возможно, осознавали, что они отобраны для важного исследования и стремились некоторым образом соответствовать своей роли и оправдать некие гипотетические "ожидания" экспериментатора. Описанная угроза валидности широко известна и для нее существует несколько обозначений. В психологическом тестировании и экспериментальной психологии это называют "эффектом морской свинки" или "мотивом экспертизы". Иногда применяют термин, возникший в медицине, где при клинических испытаниях новых фармакологических средств и методов лечения часто наблюдают "эффект плацебо", т. е. заметное улучшение статуса у многих участников контрольной группы, в которой вместо реального воздействия использовались индифферентные средства и нейтральные врачебные манипуляции. В социологии самое популярное обозначение систематического смещения, возникающего из-за реакции испытуемых на ситуацию эксперимента - это "хоуторнский эффект".
В так называемых хоуторнских экспериментах (по названию промышленного предприятия в Чикаго) исследовались организационные и социально-психологические факторы, влияющие на производительность труда. Исследователи обнаружили, что эффект роста производительности труда в бригадах сохранялся даже при отсутствии собственно экспериментального воздействия. Предположительной причиной этого явления был рост группового самосознания у участников эксперимента115.
"Хоуторнский эффект"116 - это угроза валидности, связанная с особенностями экспериментальной группы.
Еще одна угроза валидности выводов, которую позволяет преодолеть описываемый план эксперимента, также связана с особенностями групп, а именно - с процессом отбора для участия в эксперименте. Если бы мы отказались от предварительного тестирования и случайного распределения испытуемых по экспериментальной и контрольной группам, мы совершили бы методическую ошибку, весьма характерную для любых экспериментов с добровольцами. Очень часто исследователи отбирают испытуемых для участия в специальной программе обучения или в новаторском организационном проекте, основываясь на изъявленном ими желании, а затем сравнивают результаты, показанные участниками оцениваемой программы, с результатами какой-либо другой доступной группы (или даже случайной выборки из соответствующей генеральной совокупности), не участвовавшей в такого рода программе. Однако такое сравнение некорректно: само по себе желание участвовать в эксперименте часто свидетельствует о изначально более высокой мотивации, осведомленности или интеллекте. Эти факторы сами по себе, или взаимодействуя с главной независимой переменной Х, могут объяснить значимые различия в результатах, показанных экспериментальной группой. В только что описанном примере сравнение группы добровольцев, пожелавших посмотреть антивоенный фильм, с прочими студентами, может вести к завышенной оценке воздействия просмотра, если добровольцы изначально проявляют больший интерес к политическим проблемам. Лишь случайное распределение добровольцев по контрольной и экспериментальной группам при соблюдении "непрозрачности" такого распределения для всех испытуемых (участники обеих групп должны считать, что они подвергаются некоторому экспериментальному воздействию) позволяет судить о роли независимой переменной X в возникновении межгрупповых различий117.
Вышеописанные угрозы валидности связаны преимущественно с особенностями групп, проявляющимися на стадии отбора или в ходе эксперимента. Однако рандомизация позволяет справиться и с некоторыми угрозами валидности, исходящими от переменных внешнего окружения, фона. К фоновым относятся, в частности, "возможные влияния времени года или событий, возникающих на институциональном уровне", а также факторы естественного развития - "все те биологические или психологические процессы, которые независимо от конкретных внешних событий систематически изменяются с течением времени"118. Испытуемые взрослеют, обучаются, устают, улучшают свои результаты при повторных тестированиях и т. п., что может сказываться на их результатах. Однако если такие посторонние влияния не оказывают избирательного воздействия только на членов экспериментальной группы, они будут вносить вклад лишь в случайную ошибку, а не в систематическое смещение. Иными словами, они будут с равной вероятностью распределены между случайным образом отобранными участниками контрольной и экспериментальной групп. План типа RT1-2C позволяет обеспечить случайный и равновероятный характер внешних, фоновых воздействий на контрольную и экспериментальную группу. Более того, он позволяет "вычесть" величину фонового влияния и оценить чистый основной эффект: если внешнее влияние все же имело место, оно в равной степени подействовало на показатели и экспериментальной, и контрольной групп; следовательно, разность между средними значениями первого и второго замеров уровня зависимой переменной в контрольной группе (О4 ? О3) нужно вычесть из аналогичной разности значений зависимой переменной, зафиксированной в экспериментальной группе (О2 ? O1), т. е.:

?Х ? ? ? О2 ? O1? ? ? О4 ? О3??

при этом предварительное и послеэкспериментальное тестирование в экспериментальной и контрольной группах должны проводиться практически одновременно.
Систематическая угроза валидности, связанная с фоновыми факторами, может все же возникнуть и при использовании рандомизации и контрольной группы. Это происходит тогда, когда фоновые факторы взаимодействуют с независимой переменной (или некоторыми ее уровнями). Природу такого взаимодействия легко понять на примере исследования, в котором изучается влияние тревожности, возникающей в ситуации неопределенности, на успешность решения сложных задач. В такого рода экспериментах для создания ситуации неопределенности и повышения реактивной тревожности (независимые переменные) часто используют неясные инструкции, косвенные негативные оценки действий испытуемого, высказываемые лицами, проводящими эксперимент (типа "Ну-ну, посмотрим, как Вы сможете это использовать"), а также предварительные серии, где испытуемому приходится решать заведомо неразрешимые задачи. Разумеется, всем этим воздействиям (X) подвергаются лишь члены экспериментальной группы. Если испытуемые - это студенты, которым в силу случайного стечения обстоятельств через неделю предстоит сдавать экзамены, или сотрудники подразделения фирмы, ожидающие скорой переаттестации, то эти факторы "фона" будут взаимодействовать с независимыми переменными, не только суммируясь с ними, но и усиливая их эффект. Негативные подкрепления, получаемые в ходе эксперимента, будут восприниматься значительно острее накануне экзаменационной сессии или переаттестации, а связанная с этими событиями фоновая тревожность и неопределенность будет взаимодействовать с тревожностью и неопределенностью, создаваемыми преднамеренно.
Оценить чистый эффект взаимодействия с помощью сравнения с результатами контрольной группы вышеописанным способом в данном случае невозможно, так как взаимодействие фоновых смещений с основным эффектом происходит лишь там, где имеет место экспериментальное воздействие X. В контрольной группе приближающееся неприятное событие также может повлиять на результаты итогового замера или даже обоих замеров, но оно не будет взаимодействовать, "перемножаться" с воздействием независимой переменной (такое взаимодействие можно описать в более точных терминах, однако это требует введения некоторых статистических понятий). Для оценки величины взаимодействия фоновых смешивающих переменных с основным эффектом нужны более сложные экспериментальные планы. Некоторые из них будут обсуждаться ниже.
Иногда имеет смысл воспользоваться упрощенным вариантом описанного плана с рандомизацией и контрольной группой, а именно планом с рандомизацией без предварительного тестирования (RTC), который схематически выглядит следующим образом:
R Х О1
R О2

Привлекательность этого плана заключается прежде всего в его экономичности. Если при распределении испытуемых между группами и уровнями воздействия использовалась истинная вероятностная процедура119, то проведение предварительного тестирования - как в плане КТ1-2С - лишь увеличивает стоимость эксперимента, не оказывая существенного влияния на качество получаемых данных. По сути, правильно осуществленная рандомизация (R) - это наилучшая гарантия отсутствия изначального смещения между группами (т. е. равенства исходных среднегрупповых значений зависимой переменной О в контрольной и экспериментальной группах). Кроме того, в широкомасштабных социологических исследованиях, а также в прикладных исследованиях в области педагогики и социальной работы, проведение и предварительных, и повторных измерений зависимой переменной (политических установок, криминального поведения и т. п.) часто неосуществимо либо ведет к возникновению реакции на саму процедуру тестирования. Если, к примеру, мы изучаем влияние участия в предвыборной групповой дискуссии на последующую поддержку политических партий, то предварительное измерение политических установок может повлиять на активность опрошенных в ходе самой дискуссии и их последующие установки.
Можно заключить, что план RTC предпочтителен всегда, когда нежелательно повторное предъявление весьма специфичных по содержанию и схожих по форме тестов, вопросов, измерительных процедур. Иными словами, этот план заслуживает широкого применения в социологических и оценочных исследованиях. Кроме того, он является самым приемлемым средством проведения так называемых методических экспериментов, в которых оценивается эффективность различных видов опроса, способов заполнения и форматов анкет и т. п. (примером такого методического эксперимента является описанное в главе "Массовые опросы" исследование Бредберна и Судмана, в котором эффективность метода "случайного ответа" сравнивалась с эффективностью использования данных административной статистики). План RTC использовался, в частности, в одном из практически ориентированных социальных экспериментов по совершенствованию системы правоохранительных и пенитенциарных учреждений, проводившихся в США в 1960?70-е гг.
В 1961 г. Федеральное бюро пенитенциарных учреждений США начало трехлетний эксперимент, целью которого было изучить воздействие поддерживающего консультирования и специальных реабилитационных программ на поведение мальчиков-подростков, находящихся в исправительных учреждениях. Местом проведения эксперимента стала специальная школа-колония для несовершеннолетних правонарушителей.
При проведении рандомизации мальчиков случайным образом распределяли между отрядами, где проводился эксперимент, и отрядами, служившими контрольными (каждый отряд жил в отдельно расположенном корпусе). В экспериментальных отрядах было увеличено количество воспитателей, проводились специальные индивидуальные и групповые консультации, использовалась система вознаграждений за хорошее поведение. В контрольных группах применялись обычные методы воспитания и обучения, а также традиционные наказания за нарушение внутреннего распорядка. Результаты эксперимента показали, что мальчики из экспериментальных групп раньше покидали спецшколу, лучше успевали в учебе, вели себя адаптивнее. Не было обнаружено значимых различий в показателях рецидивной преступности для подростков из экспериментальных и контрольных групп, освобожденных из школы-колонии, однако ребята из экспериментальных групп значительно отличались от ребят из контрольных групп по показателю тяжести вновь совершенных преступлений (первые, в случае рецидива, совершали менее тяжкие преступления). По результатам эксперимента было принято решение о внедрении экспериментальной коррекционной программы во всех подразделениях школы120.
Еще один популярный план с рандомизацией и контрольной группой - это план Соломона121. План Соломона - это расширенный вариант плана RT1-2C, позволяющий проконтролировать и оценить эффекты естественного развития и фона, а также определить взаимодействие эффекта тестирования с основным воздействием X. Здесь наряду с экспериментальной и контрольной группами с предварительным тестированием используются экспериментальная и контрольная группы без предварительного тестирования (как в плане RTC). Схематически это выглядит следующим образом:
R O1 X О2
R О3 О4
R X О5
R О6

Очевидно, что если главный эффект X реален, то даже при наличии существенного эффекта тестирования ("хоуторнского эффекта") будут выполняться четыре неравенства: O2>O1; О2>О4; О5>О6; О5>О3. Оценкой сравнительной величины эффекта предварительного тестирования (без взаимодействия с X) может служить величина разности О6?О3. Сравнение О6 с О1 и О3 позволяет оценить влияние фоновых факторов и факторов естественного развития122.
До сих пор мы обсуждали содержательные аспекты проверки экспериментальной гипотезы о наличии главного эффекта X с помощью различных планов эксперимента, а также преимущества разных планов для обеспечения разных аспектов валидности. Очевидно, однако, что в каждом конкретном эксперименте величина главного эффекта, т. е. наблюдаемого различия результатов экспериментальной и контрольной группы, будет варьировать не только под воздействием независимой переменной, но и просто в результате действия различных случайных возмущений. Конечно, если бы наш эксперимент был идеален и абсолютно надежен (см. выше), то при каком угодно числе повторений мы бы всегда получали одну и ту же истинную оценку величины воздействия (при отсутствии или контроле смешивающего влияния дополнительных переменных). Однако реальные эксперименты - особенно, как уже говорилось, эксперименты в социальных науках - не бывают и не могут быть идеальными и безупречно надежными. Следовательно, перед исследователем всегда стоит задача статистической оценки значимости полученных результатов.
Вероятностным "воплощением" содержательной экспериментальной гипотезы является статистическая гипотеза. Принятие или непринятие статистической гипотезы - необходимое, но недостаточное условие принятия или отвержения содержательной гипотезы, проверяемой в эксперименте. Проверяемая в конкретном эксперименте статистическая гипотеза всегда формулируется как гипотеза о том, что при бесконечном количестве повторений этого эксперимента среднее различие между экспериментальной и контрольной группами (или между воздействием разных уровней независимой переменной) равнялось бы нулю. Такую статистическую гипотезу, фактически сводящуюся к утверждению о случайном характере наблюдаемых в реальном эксперименте различий, называют нулевой гипотезой, или нуль-гипотезой (Н0). Отвержение или неотвержение нуль-гипотезы позволяет говорить о том, что в данном эксперименте содержательная гипотеза подтвердилась, либо подтвердилась противоположная ей альтернативная гипотеза, либо не было получено подтверждения ни одной из них.
Вспомним воображаемый эксперимент Фишера с чаем и молоком, описанный в начале главы. Мы отмечали, что при использовании тактики случайного угадывания испытуемая смогла бы правильно определить последовательность наполнения чашки примерно в 1 случае из 70. Следовательно, 2 "попадания" из 100 даже при очень большом количестве испытаний едва ли могут считаться значимым результатом. Куда достовернее выглядят 90 или даже 95 "попаданий" из 100 (оставшиеся "ошибки" можно отнести на счет действия случайных факторов). Чтобы определить уровень значимости и построить доверительный интервал в этом случае достаточно метода, описанного в главе 8.
Вообще, критерии значимости и статистические методы, используемые при проверке статистической гипотезы для конкретного плана эксперимента, называют статистическими моделями. Для планов с контрольной группой основная статистическая модель - это использование t-критерия, о чем подробнее говорится чуть ниже. Для более сложных планов многомерных или факторных экспериментов, общий обзор которых дается в следующем разделе главы, ведущие статистические модели - это дисперсионный анализ и использование F-критерия Фишера.
Итак, для того чтобы оценить статистическую значимость в элементарных рандомизированных планах, описанных выше, нам необходимо проверить статистическую гипотезу о разности средних значений зависимой переменной в контрольной и экспериментальной группах. Конкретное значение разности средних значений зависимой переменной в экспериментальной и контрольной группе, обнаруженное в отдельном эксперименте (скажем, 4 балла по некоторой "шкале пацифизма"), нужно соотнести с определенным интервалом, в который это значение "укладывается" с заданной (доверительной) вероятностью. Иными словами, нужно решить задачу интервального оценивания, подобную задаче оценки отдельного параметра совокупности в выборочном обследовании (эта задача описана в гл. 8). Разница в том, что проводя эксперимент, мы интересуемся не вероятными пределами, в которых лежит некая характеристика выборки из реально существующей совокупности, а пределами, в которых лежит полученный нами в эксперименте результат относительно результата воображаемой бесконечной совокупности идентичных экспериментов. Нулевая гипотеза утверждает, что истинное значение различия средних равно нулю, варьируя в каких-то пределах от эксперимента к эксперименту (т. е. . Если удается показать, что полученное в эксперименте значение разности групповых средних не позволяет принять нулевую гипотезу, то делается вывод о подтверждении гипотезы, противоположной нулевой (т.е. - о статистической значимости различий между группами - и, значит, о подтверждении экспериментальной гипотезы (или о подтверждении гипотезы, противоположной экспериментальной, - если различие между экспериментальной и контрольной группой оказалось с обратным знаком). Заметьте, что нулевая гипотеза всегда формулируется как гипотеза о том, что истинное значение разности средних (или, скажем, величины взаимосвязи между двумя переменными) равно нулю, а полученные в эксперименте величины отличаются от нуля исключительно из-за случайной ошибки выборки. Чем дальше от нуля - в ту или другую сторону - расположено наблюдаемое значение, тем больше его статистическая значимость и меньше вероятность того, что оно явилось результатом ошибки выборки.
Для того чтобы сравнить полученное в эксперименте с контрольной и экспериментальной группами значение разности между средними с гипотетическим выборочным распределением этой величины для бесконечного числа испытаний (такие распределения имеются не только для разности средних, но и для средних величин, стандартных отклонений и т. д.), нужно высчитать стандартную ошибку разности между средними123. Формула для стандартной ошибки разности между средними - SМэ-Мk -немного отличается от формулы стандартной ошибки средней SM20, приведенной в главе 8. Тем не менее она весьма проста:



где Sэ и SK - величины стандартного отклонения, рассчитанные для экспериментальной и контрольной групп, nэ и пk - число наблюдений (испытуемых) в экспериментальной и контрольной группах.
После этого нужно определить, на сколько единиц стандартной ошибки отстоит полученная разность средних от нуля, представляю-



щего собой - в согласии с нуль-гипотезой - среднее гипотетического распределения разностей средних, t-распределения. Для этого полученную в эксперименте разность групповых средних нужно перевести в t-единицы (т. е. единицы стандартного отклонения для t-распределения). Для данной разности средних величину t можно высчитать по формуле:

Полученное значение t нужно сравнить с соответствующим значением из таблицы t-распределения для избранного уровня значимости (р = 0,05 или 0,01) и числа степеней свободы, соответствующего количеству наблюдений в каждой группе (или подвыборке). Число степеней свободы - довольно сложное статистическое понятие, анализ которого выходит за пределы этого учебника (в самом общем виде оно обсуждается в гл. 7). На практике число степеней свободы можно рассматривать как величину, равную числу наблюдений (испытуемых, опрошенных, баллов и т. п.) минус число оцениваемых параметров. Для разности средних двух групп это составит число наблюдений в экспериментальной группе минус один (nэ ? 1) плюс число наблюдений в контрольной группе минус один (пk ? 1):
Nст.своб. = (nэ ? 1) + (пk ? 1)
Таблицы t-распределения можно найти в любом учебнике или справочнике по статистике (см. "Дополнительную литературу" к данной главе, а также к гл. 8). Здесь мы приводим лишь фрагмент такой таблицы.

Таблица 4.1
Сокращенная таблица t-распределения
Стьюдента (W. Gosset, 1908)

Число степеней свободы
Р = 0,05
Р = 0,01
1
t = 12,706
t = 63,657
2
t = 4,303
t = 9,925
5
t = 2,571
t = 4,032
8
t = 2,306
t = 3,355
10
t = 2,228
t = 3,169
14
t = 2,145
t = 2,977
16
t = 2,120
t = 2,921
20
t = 2,086
t = 2,845
30
t = 2,042
t = 2,750
60
t = 2,000
t = 2,660
120
t = 1,980
t = 2,617
?
t = 1,960
t = 2,576

Рассмотрим пример вычисления t для описанного выше эксперимента, в котором изучалось воздействие антивоенного фильма на изменение установок студентов. Пусть для контрольной и экспериментальной групп при итоговом тестировании по шкале пацифистских установок были получены следующие результаты:

Контрольная группа
Экспериментальная группа
nk = 28 чел.
Nэ = 34 чел.

Sk = 5,6
Sэ= 3,4

Наша статистическая задача заключается в том, чтобы определить, отличаются ли средние двух групп настолько, чтобы можно было отвергнуть нулевую гипотезу о том, что эти средние взяты из одной генеральной совокупности. Воспользуемся приведенной выше формулой для вычисления значения t124:


Число степеней свободы в приведенном примере: (28 ? 1) + (34 ? 1) = 60.
Полученное значение t = 3,4760 заведомо превосходит табличные значения и для p < 0,05, и для р < 0,01 (на 5%-м уровне значение t для 60 степеней свободы составит 2,00, а на 1%-м - 2,660). Следовательно, мы можем отклонить нулевую гипотезу и сделать вывод, что существует статистически значимая разница между средними уровнями пацифизма в группе студентов, посмотревших антивоенный фильм, и в контрольной группе.
Важно, однако, всегда помнить о том, что статистическая значимость результатов совершенно отлична от их содержательной значимости! Даже высокая статистическая значимость результатов эксперимента не гарантирует, что эти результаты будут иметь сколько-нибудь интересную интерпретацию и повлияют на состояние современного социологического знания. Содержательная значимость зависит прежде всего от нашей способности увязать экспериментальную гипотезу с существующими социологическими теориями.

Многомерные и факторные эксперименты:
общий обзор
В описанных выше экспериментах с контрольной группой каждый раз используются лишь два типа условий - "есть воздействие" либо "нет воздействия". Эти два типа условий по сути можно рассматривать как два уровня независимой переменной, которым можно присвоить условные числовые значения - например, "1" и "0". Иными словами, с точки зрения уровня измерения независимая переменная является номинальной, качественной. В контрольной группе ее значение равно нулю, в экспериментальной - единице. Однако исследователь часто располагает значительно большей информацией о независимой переменной и способен измерить и проконтролировать ее по крайней мере на трех-четырех уровнях значений. Соответственно экспериментальная гипотеза может быть сформулирована в терминах более или менее интенсивного воздействия либо наличия-отсутствия "отклика" зависимой переменной при конкретных уровнях независимой переменной.
В психологии хорошо известен закон "оптимума мотивации", так называемый закон Йеркса-Додсона.
В начале нашего века Р. Йеркс изучал, как влияет негативное подкрепление в форме удара электрическим током на выработку элементарных навыков у животных. В частности, в опытах с "танцующими мышами" (разновидность домашней мыши, имеющая генетический дефект, который заставляет ее двигаться по кругу или по восьмерке) он использовал три уровня силы тока - "сильный" (500 усл. ед.), "средний" (300 усл. ед.) и "слабый" (125 усл. ед.). Мышь должна была научиться выбирать один из двух туннелей. В конце туннеля ее в любом случае ожидало "вознаграждение" - мышь противоположного пола. При ошибочном выборе (белый туннель) мышь испытывала удар током, при правильном выборе (черный туннель) негативное подкрепление отсутствовало. Местоположение туннелей (слева-справа) менялось случайным образом от пробы к пробе. Выяснилось, что быстрее всего обучение происходит при "средней" величине стимуляции. Обнаруженный в этом эксперименте нелинейный характер связи между величиной стимула к решению определенной задачи и успешностью решения был затем неоднократно подтвержден и во многих других экспериментах, в том числе с испытуемыми-людьми и с позитивной стимуляцией. Чрезмерная мотивация и чрезмерная величина подкрепления, как и слабая мотивация, всякий раз оказывали меньшее воздействие на успешность выполнения различных задач.
Эксперименты, в которых используется несколько (более двух) уровней независимой переменной, называются многоуровневыми. Схема вышеописанного эксперимента с рандомизацией и тремя уровнями независимой переменной (Х1 Х2, Х3 ) такова:

R
X1
O1
R
X2
O2
R
X3
O3

Экспериментальная гипотеза в этом случае формулируется как гипотеза об отношениях значений О1, О2 и О3 (в рассмотренном примере О1 < О2 и O2 > O3). Независимая переменная в многомерном эксперименте может иметь и более трех уровней. Иначе говоря, она может быть "нормальной" количественной переменной, измеренной на интервальном или абсолютном уровне. Соответственно гипотеза многомерного эксперимента может формулироваться в более точных терминах - как гипотеза об "относительно-абсолютных" или даже "абсолютно-абсолютных" отношениях переменных. Например, в эксперименте может изучаться влияние привлекательности лектора на частоту посещения занятий студентами, воздействие количества доступных источников информации о продукте на формирование потребительских предпочтений либо характер взаимосвязи между размером денежного вознаграждения испытуемых и успешностью решения ими однотипных задач. Таким образом, многомерные эксперименты позволяют проверять более тонкие и точные содержательные гипотезы о механизмах индивидуального и группового поведения.
Статистические гипотезы, проверяемые в многомерных экспериментах, - это гипотезы о различиях между значениями зависимой переменной для разных уровней независимой переменной. Нулевая гипотеза формулируется как гипотеза о том, что разброс индивидуальных значений внутри одного уровня независимой переменной (внутри соответствующей экспериментальной группы) идентичен разбросу индивидуальных значений между различными уровнями (группами), т. е. отношение дисперсии межгрупповых оценок к дисперсии внутригрупповых оценок равно 1. Последнее отношение обозначается как F-критерий. Для того чтобы определить, не превышает ли полученная в конкретном 8 эксперименте величина F пороговое значение статистического F-распределения для заданного уровня значимости, используют статистическую технику однофакторного дисперсионного анализа. Термин "однофакторный" в данном случае означает, что в эксперименте использовалась лишь одна независимая переменная (фактор воздействия). Рассмотрение техники дисперсионного анализа и статистического оценивания получаемой в результате величины F выходит за пределы данного обзора (детальные описания и рекомендации при необходимости можно найти в книгах из списка дополнительной литературы к главе).
В тех областях социологии и социальной психологии, которые имеют сравнительно развитую традицию экспериментальных исследований (межличностное и межгрупповое восприятие, исследования динамики установок, социальные процессы в малых группах, оценивание эффективности образовательных программ и т. д.) часто используют более сложные схемы экспериментирования, объединяемые термином "факторные эксперименты".
Факторный экспериментальный план включает в себя две и более, независимые переменные (именуемые также "факторами"), каждая из которых имеет несколько уровней воздействия. Так как при увеличении числа независимых переменных очень быстро возрастает число групп, в каждой из которых применяется одна из возможных комбинаций этих переменных и их уровней125 (в полном факторном плане число групп равно произведению числа уровней, задаваемых для каждой независимой переменной), в целях экономии ресурсов и рационального распределения исследовательских усилий были разработаны многочисленные планы, где каждый из "уровней" переменных реализуется один раз, а обобщение и статистический анализ взаимодействия различных факторов и их изолированного и совместного влияния на зависимую переменную проводится на групповом уровне126.
Всякий факторный эксперимент - это, в сущности, несколько экспериментов, объединенных в одном плане. Обобщенные данные факторного эксперимента позволяют ответить на два типа вопросов: 1) имеется ли эффект воздействия для каждой отдельно взятой независимой переменной; 2) зависит ли величина этого эффекта воздействия от величины значений других независимых переменных? Изолированный эффект воздействия одной независимой переменной называют главным эффектом, а изменение величины этого эффекта под влиянием другой независимой переменной называют взаимодействием.
В таблице 4.2 представлен план простейшего факторного эксперимента "два на два" ("2 X 2"), в котором изучалось влияние новизны и типа изображения на интерес, проявляемый к этому изображению 4-месячными младенцами. В качестве индикатора интереса использовалась длительность разглядывания. Каждая из независимых переменных была представлена только двумя уровнями: для новизны - новое или старое, предъявлявшееся в предыдущих сериях изображение; для типа изображения - геометрический контур либо схематическое изображение человеческого лица (схематические рисунки использовались для уравнивания изображений по визуальной сложности, так как время фиксации взора обычно зависит от сложности и количества деталей). Как видно из приведенных в таблице 4.2 данных, налицо оба главных эффекта. Влияние новизны на интерес становится очевидным при сравнении средних по строкам - средняя длительность разглядывания изображений (и геометрических, и "физиономий") заметно выше в случае предъявления новых рисунков (55 сек против 20). Сравнение по столбцам показывает, что при усреднении данных по двум группам (новые и старые рисунки) изображения человеческого лица вызывают значительно больший интерес, проявляющийся в более длительном разглядывании (45 сек). Налицо также взаимодействие между типом изображения и новизной. Результаты предъявления разных типов изображений различны для "старой" и "новой" группы. Различаются и значения разностей по столбцам для каждой строки (60 ?50 = 10 сравнительно с 30 ?10 = 20), и соответствующие показатели по строкам (60 ?30 = 30 сравнительно с 50 ?10 = 40). Иными словами, большая привлекательность человеческих лиц сильнее проявляется при предъявлении старых рисунков (различие в 10 сек при предъявлении новых картинок увеличивается до 20 для старых изображений), а различие между предъявлением старых и новых рисунков при использовании геометрических контуров возрастало до 40 сек.
Таблица 4.2
Факторный эксперимент 2x2



Новизна изображения


Тип изображения

Средняя длительность разглядывания, сек.
Лицо
Геометрическое
Новое
Старое
60
30
50
10
55
20
Средняя длительность, cек.
45
30

При обработке результатов многофакторных экспериментов основной статистической моделью является многофакторный дисперсионный анализ.
Многофакторные эксперименты в социологии - это очень часто полевые эксперименты, моделирующие сложные взаимосвязи реального мира. Преимущество полевых многофакторных экспериментов - в их "жизнеподобии", т. е. внешней, лицевой валидности. Но здесь же кроется и главный недостаток таких экспериментов - более низкие надежность и внутренняя валидность. Критики полевых многофакторных экспериментов часто отмечают, что приближение эксперимента к реальному миру здесь нередко достигается за счет замены экспериментального контроля чисто статистическим. В последнем случае возрастают угрозы валидности, связанные с неправильной спецификацией модели измерения, с "закоррелированностью" отдельных уровней независимых переменных с неконтролируемыми внешними переменными (см. гл. 5, 6). Кроме того, в многофакторных экспериментах острее, чем в индивидуальных и межгрупповых, стоит проблема агрегирования данных - практически всегда существует вероятность того, что отношения, выявленные при анализе сводных групповых данных, в точности не соблюдаются ни для одного отдельно взятого испытуемого (так же, как среднее некоторой выборки может не относиться ни к одному конкретному выборочному наблюдению), К неоспоримым достоинствам факторных экспериментов следует отнести значительно большие возможности статистического анализа, в том числе анализа различных эффектов взаимодействия переменных-"факторов".
В социальных науках часто употребляют также понятие квазиэксперимента, или квазиэкспериментального исследовательского плана. Речь идет о панельных, трендовых и т. п. планах выборочных обследований (гл. 5). Выборочные обследования, особенно продолжающиеся или проводимые как сравнительные "срезовые" исследования для подвыборок, испытавших либо не испытавших определенное, локализованное во времени воздействие (например, социальную революцию, реформу образования или крах фондового рынка), действительно позволяют делать выводы о взаимоотношениях между интересующими исследователя независимыми и зависимыми переменными, а значит - проверять гипотезы о предполагаемых причинно-следственных связях, однако экспериментальную рандомизацию и контроль в выборочных исследованиях, как показано в соответствующих главах, здесь заменяет использование случайных выборок и специальных методов статистического анализа данных.

Дополнительная литература

Вознесенский В. А. Статистические методы планирования эксперимента в технико-экономических исследованиях. 2-е изд., перераб. и доп. М.: Финансы и статистика, 1981. Гл. 2, 3.
Гласc Дж., Стэнли Дж. Статистические методы в педагогике и психологии: Пер. с англ. / Общ. ред. Ю. П. Адлера. М.: Прогресс, 1976. Гл. 15-19.
Готтсданкер Р. Основы психологического эксперимента: Пер. с англ. М.: Изд-во МГУ, 1982.
Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Статистика, 1977.
Кэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях: Пер. с англ. / Сост. и общ. ред. М. И. Бобневой. М.: Прогресс, 1980.
Ядов В. А. Социологическое исследование: методология, программа, методы. М.: Наука, 1987.

Глава 5. Массовые опросы в социологии

Определение и истоки
Метод опроса - самый распространенный из социологических методов, определяющий "образ" социологии в глазах непосвященных и к тому же имеющий самую богатую и давнюю историю. Утверждение о том, что почти невозможно дать строгое и исчерпывающее определение того, что такое опрос, на первый взгляд кажется нелепостью. Однако в действительности представления о том, каким должен быть хороший социологический опрос, менялись так часто, что любая попытка свести определение опроса к конкретной технике сбора информации, плану исследования, типу анализа данных или характеру использования полученных сведений наверняка столкнется с трудностями. Трудности эти так существенны, что один известнейший специалист в этой области в монографии, посвященной анализу истории и перспектив опросного метода, предложил говорить о некотором "базовом типе" опроса, по отношению к которому можно было бы упорядочить все многообразие реальных опросных исследований127. Идеальной моделью он предложил считать "модель Гэллапа", т. е. тот тип опроса общественного мнения, который сложился в 1930-1940-х гг. в результате сотрудничества (и конкуренции) между основанным Дж. Гэллапом в 1935 году Американским институтом общественного мнения и другими исследовательскими фирмами. Для типичного "гэллаповского" опроса характерны следующие признаки:
1) общенациональный характер;
2) отбор из генеральной совокупности всех лиц, достигших избирательного возраста;
3) максимальная приближенность времени проведения опроса ко времени выборов или референдумов;
4) среднее число респондентов в выборке - 2000 человек;
5) случайный или квотный характер выборки;
6) использование стандартных вопросников и личное интервьюирование каждого респондента по месту жительства;
7) "закрытый" характер вопросов;
8) сбор индивидуальных, неагрегированных данных (каждое наблюдение может быть соотнесено с конкретным индивидуумом в выборке)128.
Широко распространенные отклонения от описанной "гэллаповской" нормы все же столь существенны, что нам следует рассмотреть и другие подходы к определению сути опросного метода. Во-первых, следует вспомнить о том, что для социологии как науки главной функцией опроса является все же не предсказание результатов завтрашних выборов, а проверка гипотез о характере связей между различными переменными. (Переменная-признак задается как one-рационализация неких содержательных представлений о существенном для социологической теории качестве, свойстве: "социально-экономическом статусе", "отчуждении", "расовой сегрегации" и т. п.) Во-вторых, использование выборочного обследования, как говорится в главах 7 и 8, как раз и имеет основной целью либо оценку значения определенного параметра в совокупности, либо - в большинстве случаев - проверку статистической гипотезы о связи между переменными. Эксперимент - это идеальная модель исследовательского плана для анализа причинных связей. Выборочное обследование (опрос) - хорошее приближение к идеальной модели. Для идеального эксперимента, напомним, характерны:
1) контроль условий, т. е. возможность варьирования независимых переменных и измерения зависимых;
2) использование экспериментальной и контрольной групп для проведения повторных сравнений;
3) рандомизация, т. е. случайный отбор испытуемых в контрольную и экспериментальную группы.
В выборочном исследовании, строго говоря, отсутствует возможность контроля, так как исследователь лишен возможности манипулировать независимыми переменными, произвольно задавать их значение. Однако с помощью количественных методов измерения и статистического анализа связи между переменными выборочный опрос может максимально приблизиться к той модели причинного вывода, которая лежит в основе экспериментального метода.
В целом анализ связи между переменными - и экспериментальный, и сугубо статистический, основанный на опросных данных, - подразумевает перекрестную группировку данных по двум переменным (независимой и зависимой), обнаружение связи между ними и введение третьей, контрольной переменной для оценки ее влияния на изучаемую связь. (Кстати, те возможности для контроля влияния "посторонних" факторов на исследуемую взаимосвязь, которые возникают при анализе связи в выборочных обследованиях, обычно даже превосходят возможности эксперимента.) В последнем случае набор контрольных переменных, "изолируемых" с помощью эксперимента, обычно ограничен. В выборочном обследовании список переменных чаще всего значительно обширнее и к тому же включает в себя такие переменные, которые в принципе не могут использоваться в эксперименте из практических или этических соображений: нельзя, например, произвольно назначить испытуемому экспериментальное условие "родился чернокожим" или "часто подвергался жестокому обращению" Однако заметим сразу, что последнее обстоятельство все чаще используется не столько для восхваления, сколько для критики - во многих отношениях справедливой - применимости выборочных опросов для анализа причинных связей (о чем еще будет сказано ниже).
Случайный отбор, используемый на том или ином этапе как основа построения выборки для массового опроса, может рассматриваться как подобие рандомизации в эксперименте. В идеальном случае, почти не встречающемся на практике, любая единица генеральной совокупности имеет равные шансы попасть в выборку. Поэтому влияние внешних, "посторонних" факторов нейтрализуется, и систематическое смещение отсутствует. В реальности, как показано в обсуждении выборочного метода, мы редко можем реализовать простую вероятностную выборку, довольствуясь каким-то приемлемым и экономичным компромиссом между случайным отбором, стратификацией и квотированием.
Контрольная и экспериментальная группы, используемые в экспериментальных планах для сравнения и выявления эффекта некоего причинного фактора, "отбираются" в выборочных обследованиях на стадии анализа, апостериорно. Фактически они "конструируются" исследователем ad hoc в ходе сравнения подвыборок, выделенных с помощью фиксации разных уровней одной (или нескольких) объяснительных переменных.
В целом опросные методы обладают рядом существенных достоинств:
1) позволяют достаточно быстро получить большой массив наблюдений, причем каждый индивидуальный "случай" (отдельное наблюдение) описывается с помощью целого набора теоретически релевантных переменных признаков;
2) стоимость выборочного опроса оказывается сравнительно небольшой, если принять во внимание объем получаемой информации;
3) использование стандартных опросных процедур и однородных количественных показателей при соблюдении определенных условий позволяет не только проверять гипотезы о причинных зависимостях, но и проводить вторичный и сравнительный анализ результатов.
Недостатки, также присущие этому методу, мы проанализируем в следующих разделах.

Выбор исследовательского плана
Даже в том случае, когда исследователь четко осознал, в чем заключаются содержательные вопросы, на которые он хочет получить ответ в ходе выборочного обследования; ему не стоит торопиться составлять анкету и нанимать интервьюеров. Прежде ему нужно поразмыслить над тем, какого рода логику анализа данных он собирается использовать, после того как эмпирические данные будут получены. Для того, чтобы сведения о людях, группах или сообществах (об их поведении, установках или других чертах) можно было рассматривать в качестве доказательства каких-то теоретических гипотез, следует сначала решить, что именно можно считать доказательством в данном случае, по каким правилам будут строиться логические сопоставления и статистические выводы, иными словами, необходимо выбрать принципиальный исследовательский план.
В главе 4 довольно подробно говорится о том, как различия в логике и целях анализа влияют на выбор плана эксперимента. В планировании выборочного опроса исследователи исходят приблизительно из тех же соображений: сравнение "случаев", подгрупп, сравнение типа "до - после". Здесь мы рассмотрим лишь самые общие типы исследовательских планов, используемых в выборочных опросах (другие проблемы планирования детально анализируются в главе 7, посвященной построению выборки).
Первый шаг в планировании опроса - это принятие решения о том, что считать единицей анализа. В простейшем случае мы стремимся приписать каждому индивиду (респонденту) определенное значение по каждой переменной. Предположим, наша цель заключается в том, чтобы на основании опроса 2000 респондентов узнать, как распределены в генеральной совокупности "партийная принадлежность", "судимость" и некоторые другие переменные, а кроме того, мы собираемся проанализировать связь этих переменных с полом, возрастом и семейным статусом. Некоторые из переменных будут строго количественными, другие будут описываться как качественные признаки. В любом случае нам нужно будет охарактеризовать каждого респондента по каждой переменной. В результате мы сможем построить структурированную матрицу данных, подобную той, что изображена в табл. 5.1. В столбцах этой матрицы содержится вся информация о респондентах, которые здесь и являются единицами анализа (или "случаями"). Именно их свойства нам предстоит оценивать, сравнивать в поисках взаимосвязей и т. п.
Таблица 5.1
Пример матрицы данных типа
"респонденты х переменные"

"Случай"

1-й
респондент


2-й
респондент

......

2000-й
респондент

Переменная



Пол
мужской
женский
.......
мужской
Возраст
38 лет
23 года
.......
62 года
Семейный статус
разведен
замужем
.......
вдовец
Судимость
отсутствует
отсутствует
.......
2 судимости
Партийная
конституционный
беспартийная
.......
христианский
принадлежность
демократ

социалист

Обычно единицами анализа, т. е. теми, кого исследуют, бывают именно люди. Однако единицами анализа могут быть и семьи, и организации, и регионы, и государства. Например, в матрице данных столбцы могли бы соответствовать городам, а строки - переменным типа "уровень преступности", "население", "число безработных" и т. п. Некоторые из переменных были бы получены путем агрегирования, "объединения", индивидуальных данных (например, о наличии дополнительных источников дохода), другие характеризовали бы город как целое (наличие аэропортов, доля прямых налоговых поступлений в бюджете). В любом случае исследователю нужно заранее представить себе, как будет выглядеть матрица данных и какие приемы анализа он собирается к ней применить. Любое конкретное исследование может предполагать и использование различных единиц анализа, т.е. полученная в нем эмпирическая информация может характеризовать и отдельных индивидов, и семьи, и - в результате использования агрегированных показателей - регионы или государства. Важно лишь, чтобы все единицы анализа, которые вы намерены использовать, были определены заранее. В ином случае в матрице данных "единица анализа х переменная" неизбежно возникнут пропуски или дублирование одной и той же информации. Так как количество матриц данных равно количеству предполагаемых единиц анализа (хотя размерность их будет разной129), можно заранее создать соответствующее количество отдельных массивов данных (файлов), содержащих те данные, которые относятся к данной единице анализа. Скажем, сведения о возрасте попадут в массив "респонденты", а сведения о составе семьи - в массив "семьи" (даже если последние и были получены в результате беседы с одним из членов семьи).
Описанная выше двумерная матрица данных типична для одномоментного, "срезового" исследования, характеризующего ситуацию в момент опроса. Целью такого исследования может быть, во-первых, описание распределения каких-то переменных в совокупности. Например, мы можем узнать, сколько человек собирается проголосовать за демократов при условии, что выборы будут проведены тотчас же (типичный "гэллаповский" опрос). Во-вторых, мы можем попытаться использовать "срезовые" данные для характеристики отдельных подвыборок - например, "работающих пенсионеров", "высококвалифицированных рабочих в возрасте от 30 до 45 лет" и т. п. Далее, применяя различные методы статистического анализа, можно проверить какие-то гипотезы о взаимосвязи переменных (в данный момент времени). В последнем случае исследование становится объяснительным. Однако даже в чисто описательном исследовании мы столкнемся с необходимостью каких-то сравнений, делающих полученные нами оценки осмысленными. Если, например, мы узнаем, что 15% подростков читают медицинские журналы не реже 1 раза в месяц, то для того, чтобы понять много это или мало, нам нужно будет с чем-то сопоставить этот показатель. Скажем, мы можем сравнить подростков 1994 года с подростками 1954 года. (Конечно, нам предварительно придется найти данные соответствующего опроса 40-летней давности.)
Изменениям во времени подвержены не только отдельные показатели, но и взаимоотношения между переменными. Так, глобальные социально-экономические изменения - экономический кризис, сдвиг в социально-классовой структуре - могут привести к тому, что высокая зависимость дохода от продолжительности образования станет незначимой. Следовательно, изучение сложного причинного механизма воздействия образовательного уровня на доходы требует какой-то серии разделенных во времени обследований, позволяющих проследить динамику интересующего нас отношения под влиянием существенных внешних переменных.
Исследовательские планы, позволяющие анализировать данные во временной перспективе, называют лонгитюдными. Данные получают многократно, в разные моменты времени, причем цели исследования могут быть сугубо дескриптивными (доля голосующих за коммунистов, распределение положительных и отрицательных установок по отношению к "мыльным операм") и объяснительными.
Принято выделять основные виды лонгитюдных планов, каждый из которых имеет множество модификаций и "переходных" форм. Это трендовые, когортные и панельные исследования.
Трендовые обследования ближе всего к уже описанным однократным, "срезовым", опросам. Некоторое авторы даже предлагают обозначать их просто как регулярные опросы, т. е. опросы, проводимые через более или менее равные промежутки времени130. В трендовом опросе одна и та же генеральная совокупность изучается в разные моменты времени, причем каждый раз выборка строится заново. Иными словами, анализируются последовательные выборки из одной и той же совокупности. Например, опрос Института Гэллапа, проводимый ежемесячно в ходе избирательной компании, является трендовым обследованием, показывающим динамику установок населения по отношению к кандидатам или партиям. Строго говоря, если количество тех, кто собирается голосовать за кандидата X, за месяц увеличилось на 16%, мы можем лишь зафиксировать изменение картины предпочтений избирателей, но не можем наверняка утверждать, что определенная группа избирателей изменила свои предпочтения, так как в двух последовательных опросах мы имеем дело с разными респондентами. Преимуществом оперативных трендовых исследований является возможность "привязки" наблюдаемых изменений к текущим событиям - политическим скандалам, решениям правительственных органов, изменениям в финансово-экономической ситуации, - что облегчает их интерпретацию.
Однако, например, ежегодные исследования занятости и безработицы, проводимые по этому плану, могут привести к трудно интерпретируемым результатам. Если в результате двух таких исследований окажется, что социально-демографические характеристики людей, получающих пособие, почти не изменились, будет большой неосторожностью утверждать, что существует какая-то "типичная" группа людей, постоянно живущая на средства налогоплательщиков. Вполне вероятно, что большинство респондентов, охваченных первым опросом, уже нашли работу.
В качестве особого исследовательского плана иногда рассматривают когортные обследования. Основания для выделения этого плана несколько условны и связаны скорее с теоретической логикой интерпретации (а не сбора) данных. Если в трендовых исследованиях отбор каждый раз производится из общей совокупности - всех избирателей, всех семей и т.п., - то, исследуя "когорты" (от лат. cohors (cohortis) - подразделение, видовая группа), мы каждый раз производим отбор из одной специфической совокупности, стремясь проследить перемены в ее поведении, установках и т. п. Пусть, например, мы изучали ценностные ориентации десятиклассников в 1985 году, а в 1995 году нам захотелось снова опросить бывших десятиклассников, так как мы предполагаем, что их ценностные ориентации изменились с переходом в иную стадию жизненного цикла (создание собственной семьи, формирование профессиональной идентичности и т. п.). В этом случае мы будем работать с новой выборкой из прежней специфической совокупности, сравнивая представителей одной и той же "когорты" с десятилетним интервалом, а не десятиклассников 1985 года с десятиклассниками 1995 года (в последнем случае можно было бы говорить о трендовом исследовании десятиклассников).
Самым совершенным воплощением идеи введения временной перспективы в исследовательский план является панельное обследование. Если вернуться к нашей структурированной матрице данных (см. табл. 5.1), то можно сказать, что панель - это прибавление к двумерной матрице еще одного измерения, превращающего ее в пределе в некий "параллелепипед" данных. Панельные исследования позволяют не только зафиксировать какие-то социальные изменения в установках, поведении и т. п., но и выявить причины и последствия этих изменений на микроуровне, т. е. на уровне отдельных индивидов. Если трендовое исследование показывает, что десятая часть потребителей, предпочитавших отечественные макароны, "переметнулась" к поклонникам спагетти, мы не можем точно определить, кто из респондентов изменил свои предпочтения и, следовательно, каковы общие характеристики "перебежчиков". Таким образом, мы лишены возможности проверить, какие объяснительные переменные позволяют предсказывать динамику предпочтений на микроуровне.













Время, t

Рис. 2. Элементарный план панельного исследования
(два замера - две матрицы данных)

Панельное исследование - это многократное обследование одной и той же выборки из генеральной совокупности в разные моменты времени. Эту многократно используемую выборку и называют панелью. Исследовательский план, использующий панель респондентов, - весьма дорогостоящее предприятие, требующее к тому же очень тщательной проработки всех деталей до начала опроса. В трендовом и когортном исследовании данные нередко сравниваются с данными других опросов, проводившихся ранее иными исследовательскими группами. Этот путь проще и дешевле, однако сравнимость результатов обследований, планировавшихся разными исследовательскими командами и - чаще всего - для разных целей, всегда проблематична. Возможность оценки "чистого эффекта" и величины наблюдаемых изменений - большое преимущество панельного плана. Однако эта возможность прямо зависит от величины усилий, предпринятых социологами для сохранения неизменности самой панели и инструментов сбора данных. Если, например, в первой волне панели (волной обычно называют один полный цикл опроса панели, один "замер") социолог позабыл включить в список для ранжирования тяжести преступлений квартирные кражи, то использование дополненного списка во второй и третьей волнах не поправит дела: сопоставимость полученных в панели ранжировок будет ничуть не выше, чем в случае обычных "срезовых" обследований, при более высоких затратах. Поэтому панельные исследования чаще всего используют как очень точное средство проверки конкретных гипотез в отчетливо очерченной предметной области. Выбор панельного плана в случае пилотажных или поисковых исследований совершенно неоправдан.
Панельные исследования незаменимы в проверке причинных гипотез, особенно в тех случаях, когда отсутствует "естественный" критерий для разделения независимой и зависимой переменных во времени. Например, множество "срезовых" исследований может демонстрировать устойчивую высокую корреляцию между систематическим потреблением алкоголя и проявлениями социальной дезадаптации (развод, потеря статуса и т. п.), однако лишь длительное панельное исследование может дать необходимый материал для того, чтобы решить, ведет ли алкоголизм к дезадаптации либо, наоборот, является ее следствием. Панельные исследования незаменимы и для анализа более сложных причинных моделей с отсроченными эффектами (лагами), петлями "обратной связи" и т. п.
Основным преимуществом панельного плана с сугубо статистической точки зрения является возможность отделить реальные изменения показателей от разброса, связанного с ошибкой выборки.
В случае "непанельного" опроса (трендовый опрос, сравнение данных двух независимо проведенных "срезовых" опросов) какое-то различие между двумя последовательно опрошенными выборками, значимое на 5%-м уровне, скажем, различие между 49 и соответственно 54% предпочитающих "сильную руку" институтам представительной демократии с вероятностью, превосходящей 1:20, будет связано с выборочной ошибкой, а не с радикальными переменами в политической атмосфере. Аналогичные данные панельного исследования позволяют говорить о наличии реальных изменений.
Однако не следует считать, что любое реальное изменение, фиксируемое в панельном опросе, также подлежит содержательной интерпретации с использованием теоретически "привлекательных" переменных. Во-первых, наша панель - это всего лишь выборка среди других возможных выборок (других возможных панелей). Используя панельный план, мы уменьшаем влияние ошибки выборки на значимость различий между двумя волнами, но не исключаем ошибку выборки полностью: результаты сравнений для второй (девятнадцатой, двадцатой...) панели могли оказаться иными. Далее, фиксируемые изменения могут быть связаны с низкой надежностью нашего измерительного инструмента, о чем мы еще будем говорить при обсуждении проблем измерения. Наконец, наша интерпретация результатов может оказаться необоснованной из-за изменений в самой панели. Полезно помнить, что панельное исследование по логике анализа результатов ближе всего стоит к простейшему экспериментальному плану типа "до - после". Малоприятным продолжением этого достоинства является подверженность панельного плана тем же угрозам систематического смещения (см. гл. 4). В частности, эффекты "созревания" участников панельного опроса были неоднократно продемонстрированы даже в таких нейтральных сферах, как изучение семейного бюджета или чтение газет и журналов. После двух-трех волн члены панели достоверно чаще фиксируют свои ежедневные расходы и начинают тратить на чтение газет на 10-15% больше времени. Перемены в политических установках и поведении обычно носят еще более драматический характер: политические симпатии смещаются к крайним полюсам, доля активно участвующих в выборах возрастает. Основным механизмом, отвечающим за этот эффект, является стремление индивидуума к когнитивному балансу, к поддержанию высокой степени согласованности между собственными высказываниями и действиями. Соответственно описываемый тип смещения резче выражен в панелях с маленькими интервалами между волнами. По мере увеличения промежутков между последовательными опросами - по крайней мере, до 1-2 лет - эффект "созревания" уменьшается, так как все сильнее становится влияние направленных в противоположную сторону эффектов "памяти" (вернее сказать, "забывания"): респонденты просто плохо помнят, что они говорили год или десять лет тому назад.
К сожалению, именно в тех случаях, когда панельный план социологического исследования более всего осуществим и его применение возможно и обоснованно - и с точки зрения логики анализа, и по реальным возможностям внеакадемического финансирования, - тактика увеличения интервалов между циклами панели может оказаться неосуществимой. Пример тому - предвыборные опросы, где интервалы бывают равны 1-2 неделям и редко превышают 1-1,5 месяца.
Так, интерпретация классического "Народного выбора", проведенного П. Лазарсфельдом и его соавторами исследования президентских выборов в США в 1940 году131, остается неоднозначной, хотя его основные результаты были много раз воспроизведены другими исследователями. Панель Лазарсфельда состояла из семи волн, разделенных месячным интервалом. Столь сложный план требовался для того, чтобы проследить, как меняются предпочтения американского электората в ходе выборной кампании, и какие факторы влияют на изменение решений отдельных избирателей. Самым поразительным результатом исследования оказалось то, что почти половина опрошенных ни разу не меняла свои политические предпочтения на протяжении полугода. Вероятно, немалую роль в формировании столь обширной группы "непоколебимых" сыграли описанные эффекты "созревания" в результате участия в панели.
Самый серьезный и распространенный тип смещения связан, однако, с другой постоянной проблемой всех панельных планов - проблемой "выбывания" из панели (или, что звучит несколько мрачно, со "смертностью", или "истощением", панели). Истощение панели проявляется в увеличении неучастия и "неответов" респондентов от первой волны к последующим. Некоторые респонденты оказываются недоступными для контактов: они меняют место жительства, болеют, умирают. Другие участники панели просто отказываются от следующего интервью. В результате и репрезентативность панели, и эффективный объем параллелепипеда данных, т. е. реальная возможность сравнивать ответы одного респондента в разные моменты времени, резко снижаются от волны к волне (хотя расходы на поддержание панели продолжают расти). Особенно неприятна ситуация, когда "вымирают" определенные социально-демографические группы респондентов, что приводит к непоправимым систематическим смещениям. Эта ситуация возникает не так уж редко. Исследователи, работающие в коммерческих опросных фирмах, неоднократно замечали, что в рыночных исследованиях и исследованиях аудитории газет и журналов самой высокой "смертностью" отличаются молодые участники панели, особенно учащиеся-юноши в возрасте 18-25 лет. Иногда даже увеличение платы за участие в панельном опросе с каждой последующей волной не влияет на выбывание (это должно служить слабым утешением академическим исследователям, лишенным возможности платить респондентам).
В больших общенациональных панелях. Приближающихся к "микропереписям", для борьбы с выбыванием иногда используют метод самовосстановления, особенно в случаях. Когда выборочной единицей является семья, домовладение, организация и т.п. Например, в проводимом с середины 1960-х гг. Мичиганским университетом исследовании бюджета американских семей (PSID) ежегодно опрашивается более 5000 семей. Каждый отделившийся член семьи (например. взрослый сын, решивший жить отдельно от родителей) остается в выборке в качестве новой единицы наблюдения, так что выборка остается репрезентативной по типам семей, возрасту их членов и т.п. Выбывание из этой панели за первые десять лет составило 28% исходной выборки (кстати, это совсем немного для панельного опроса), однако за счет самовозобновления, т.е. включения в выборку "отселившихся" членов семей, абсолютный размер панели за это же время даже вырос с 5000 до 5860 семей132.
Очевидно, что панельные исследования ? очень сложное, хотя и эффективное, средство проверки социологических гипотез. Вышеприведенные соображения вполне объясняют, почему панельный план используется реже других типов исследовательского плана. Панельный план практически доступен лишь для достаточно крупных исследовательских организаций и требует привлечения значительных материальных и финансовых ресурсов133, однако он абсолютно незаменим при исследовании социальных эффектов исторических изменений, сложных причинных моделей индивидуального выбора, процессов социализации и т.п. Многие социологи полагают, что оптимальным решением является использование комбинированных исследовательских планов, сочетающих в себе некоторые черты "срезовых", трендовых и панельных опросов. Самый простой из таких планов ? это ретроспективное панельное исследование, когда опрос проводится однократно. Однако включает большое количество вопросов о прошлом респондента. Например, в исследованиях профессиональной мобильности респондентов спрашивают о деталях их карьеры, периодах безработицы, причинах изменения места работы и т.п. Реконструированные таким образом "профессиональные биографии" анализируют так, как если бы они были получены в лонгитюдном обследовании. Возникающие здесь проблемы связаны, в первую очередь, с субъективными погрешностями припоминания, с изменением точки зрения на события прошлого, иногда ? с намеренным искажением информации. Так, использование ретроспективного плана в изучении зависимости социально-экономического статуса от образования может вести к неверным выводам: доказано, что большинство людей имеет склонность задним числом "завышать" свои успехи в обучении. Однако этот тип плана может оказаться достаточно эффективным, например при сравнительном изучении динамики занятости замужних и незамужних женщин. Основное достоинство ретроспективного плана ? радикальное решение проблемы выбывания.
Более сложные типы комбинированных планов используют в микро-переписях, общенациональных обследованиях занятости и безработицы, преступности и т.п. Очень эффективны циклические планы с замещением, где в каждой последующей волне какая-то доля исходной выборки "отдыхает", будучи замещенной новой эквивалентной подвыборкой. Скажем, если в ежегодном опросе треть панели каждый раз замещается, то каждая из исходных "третей" будет опрошена от одного до трех раз, прежде чем состав участников полностью обновится. "Поперечный" и "продольный" анализ позволит и учесть эффекты участия (при сравнении результатов "кратковременных" и "длительных" респондентов), и дать текущую картину распределения переменных по социальным группам, и зафиксировать резкие изменения. Иногда часть вопросов предъявляется лишь сравнительно небольшой подвыборке, имеющей характеристики "фокусной" группы (например, только матерям-одиночкам, получающим социальные пособия), что позволяет проанализировать динамику поведения и мнений "труднодоступных" популяций. Нередко общую базу данных поддерживает и анализирует одна исследовательская группа, а для анализа "периферийных" тем и специфических подвыборок привлекаются эксперты из других институций. Объективная логика развития регулярных опросов, основанных на комбинированных исследовательских планах, явно ведет к созданию междисциплинарных, многоцелевых проектов и баз данных, имеющих множество источников финансирования (таковы, например, некоторые общенациональные лонгитюдные исследования преступности, здоровья населения). Соответственно все выше ценятся услуги методологов, специализирующихся в планировании исследований, стандартизации показателей, социологическом измерении.

Концептуализация и измерение: общий обзор
Избрав определенный исследовательский план, социолог может сказать, что он будет рассматривать в качестве "случаев" в структурированной матрице данных (табл. 5.1) и какой будет логика сравнений между случаями на стадии анализа. Теперь ему предстоит решить, какими будут его исследовательские переменные - строки матрицы данных - и как будет осуществлен переход от теоретического понятия к измеряемому показателю. Решение этих двух взаимосвязанных проблем - концептуализации и измерения - необходимое условие перехода к разработке анкеты, плана интервью, схемы эксперимента и к сбору данных. Отметим сразу, что речь идет лишь о предварительном решении, так как многие исследовательские задачи, связанные с измерением и истолкованием теоретических конструктов, возникают позднее, на стадии анализа данных (и будут рассмотрены нами в соответствующих разделах).
Понятия социологической теории ? скажем, "отчуждение", "культура бедности", "социальный статус" или "коронарный тип личности"134 - используются в качестве элементов для построения неких теоретических моделей, описывающих отношения между понятиями. Предположения о характере таких отношений - это собственно исследовательские гипотезы.
Сложная структура социологических теорий не позволяет говорить о простой и однозначной их проверяемости. Как говорилось ранее (см. гл. 1), правдоподобие гипотез оценивается не в каком-то абсолютном смысле, а лишь относительно целой совокупности других вспомогательных гипотез, явно или неявно связанных с теоретическим "ядром". По этой причине сколько-нибудь разработанные теоретические модели оказываются довольно сложными, и их предварительное описание (спецификация) - это необходимое условие любой эмпирической проверки.
Эмпирическое "истолкование" теоретических понятий в качестве переменных в матрице данных (их концептуализация) и перевод этих понятий на язык наблюдаемых признаков, т. е. измерение, могут оказаться довольно сложными процедурами, в чем-то сходными с процедурами построения теоретической модели. На первый взгляд, некоторые типы переменных не создают вовсе никаких проблем для измерения, так как они очень близки к тем способам категоризации, которые мы употребляем в повседневной жизни (например, пол, возраст). Другие же, более абстрактные теоретические конструкты - отчуждение, социально-экономический статус или расовая сегрегация, - явно требуют большего, чем формулировка одного показателя или одного вопроса анкеты. Ясно, что уточнение теоретического понятия и поиск соответствующих индикаторов в этом случае может быть только результатом специальной аналитической работы. Конечная цель такой работы - создание модели измерения, в которой будут определены (специфицированы) все предполагаемые связи между теоретическим конструктом (понятием) и теми эмпирическими показателями, которые мы намерены использовать для его измерения. В этой модели нам придется также сделать некоторые предположения о возможных ошибках измерения (их случайном или систематическом характере). Ведь в действительности даже сравнительно простые и очевидные показатели, фиксируемые с помощью одного стандартного вопроса, могут быть подвержены влиянию не только случайных ошибок, связанных с невнимательностью или погрешностями выборочной процедуры. Может быть, например, незамужние женщины склонны систематически занижать свой возраст? Если обратиться к "случаю Агнессы", описанному в главе 3, можно увидеть, что даже биологический пол в некоторых случаях трудно определить однозначно. Пример столь простого признака, как "пол", позволяет увидеть и другую сторону проблемы: прежде чем искать подходящий показатель, нужно решить, как мы намерены интерпретировать соответствующее понятие в нашей теории. Если мы, к примеру, собираемся проверить гипотезу о влиянии половой идентичности на социальные достижения, то нам недостаточно просто разбить наших респондентов на "муж." и "жен.": внутригрупповой разброс показателей успешности наверняка окажется очень велик и вся наша объяснительная схема "поплывет". В действительности нам лучше интерпретировать "половую идентичность" как некий континуум, плавный переход от одного жесткого полоролевого стандарта к другому, от крайней "маскулинности" к "фемининности". Используя соответствующие показатели и шкалы, мы скорее всего обнаружим, что большего социального успеха добиваются люди, не следующие жестким предписаниям традиционной половой роли.
Итак, первый шаг в поиске индикаторов для теоретических понятий - это прояснение самих понятий. Теоретические переменные, в отличие от платоновских идей, не существуют "сами по себе", ожидая когда мы наткнемся на них. Они не имеют какого-то абсолютного, раз и навсегда определенного значения. Их значение определяется контекстом употребления, концептуальной схемой, которую мы используем. Например, если мы используем "религиозность" как понятие, характеризующее роль некой конфессии в политическом укладе национального государства, наибольший интерес для нашего исследования могут представлять агрегированные (т. е. относящиеся к надындивидуальному уровню) переменные, показывающие роль церкви в поддержании нормативной системы общества, в принятии политических решений. Показателями здесь могут быть количество церковных приходов, наличие обязательных уроков закона божьего в государственных школах, участие церковных иерархов в работе законодательной власти и т. п. Если целью нашего анализа является индивидуальная "религиозность", то нас скорее заинтересует широкий спектр поведения и установок от институциональной религиозности, связанной с участием в церковных обрядах, верой в спасение души и т. п. до расплывчатой убежденности в том, что "существуют некие сверхъестественные силы", или даже до устойчивого интереса к астрологическим прогнозам.
Конечно, мы можем заключить, что отсутствие абсолютного, самоочевидного смысла в теоретических понятиях дает нам полную свободу в их определении. Но такое заключение будет ошибочным. Во-первых, теоретическое понятие, неповторимый смысл которого известен только самому теоретику, обладает всеми достоинствами, кроме одного - оно больше не может служить средством коммуникации. Дабы этого не случилось, лучше всего давать определения, понятные не только вам, но и другим: все же наука - это коллективное предприятие. Более того, нужно соотносить собственные определения понятий с теми, которые использовались вашими предшественниками, в том числе и теми, чьи теоретические взгляды противоположны вашим. Ценность теоретического понятия - в его включенности в более широкую сеть теоретических представлений, во множестве связей с другими понятиями. Попытки начать с "нулевой ступени" ни к чему хорошему не ведут. Даже если вам отвратителен марксизм как идеология тоталитаризма, невозможно сказать что-то содержательное и интересное о таких вещах, как "классы" или "отчуждение" без учета того, что сказал о них Маркс.
В работе по уточнению теоретических понятий можно выделить три стадии. На первой стадии нужно составить по возможности полный список существующих определений интересующего нас понятия. Основной путь здесь - анализ литературы. Часто приходится анализировать и те смыслы, которые придаются какому-то понятию в обыденной речи: понятия повседневного языка редко обладают достаточной степенью формальной строгости, но их многозначность иногда позволяет выразить неочевидный и нетривиальный взгляд на вещи. Например, анализ того контекста, в котором употребляются понятия "стресс" или "психологическая травма", открывает широкий диапазон жизненных событий - от развода до потери работы. Если мы изучаем влияние травмирующих жизненных событий на рост хронической заболеваемости, нам не обойтись без анализа субъективного смысла различных событий для разных людей. На этом этапе могут оказаться полезными неформальные глубинные интервью, групповая дискуссия, анализ доступных биографических материалов и т. п. В результате описанной работы по обобщению существующих определений (научных и обыденных) мы получаем возможность исходить из достаточно общего и разделяемого большинством исследователей определения. Так, в работе Дж. Хиллери135 перечислено 94 определения понятия "сообщество" (community), большая часть которых включает три основных признака: локальная область расселения; общие связи, основанные на чувстве идентичности с группой; социальное взаимодействие.
На второй стадии мы осуществляем и обосновываем свой выбор трактовки понятия. Обоснование необходимо и в том случае, если мы решили использовать общепринятое определение, и тогда, когда нами предложено нечто абсолютно новое. Позднее, в ходе анализа данных, наша теоретическая модель скорее всего будет уточняться, но и в сборе, и в анализе данных мы будем руководствоваться принятым рабочим определением. Так, если мы решим, что социологический смысл понятия "профессия" заключается в способе регуляции рыночных условий в пользу определенной группы, ограничивающей и контролирующей доступ новых членов в свои ряды, мы скорее всего сосредоточим свое внимание на таких аспектах профессионализма, как автономия, контроль над процессом определения "внештатных" ситуаций и приписыванием ответственности, обучение новичков и управление "публичным" образом профессиональной группы. При этом мы, возможно, не уделим того же внимания таким аспектам профессионализма, как отношения с потребителями товаров или услуг, контроль над определенными ресурсами и т. п.
Большинство полученных нами определений будут многомерными, т.е. они будут включать в себя более одного аспекта или измерения. Поэтому на третьей стадии следует отчетливо очертить существующие аспекты понятия и, возможно, выбрать те из них, с которыми мы собираемся работать. Во-первых, выделение отдельных измерений в многомерном теоретическом понятии необходимо для того, чтобы найти соответствующие индикаторы для каждого из измерений. Во-вторых, в социологии мы часто используем категориальные переменные, состоящие из множества взаимосвязанных признаков, т. е. двух, трех или более качественных категорий. Примерами здесь могут служить пол, профессия, семейный статус, религиозная конфессия и т. д. Нередко признаки, составляющие категориальную переменную, могут быть упорядочены по какой-то ординальной шкале. Скажем, социальный статус может быть низким, средним или высоким. Анализ размерности теоретического понятия, представляемого с помощью такой категориальной переменной, позволяет выявить различия между упорядочениями категорий по разным измерениям. Упорядочение религиозных конфессий по престижности будет отличаться от их упорядочения по степени религиозного фундаментализма. Сделав явным это различие между смысловыми измерениями теоретического понятия, мы обезопасим себя от ошибочных выводов о характере взаимосвязей данной переменной с другими, т. е. от ошибок на стадии анализа данных.
Прояснив теоретические понятия, используемые в нашем исследовании, мы переходим к следующей важной задаче - поиску конкретных индикаторов для этих понятий. Нередко эту стадию работы называют стадией операционализации понятий (о том, почему это обозначение является не вполне точным, будет сказано чуть ниже). Если, скажем, в исследовании профессиональной мобильности ученых мы используем понятие "престижность университета", нам необходимо решить, в чем, собственно, выражается престижность: в высоком проходном балле на вступительных экзаменах, в количестве ежегодно проводимых международных конференций, в среднем индексе цитирования для профессоров и преподавателей? Возможно, полезной для определения престижности будет экспертная процедура - например, престижность американских университетов определяется в ходе регулярных опросов ведущих специалистов в разных областях знания. Под операционализацией, таким образом, понимают процесс связывания теоретического понятия с эмпирическими наблюдениями, где последние выступают индикаторами, показателями каких-то свойств, относящихся к данному понятию. Предполагается, что, скажем, результаты оценивания респондентами престижности университетов показывают высокий или низкий престиж данного рода заведений приблизительно так же, как показания стрелки манометра показывают давление. Однако аналогия здесь весьма условна. Измерение в социологии обычно носит непрямой характер: отдельный индикатор может отражать влияние более чем одной переменной, а каждая переменная может иметь множество индикаторов, т. е. операциональные определения теоретических понятий в социологии отличаются от таковых, скажем, в физике.
Многие эмпирические индикаторы могут рассматриваться как взаимозаменяемые. Идея взаимозаменяемости индикаторов была впервые проанализирована П. Ф. Лазарсфельдом. Так как измерение носит непрямой характер, ни один из существующих индикаторов не будет совершенным или безупречным. Хотя в определенной исследовательской ситуации можно указать причины, по которым один индикатор лучше другого, в сущности они взаимозаменяемы. "Истинное значение" переменной - это какая-то функция значений показателя и ошибки измерения. Поэтому измерение значения переменной и проверка гипотез о связях между индикаторами требуют использования множества показателей (более детальное обсуждение этого вопроса содержится в главе 6). На практике социологи чаще всего используют несколько индикаторов для каждой существенной теоретической переменной, объединяя их на стадии анализа в некоторый суммарный показатель (индекс), или строя шкалу. То, как соотносятся индикаторы и теоретическая переменная, описывается с помощью модели измерения. В простейшем случае, когда все индикаторы (обозначаемые прописными латинскими буквами - Х1, Х2, X3, Х4) являются следствиями, результатами действия латентной, т. е. не наблюдаемой непосредственно переменной X, модель измерения будет выглядеть, как на рис. 3.
Обозначения a, b, с, d относятся к коэффициентам, показывающим влияние латентной переменной на конкретный индикатор (они, как мы увидим позднее, выражают надежность этого индикатора), а е. (т. е. е1, е2, е3 ... и т. д.) - это



А b c d









Рис. 3. Модель измерения латентной переменной с четырьмя индикаторами

ошибка измерения i-гo индикатора. Для ошибок в этой модели предполагается, что они не скоррелированы друг с другом (cov (ei ej) = 0) и с истинным значением X, а их средняя равна 0. В модели, представленной на рис. 3, все индикаторы - это так называемые эффект-индикаторы, все они находятся под влиянием X, и сила связей a, b, с, d соответствует "силе" этого влияния.
Модели измерения с латентной переменной и эффект-индикаторами очень популярны в социальных науках. Причина этой популярности в нашей склонности объяснять явные поступки людей, в частности, ответы на вопросы анкеты или выполнение тестовых заданий, неким внутренним свойством, качеством, навыком или предрасположенностью. Латентная переменная может быть, например, интеллектом, измеряемым с помощью индикаторов-тестов. Другой пример: мы можем полагать, что участие в выборах и ежедневное чтение политических новостей в газете - это индикаторы латентной "политической активности" или "вовлеченности в политику".
Однако использование эффект-индикаторов - это не единственная возможность. Например, мы можем использовать такие индикаторы, как потеря работы, развод, болезнь для измерения латентной переменной "жизненный стресс". В этом случае мине предполагаем, что латентная переменная является причиной своих индикаторов136, скорее травмирующие жизненные события могут быть причиной стресса. Если мы имеем дело с какой-то из распространенных моделей социально-экономического статуса, в ней тоже будут присутствовать не эффект-индикаторы, а причинные (или формативные) индикаторы, т. е. индикаторы, значения которых детерминируют, определяют значение латентной переменной. На рис. 4 изображена элементарная модель латентной переменной с причинными индикаторами (Yl - Y4 - это индикаторы, Y- латентная переменная).
Если Y - это социально-экономический статус (СЭС), то Yl - Y4 могут представлять собой доход, образование, престиж профессии данного человека и "качество" его жилья (стоимость, престижность района и т.п.).








Рис. 4. Модель измерения с латентной переменной
и причинными индикаторами

Ясно, что скорее доход является причиной СЭС, чем наоборот. Несмотря на кажущееся сходство моделей измерения, изображенных на рисунках 3 и 4, их "поведение" на стадии анализа будет очень разным. Разными могут оказаться и методы оценки качества индикаторов для этих моделей. Даже без специального анализа можно сказать, что в модели с эффект-индикаторами (рис. 3) всякий "хороший" индикатор должен чутко реагировать на рост или убывание латентной переменной и изменяться "в согласии" с остальными. В модели, изображенной на рис. 4, дело обстоит не так просто: если, скажем, возрастет доход - возрастет и статус, но образование или профессиональный престиж вполне могут не измениться, остаться на прежнем уровне. Другое очевидное отличие связано собственно с отбором индикаторов: для модели на рисунке 3 любой "хороший" (т. е. надежный и валидный, см. гл. 6) эффект-индикатор может заменить любой другой, и их общее число вполне можно сократить: скажем, высокие результаты выполнения одного "хорошего" теста интеллекта будут достаточно надежно предсказывать результаты бесчисленного множества других тестов. Если же мы попытаемся убрать какой-то причинный, формативный индикатор, то изменится не только объем нашей анкеты - изменится сама латентная переменная, которую эти индикаторы собственно и составляют: так, стоит "убрать" доход из числа индикаторов СЭС, как мы уже будем изучать что-то вроде социального, но уж никак не экономического статуса. Приведенные примеры позволяют понять, почему так важно явно задать модель измерения, связывающую индикаторы, которые мы собираемся отобрать, с теоретическими понятиями.
Многие реальные модели измерения еще сложнее только что описанных. Индикаторы могут быть скоррелированы между собой и, что хуже, с ошибками измерения, в число индикаторов могут одновременно входить и эффект-индикаторы, и индикаторы-причины. Часто разработка модели измерения ведет к радикальному прояснению теоретических гипотез и понятий, которые на предыдущих стадиях исследования носили чрезмерно абстрактный и общий характер. Так, социолог, стремящийся найти индикаторы, скажем, "межэтнической напряженности", попытается по меньшей мере разделить "причины" и "эффекты" среди таких показателей напряженности, как поселенческая сегрегация (склонность представителей этнических групп к компактному и раздельному поселению) отсутствие семейных и дружеских связей с представителями "чужого" этноса, число столкновений и вооруженных конфликтов, недоброжелательное освещение "чужаков" в местной прессе и т. п. В ходе такой работы он наверняка сделает более ясными и отчетливо сформулированными свои представления о механизмах возникновения межэтнической напряженности и ее последствиях.
В целом при поиске и отборе индикаторов полезно руководствоваться некоторыми общепринятыми правилами:
I. Используйте индикаторы, применявшиеся в более ранних исследованиях. Существует множество устоявшихся и проверенных индексов (т. е. суммарных показателей) и шкал, свойства которых достаточно известны. При возможности проверьте, насколько хорошо "работают" эти показатели в вашем случае, проведя небольшое разведочное (пилотажное) исследование. Сориентироваться в многообразии существующих показателей и шкал помогают соответствующие справочные издания и тематические обзоры137.
2. Если общепринятого способа измерения для какого-то понятия не существует, попытайтесь разработать множество индикаторов для различных определений понятия и проверьте, как различия индикаторов будут влиять на различия в интерпретации результатов. Имея дело с многомерным понятием, стоит подумать, какие именно измерения, аспекты понятия существенны в рамках вашей исследовательской гипотезы.
3. Обычно установки и мнения имеют более сложную структуру и требуют использования большего количества индикаторов, чем, например, поведенческие события. Конечно, решающее слово в определении количества индикаторов (количества вопросов в анкете) принадлежит практическим соображениям. Пилотажные исследования, интервьюирование "фокусных" групп могут оказаться полезными в отборе индикаторов и исключении лишних вопросов. Они также важны для оценки надежности и валидности показателей (см. гл. 6).
Прежде чем перейти к практическим проблемам конструирования вопросов для анкет и интервью, мы коротко рассмотрим уровни измерения, так как общее представление об уровнях измерения понадобится нам при обсуждении логики построения вопросов и ответов и использования шкал.

Уровни измерения
Существует несколько концепций измерения, по-разному определяющих, что может быть названо операцией измерения. В гуманитарных науках - и социология не является исключением - наибольшее влияние имеет репрезентационная концепция измерения, впервые детально обоснованная психофизиком С. С. Стивенсом. В этой концепции всякая операция измерения в конечном счете определяется как приписывание чисел вещам (свойствам, событиям) в соответствии с определенными правилами, так что отношения между числами отражают (или представляют, репрезентируют) отношения между вещами. Таким образом, измерение представляет определенные свойства в виде чисел, поддающихся суммированию, сравнению и т. п. Однако наша возможность измерить какие-то эмпирически наблюдаемые свойства, представить отношения между вещами в виде чисел редко носит абсолютный характер. О некоторых эмпирических свойствах мы можем сказать, что они выражены "больше" или "меньше" для каждого конкретного наблюдения, но не можем указать случаи, когда это свойство абсолютно отсутствует: так, даже если испытуемый не решил ни одной задачи, мы едва ли осмелимся утверждать, что он полностью лишен "интеллекта". Иногда наша способность измерять ограничена лишь возможностью отнести какую-то вещь (наблюдение) к определенному классу, причем между разными классами нельзя задать отношение порядка (больше - меньше). Иными словами, при измерении отношения между числами как-то зависят от отношений между вещами, и, следовательно, существуют ограничения для возможных преобразований чисел: игнорируя эти ограничения, мы теряем право утверждать, что наши числа что-то представляют, репрезентируют. Правила приписывания чисел вещам, используемые нами в каждом конкретном случае, воплощают в себе эти ограничения и определяют достигнутый уровень измерения (номинальный, порядковый, интервальный, абсолютный).
Номинальные измерения
Номинальным измерением называют процесс отнесения объектов в классы. Все, что мы можем сказать об объектах, сгруппированных в один класс, - это то, что они идентичны в отношении некоторого свойства или признака, т. е. фактическое отношение между объектами - это отношение тождества (или различия). Для обозначения полученных классов могут использоваться и названия свойств, и числовые символы. Скажем, мы можем обозначать символом "0" мужчин, а символом "1" - женщин. Однако нельзя сказать, что признак "является мужчиной" в каком-то отношении меньше признака "является женщиной", или что "сумма одного мужчины и одной женщины равна единице". Хотя номинальные измерения довольно примитивны, они отнюдь не бесполезны, в чем мы убедимся при обсуждении методов анализа данных. Другими примерами номинального измерения могут служить национальность или место жительства.
Порядковые измерения
Измерение на порядковом (ординальном) уровне предполагает, что мы способны упорядочить объекты по степени выраженности свойства или признака, т. е. определить для них отношение "больше-меньше". Например, мы можем говорить о низком, среднем или высоком социальном статусе или низкой, умеренной или высокой коммуникабельности. Однако в случае порядкового измерения мы не можем определить точно, насколько велико расстояние между соседними категориями. Иными словами, мы не можем утверждать, что человек, получивший оценку "3" по шкале популярности, в три раза более популярен, чем получивший оценку "1", или что расстояние между категориями "48" и "45" по порядковой (ординальной) шкале равно расстоянию между категориями "22" и "19". Иными словами, ординальное измерение задает отношение порядка между категориями какого-то свойства, но не позволяет говорить о том, "на сколько" или "во сколько раз" одна категория больше другой, т. е. ни точка отсчета (абсолютный ноль), ни единица измерения здесь не могут быть определены.
Интервальный уровень измерения
Об интервальном уровне измерения можно говорить тогда, когда мы способны не только определить количество интересующего нас свойства в эмпирических наблюдениях, но также определить равные расстояния между категориями, т. е. ввести единицу измерения. Соответственно числовое приписывание становится здесь менее произвольным: объекту (наблюдению) присваивается число, соответствующее количеству измеряемого свойства, т. е. мы можем установить отношения равенства уже не между самими объектами, а между интервалами числовой шкалы: равные разности чисел соответствуют равным разностям значений измеряемого свойства или признака. Классический пример интервального измерения в физических науках - это измерение температуры по шкале Цельсия (или Фаренгейта). Единицы измерения - градусы - равны, однако "0" - это произвольная точка. При 0°С вода замерзает, однако свойство "иметь температуру" отнюдь не исчезает. Если нулевая точка неабсолютна, то бессмысленно утверждать, что 30°С предполагают в три раза больше свойства "температура", чем 10°С.
Шкала температуры Кельвина, как известно, начинается с абсолютного нуля, и этот абсолютный нуль имеет определенный физический смысл (вспомните термодинамику), так что можно даже сказать, что здесь "температура кончается". Шкала Кельвина - это шкала отношений. То же можно сказать и о физическом измерении расстояний, в частности, об измерении роста. Человек, имеющий рост в 2 метра, в два раза выше ребенка, чей рост 1 метр. Возраст человека, доход - другие примеры шкалы отношений.
Зачем учитывать уровень измерения?
Во-первых, отметим, что наше изложение существующих представлений об уровнях измерения - пусть оно и было далеко не полным138, позволило заметить, что хотя приписывание чисел объектам возможно практически всегда, далеко не все операции над полученными числами будут иметь какой-то смысл. Соответственно далеко не все методы группировки и статистического анализа данных уместны для номинального или, скажем, интервального уровня измерения (с ними социологам чаще всего приходится иметь дело). Существуют различные техники анализа для разных уровней измерения переменных. Специальные методы построения социологических шкал, о которых будет говориться далее, также основаны на определенных представлениях о метрике переменных, т.е. об уровне их измерения. Все эти соображения должны быть приняты во внимание и при конструировании инструмента сбора данных, например, вопросника. Если мы хотим анализировать переменную "образование" по крайней мере на интервальном уровне, нам, вероятно, лучше использовать показатель "количество лет, затраченных на получение образования" и включить в анкету соответствующие вопросы. Однако если наша цель ? всего лишь показать, что лица с высшим образованием или ученой степенью чаще выписывают научно-популярные журналы, достаточно будет использовать привычные "ординальные" категории ? неполное среднее, среднее, высшее и т.п. (кстати, при анализе они, возможно, будут рассматриваться как номинальные).
Важно помнить, что каждая переменная может быть измерена на разных уровнях. Выбор определяется практическими соображениями, требованиями к качеству измерения (как правило, существует обратная зависимость между уровнем и качеством измерения, о чем еще будет говориться дальше), предполагаемой стратегией анализа данных. Практически всегда данные, позволяющие получить высокий уровень измерения, могут быть перегруппированы так, что уровень измерения станет ниже (обратное утверждение, к сожалению, неверно). Например, при анализе мы можем разбить наших респондентов на три возрастные категории, хотя в опросе использовали семь. Важно, однако, и то обстоятельство, что исследователь, использующий наши данные для вторичного или сравнительного анализа (возможно, мы и сами захотим к ним вернуться) сможет пользоваться "сырыми" более дробными категориями.

Общие правила конструирования опросников
Исследователь может использовать различные техники сбора данных: наблюдение, контент-анализ, анкетный опрос, интервьюирование и т. п. Самой распространенной техникой все же является опрос. Используемые в ходе опроса анкеты могут заполняться самими респондентами или специально обученными интервьюерами. В любом случае каждый из респондентов отвечает на фиксированные вопросы.
Используя стандартный инструмент сбора данных - анкету, опросный лист, социолог получает те сведения, которые позволяют заполнить матрицу данных "респонденты х переменные". Те пропуски в данных, которые возникли из-за неясности вопросов, неопределенной интерпретации ответов или нежелания людей отвечать на предложенный вопрос, обычно нельзя восстановить, вернувшись домой к респонденту. Поэтому так важно продумать заранее, какие вопросы следует задать.
Решающим соображением в выборе вопросов, которые будут заданы респонденту, является осуществленный исследователем выбор индикаторов теоретических понятий (см. выше): например, изучая влияние успехов в учебе на коммуникабельность студентов, мы задаем конкретные вопросы об экзаменационных оценках, числе друзей среди сокурсников, участии в самодеятельности, посещении студенческого бара и т. п. Если наше исследование является скорее объяснительным, чем сугубо описательным, полезно представить себе схематически ту теоретическую модель, которую мы намерены проверить, снабдив каждый теоретический конструкт "его" индикаторами.
Рассмотрим это на примере. Предположим, наша теоретическая модель сводится к простой гипотезе: люди, подвергавшиеся преступным посягательствам или бывшие свидетелями преступлений, т. е. имеющие "опыт жертвы", в большей степени поддерживают применение высшей меры наказания. Схематически наша гипотеза представлена на рис. 5.



Рис. 5. Схема, иллюстрирующая зависимость поддержки
смертной казни (ПСК) от "опыта жертвы" (ОЖ)

Естественно, мы постараемся найти достаточное число индикаторов и к независимой ("опыт жертвы"), и к зависимой (поддержка смертной казни) переменным. Разрабатывая понятие "опыт жертвы", мы можем решить, например, что здесь существенны не только реальные биографические факты, но и информированность человека об уголовных происшествиях, основанная на общении с друзьями и близкими, устойчивый интерес к соответствующим сообщениям в газетах или теленовостях, а может быть, и некоторые психологические факторы - уровень тревожности, идентификация с жертвой и т. п. Выбирая индикаторы для зависимой переменной, мы должны будем по крайней мере учесть возможные различия в диапазоне и интенсивности выражаемой респондентами поддержки смертной казни, что также приведет нас к целому "вееру" прямых и косвенных показателей. Нельзя не признать, в частности, что существует какое-то различие между людьми, требующими расстрела на месте запорчу телефонного автомата, и теми, кто полагает, что единственным "показанием" к смертной казни может быть убийство при отягчающих обстоятельствах. Возможно, следует также признать существенным различие в силе убеждений между теми, кто поддерживает высшую меру "вообще", и теми, кто при необходимости сам готов пристрелить преступника.
Каркас теоретической модели, изображенной на рис. 5, начнет таким образом обрастать какими-то операциональными индикаторами независимой и зависимой переменных, постепенно превращаясь в конкретную модель измерения (см. рис. 6).
(Отметим, что индикаторы независимой переменной в данном случае - это формативные индикаторы, т. е. индикаторы-причины.) Пропуски в схеме, представленной на рис. 6, подразумевают наличие других, не рассмотренных нами показателей. Отсутствие стрелки и вопросительный знак в связи "личностная тревожность - опыт жертвы" отражают не столько неясность направления этой причинной связи, сколько другое важное обстоятельство: в нашей теоретической схеме мы забыли учесть контрольные переменные, которые могут влиять на отношение между зависимой и независимой переменными или даже полностью определять это отношение. В разделе, посвященном анализу данных, мы увидим, как учет контрольной переменной может полностью менять характер наблюдаемой






















Рис. 6. Дополненная схема для примера с поддержкой
смертной казни

связи. Пока же достаточно заметить, что личностная тревожность может быть опосредующей переменной, т. е. может оказаться, что связь "опыта жертвы" и "поддержки смертной казни" очень высока для высокотревожных опрошенных и совершенно незначима в других группах: действительно, люди с высокой личностной тревожностью139 склонны к аффективной переоценке даже незначительных происшествий, поэтому, при прочих равных, их "опыт" всегда будет обладать большей субъективной значимостью. Среди других возможных контрольных переменных почти всегда будут фигурировать фоновые социально-демографические факторы, подобные возрасту, образованию, социальному классу и т.д.
В последнем утверждении нет ничего загадочного: принадлежность человека к устойчивой социальной группе - к тому же воспринимаемой другими людьми как таковая - в немалой степени "формирует" его поведение и установки, определяет горизонт нормативных ожиданий и т. п.
Достигнутая ясность теоретической схемы исследования (в нашем вымышленном примере с поддержкой смертной казни - скорее недостаточная) дает нам вполне практический ориентир для отбора анкетных вопросов. Составляя анкету, мы, во-первых, включим в нее вопросы, позволяющие измерить зависимую переменную (переменные) и, во-вторых, постараемся убедиться в том, что все объяснительные, независимые переменные также переведены на язык соответствующих вопросов. В-третьих, мы осуществим поиск вопросов, относящихся к возможным контрольным переменным, не забыв о стандартных "паспортных" вопросах, которые будут касаться пола, возраста, рода занятий, образования, семейного статуса и т. п., т. е. будут измерять фоновые переменные.
До сих пор мы говорили лишь об отборе вопросов, которые составят "ядро" нашего инструмента сбора данных. Теперь нам предстоит обсудить, как эти вопросы могут формулироваться и оцениваться и, кроме того, как из множества вопросов может быть составлен макет анкеты.
Специальные методические исследования показывают, что формулировка вопроса имеет решающее значение для качества данных. Но даже основываясь исключительно на здравом смысле, можно предположить, что вопросы и предлагаемые подсказки (альтернативы ответов) должны быть ясными, недвусмысленными и удобочитаемыми. Каким бы ни был формат вопроса - открытым, полузакрытым или закрытым140, - его словесная форма должна гарантировать возможность двусторонней коммуникации между исследователем и респондентом.
Д. де Вос свел те требования, которые обычно предъявляют к словесной формулировке вопроса, в удобный контрольный список, которым можно руководствоваться в практической работе141. Мы изложим основные правила формулировки вопросов, руководствуясь этим контрольным списком:
1. В словесной формулировке вопроса следует избегать использования специальных терминов или сленга. Чаще всего специальные термины в вопросах - результат того, что социолог не смог достаточно отчетливо операционализировать исходное понятие, найти его эмпирические эквиваленты в повседневном поведении или высказываниях людей. Вопросы типа "Является ли Ваша семья нуклеарной?" или "Поддерживаете ли Вы либералистскую концепцию роли государства в экономике?" свидетельствуют о том, что ученый пытается решить свою теоретическую проблему посредством прямого опроса общественного мнения. Смешение собственно исследовательского вопроса с вопросом к респонденту допустимо лишь в одном случае - в опросе экспертов, когда целью как раз и является расширение компетентности исследователя путем учета мнений высококвалифицированных специалистов. Использование жаргонных выражений обычно свидетельствует о стремлении социолога быть понятным, "своим", разделяющим проблемы опрашиваемых. Эти похвальные усилия нередко, однако, оказываются бесплодными, так как далеко не все респонденты принадлежат к одной и той же субкультуре, да и не всем придется по душе предложенный неформальный тон. Конечно, часть подростков сразу поймет, что имеется в виду, когда их спросят "Доводилось ли тебе баловаться "травкой"?", но это необязательно сделает их ответы более откровенными. Кроме того, многие могут просто не понять точный смысл вопроса.
2. Стремитесь к коротким формулировкам. При прочих равных, чем меньше слов в вопросе и предложенных альтернативах ответа, тем меньше шансов, что вас неправильно поймут. (Разумеется, и эту рекомендацию не стоит доводить до абсурда: вопросы не должны превращаться в намеки.)
3. Проверьте, не является ли вопрос многозначным, т. е. не содержит ли он в себе двух или более различных по смыслу вопросов, на каждый из которых можно получить независимый ответ. Простой, на первый взгляд, вопрос - "Когда Вы в последний раз читали газету "Известия"?" - в действительности требует двух разных вопросов, первый из которых должен касаться того, читает ли человек данную газету вообще. Вопрос "Как часто Вы и Ваша жена (Ваш муж) посещаете парфюмерный магазин?" следует разделить по крайней мере на два вопроса, относящиеся к самому респонденту и его супруге (супругу).
4. Избегайте "подталкивающих" (или наводящих) вопросов, неявно указывающих респонденту, какой ответ желателен. "Подталкивающий" вопрос заставляет респондента выбирать "правильный" или социально-желательный ответ. Безусловно "подталкивающими" будут, например, вопросы: "Примете ли Вы участие в выборах, если отказ людей участвовать в голосовании приведет к установлению диктатуры?" или "Поддержите ли Вы движение за равные права для сексуальных меньшинств даже в том случае, если будете опасаться, что кто-нибудь сможет развратить Вашего ребенка?". В менее очевидных случаях к "подталкиванию" могут вести прямые ссылки на мнение авторитетных или влиятельных людей (скажем, "Согласны ли Вы с мнением премьер-министра X...?"), использование слов, имеющих явную эмоционально-оценочную нагрузку (например, "безответственные политики" или "рискованные средства"). Еще один способ навязать респондентам собственное мнение - это ограничение числа альтернатив ответа в закрытом вопросе или исключение позиций "другой ответ", "затрудняюсь ответить", "не знаю". Конечно, это значительно облегчает анализ данных, но исследование в этом случае становится просто дорогостоящим средством демонстрации вашей собственной точки зрения.
5. Без крайней необходимости не используйте выражения, содержащие в себе отрицание. Например, спрашивая респондента о согласии или несогласии с утверждением "Нельзя делать профилактические прививки взрослым без их добровольного согласия", мы не сможем уверенно утверждать, что означает ответ "нет" - несогласие с суждением или подтверждение согласия. Подобной путаницы не возникнет, если использовать утвердительную формулировку ("Согласны ли Вы с тем, что нужно делать прививки взрослым даже в принудительном порядке?"). Если по каким-то причинам нужно все же сохранить форму отрицания, то выходом становится использование развернутых ответов (например, "Нет, принудительные прививки делать нельзя" и т. п.).
6. Вопросы, требующие особой компетенции или осведомленности о чем-то, нужно задавать лишь тем, кто может на них ответить. Если есть основания считать, что не все респонденты могут ответить на вопрос из-за отсутствия каких-то знаний или опыта, нужно использовать предварительный вопрос-фильтр, чтобы отсеять тех респондентов, которые могут иметь квалифицированное мнение. Бессмысленно спрашивать о святом причастии у мусульманина или о мажоритарной системе голосования - у человека, которой не интересуется политикой и не участвует в выборах. Задавая специальные вопросы без предварительного "просеивания" респондентов, исследователь рискует принять искусственно созданное мнение неосведомленных людей за реальное: люди могут весьма уверенно высказываться не только о малознакомых, но даже и о вымышленных предметах, если будут полагать, что это доставит удовольствие социологу.
7. Избегайте любых многозначных или двусмысленных слов и фраз. Конечно, любое слово в некоторых контекстах может выглядеть двусмысленно, так что предыдущая фраза скорее всего выражает благое пожелание. И все же нужно пытаться находить замену для каждого слова, которое по-разному понимается в разных субкультурных группах (например, выражения "быть безразличным к чему-то", "относиться к чему-то безразлично" могут восприниматься как абсолютно нейтральные рабочими и как слегка негативные оценки - школьными учителями).
8. Учитывайте возможное влияние фактора социальной желательности. Фактор социальной желательности - одна из основных угроз валидности измерения (см. гл. 6): стремление людей к социальному одобрению, к "престижному" поведению и образу жизни, к самопрезентации может влиять на их ответы на самые разные вопросы: о предпочитаемой марке автомобиля, о сексуальной активности, даже о доходе или образовании. Поскольку фактор социальной желательности начинает определять ответы в той же мере, что и интересующая нас переменная, наше измерение становится невалидным, возникает систематическое смещение, которое в общем случае обозначается как "установка на ответ" (англ. response set). Бороться с этим видом смещения очень сложно. В некоторых случаях "установку на ответ" можно учесть и оценить ее величину на стадии анализа (для этого применяют модели измерения со множественными индикаторами). Иногда для выявления респондентов, склонных давать социально-желательные ответы, используют специальные шкалы (в психометрике их называют "шкалами лжи"). Такие шкалы состоят из вопросов, провоцирующих конформистские или установочные ответы. Например, если человек утверждает, что ни разу в жизни не солгал или что он никогда не чувствует раздражения, когда кто-нибудь указывает на его промахи, можно предположить, что он испытывает весьма сильную потребность в одобрении. К сожалению, специальные методические исследования показали, что такого рода шкалы в действительности не очень эффективны для идентификации респондентов, особенно подверженных влиянию фактора социальной желательности142. Идеального решения этой проблемы просто не существует. Важно, однако, осознавать возможность таких смещений, избегать "подталкивающих" вопросов и провоцирующих "социальное тщеславие" формулировок, а также уделять особое внимание этой проблеме на стадии анализа и интерпретации.
9. В вопросах, касающихся фактического положения дел или поведения людей, следует достаточно конкретно определять временные и пространственные координаты интересующих Вас событий. Трудно ответить на вопросы "Пользуетесь ли Вы общественным транспортом, находясь вдали от дома?" или "Часто ли Вы читаете детективы?". Нужно конкретизировать понятие "вдали" (другой город, другая страна, другой микрорайон?) и указать, какой период времени имеется в виду (например, "Как часто в течение последнего года Вы читали...?").
10. Не стремитесь к излишней детализации вопросов. Во-первых, респонденту в большинстве случаев легче указать некоторый числовой интервал, чем оценить точное значение признака. Даже такой явно "числовой" признак, как доход, может оцениваться по-разному, в зависимости оттого, какие источники или временные рамки принимаются в расчет. К тому же вы, скорее всего, не сможете полностью использовать полученные точные оценки - даже если допустить, что они абсолютно надежны, - так как другие переменные будут измерены на номинальном или ординальном уровнях.

"Сензитивные" вопросы
Эту проблему стоит обсудить отдельно, так как необходимость задать "сензитивные" (иногда - "угрожающие", деликатные) вопросы возникает не так уж редко. "Сензитивными" могут считаться любые вопросы, направленные на получение сведений, которые люди обычно предпочитают утаивать. Ответы на личностные или деликатные вопросы чаще бывают неискренними и соответственно ведут к не связанным с выборкой систематическим ошибкам в данных. Влияние "установки на ответ" на качество таких данных изучалось в целом раде специальных методических исследований143. В результате удалось показать, что помимо собственно содержания вопроса на величину смещения влияет его форма. Задавая вопросы, относящиеся к "сензитивным" сферам поведения людей, лучше всего избегать прямых формулировок, подобных вопросу: "Случалось ли Вам попадать в вытрезвитель?". Косвенные формулировки обычно используют прием проекции нестандартного поведения - на "других людей", "всех людей" - и его рутинизации, т. е. подчеркивания его обыденности. Примерами косвенных формулировок могут служить вопросы: "Известно, что каждый взрослый мужчина хотя бы раз в жизни может "упиться в стельку" и попасть в медвытрезвитель. Случалось ли что-нибудь подобное с Вами?", "Есть ли среди Ваших знакомых люди, задушившие своих жен? (Ответ) А Вам самому доводилось это делать?".
В некоторых - скорее редких - случаях уместно применение приема, позаимствованного из психологического тестирования, - метода "вынужденного выбора". Опрашиваемый должен выбрать одно из 4-5 суждений, каждое из которых имеет одинаковую негативную "нагрузку" по факторам моральной оценки или социальной желательности. Его заранее предупреждают о необходимости делать выбор быстро и о невозможности другого ответа ("не знаю", "другое" и т. п.). Задачей является выбор суждения, "наиболее близкого" к точке зрения или "лучше характеризующего" респондента. Разумеется, использование этого приема требует специального обучения интервьюеров и очень высокой мотивации к сотрудничеству со стороны опрашиваемых. Оба эти условия довольно трудно реализовать в практике массовых опросов. Ниже приведены примеры:
"Выберите один из ответов, в наибольшей мере соответствующий Вашему поведению:
А. Из наркотических средств я предпочитаю:
[ ] кокаин;
[ ] гашиш;
[ ] морфий;
[ ] героин.
Б. Иногда я практикую сексуальные отношения:
[ ] с лицами своего пола;
[ ] с насекомыми;
[ ] с домашними животными;
[ ] с собственной бабушкой".
Этические проблемы, связанные с использованием метода "вынужденного выбора", достаточно очевидны и не требуют комментариев.
Американский социолог С. Уорнер в конце 1950-х гг. предложил использовать для уменьшения смещения в ответах на "сензитивные" вопросы модель случайного ответа. В этом случае респондент отвечает на один из двух случайно выбранных вопросов, а интервьюер не знает, на какой из этих вопросов ответил респондент. Эта модель позднее подвергалась модификациям, в частности, было предложено использовать один "сензитивный" и один нейтральный вопросы. В простейшем случае респондент выбирает случайным образом карточку из колоды (статистическое распределение вопросов на карточках известно исследователю) и, не зачитывая вопрос, отвечает на него. Если предположить, что исследователь знает, как распределяется в генеральной совокупности нейтральный признак - скажем, дата рождения, - он может оценить статистически выборочное значение "сензитивного" признака. Фактически в этой модели заданы следующие параметры:
рs = истинное значение доли имеющих "сензитивный" признак s;
Р1 = вероятность предъявления респонденту карточки с вопросом о наличии у него признака s;
1 ? Р, = вероятность предъявления карточки с вопросом о нейтральном признаке п;
рn = доля имеющих признак п;
?1 = доля ответов "да".
В этом случае выборочная оценка может быть определена следующим образом:


Техническое воплощение модели случайного ответа может выглядеть, например, так же, как в специальном методическом исследовании, осуществленном Н. Бредберном и С. Судманом144.
Респондент пользовался ящичком, содержавшим 70% красных и 30% синих пластиковых шариков. Ящичек был устроен таким образом, что при потряхивании в маленьком окошке, видном только респонденту, появлялся в случайном порядке синий либо красный шарик. Опрашивающий в соответствующей части интервью предъявлял респонденту пару вопросов ("сензитивный" и нейтральный), напечатанные соответственно на "красной" и "синей" карточках. Респондент отвечал на тот вопрос, которому соответствовал цвет выпавшего шарика. Разумеется, респонденты были предупреждены, что шарики выпадают случайно, и, следовательно, интервьюер не знает в каждом конкретном случае, на какой из двух вопросов дается ответ. Кроме того, опрашиваемым объясняли, что механизм случайного выбора используется для того, чтобы облегчить ответы на некоторые трудные вопросы. В описанном исследовании использовались, например, такие карточки145:
"26... Пожалуйста, встряхните ящичек снова и ответьте на вопрос, цвет которого совпадает с цветом появившегося в окошке шарика. Ответьте "да" или "нет"".

Карточка G.
(Красный)
Штрафовали ли Вас за езду на красный свет в течение последних 12 месяцев?
(Синий)
Родились ли Вы в июле?

Исследование Бредберна и Судмана показало, что использование модели случайного ответа несколько уменьшает смещение в ответах о социально-осуждаемых поступках (в этом специальном исследовании оценки, полученные в результате опроса, сопоставлялись с объективными данными, которыми располагали полиция и другие учреждения). Однако для многих "угрожающих" вопросов оно все же оставалось значительным: оценка частоты задержаний за управление машиной в состоянии алкогольного опьянения была на 35% ниже объективного показателя, которым располагала дорожная полиция. Мера уверенности респондентов в анонимности, как и их способность попросту понять "правила игры", также варьировали в достаточно широких пределах. Учитывая технические трудности процедуры и необходимость использования больших выборок, следует признать, что модель случайного ответа может иметь довольно ограниченное применение.
Определенное значение для решения проблемы "сензитивности" имеет и избранная исследователем процедура сбора данных: анкеты, заполняемые самим респондентом, несколько лучше, чем телефонные или личные интервью в тех случаях, когда необходимо предотвратить завышение частоты социально-одобряемого поведения. Однако анкетная процедура ведет к более значительным смещениям в оценке неодобряемого поведения, к тому же доля ответивших в анкетном опросе обычно ниже, чем в случае личного или телефонного интервью.
Кроме того, для "сензитивных" вопросов, требующих достаточно детального (не сводящегося к "да" или "нет") ответа, предпочтительно использовать достаточно длинные и состоящие из привычных респонденту слов формулировки, а также открытый или полузакрытый формат вопросов. Важно также спокойное, нейтральное поведение интервьюера (в случае личного или телефонного интервью) и заверения в конфиденциальности, данные в начале беседы.
Довольно полезным приемом является использование вопросов о друзьях или знакомых. Конечно, полученные таким способом данные не могут быть "приписаны" к конкретным выборочным единицам, но они дают довольно правдоподобные оценки для некоторых типов поведения (обратите внимание на то, что речь идет не об использовании проективных вопросов о "других людях", а о вопросах, касающихся реального окружения респондента). Видимо, такие вопросы особенно уместны, когда необходимо оценить распространенность или частоту каких-то поведенческих актов, и сравнительно бесполезны для точной оценки интенсивности поведения или установок. Такой подход может быть проиллюстрирован следующим вопросом: "Представьте себе троих своих ближайших друзей. (Нет нужды называть их имена.) Как много из них, по Вашему мнению, когда-либо употребляло наркотики?"
Наконец, не исключен и подход, описанный в пионерской статье А. Бартона как "метод Кинзи" (имеется в виду известный исследователь сексуального поведения): посмотрите прямо в глаза респонденту и спросите его прямо и спокойно: "Вы когда-нибудь убивали свою жену?"

Выбор формата для ответов
Когда исследователь избрал по тем или иным соображениям закрытый или полузакрытый тип вопроса, он должен решить, в какой форме будут представлены категории ответа. Формат ответа - это собственно та задача, которую должен выполнить респондент, отвечая на вопрос.
Преимуществами закрытого вопроса являются простота кодирования и возможность облегчения задачи для тех респондентов, которые затрудняются сформулировать ответ самостоятельно. Кроме того, на закрытые вопросы люди обычно отвечают значительно быстрее. Основной недостаток закрытых вопросов заключается в том, что в ряде случаев они могут вести к созданию ложных, не существующих в действительности мнений либо из-за недостаточного диапазона категорий ответа, либо из-за неявного подталкивания респондентов к выбору "приемлемых" ответов. Поэтому, используя закрытые вопросы, социолог должен уделить особое внимание разработке списка категорий ответа. Этот список должен быть исчерпывающим, согласованным с логической структурой вопроса и содержать в себе категорию ответа, соответствующую отсутствию мнения у респондента ("не знаю"). При разработке списка уместны и небольшие пилотажные исследования на группе респондентов, и экспертиза коллег. Дж. Гэллап предложил специальную пятишаговую процедуру для разработки "хороших" закрытых вопросов146. Эта процедура отличается трудоемкостью, но ее целесообразно использовать по крайней мере для ключевых исследовательских переменных.
Предлагается включать в опрос последовательно:
1) закрытый вопрос для выявления осведомленности респондента или наличия у него какого-то отношения к данной проблеме;
2) открытый вопрос для оценки общего отношения, обобщенной установки;
3) закрытый вопрос, содержащий описание конкретных аспектов, сторон проблемы;
4) открытый или полузакрытый вопрос, позволяющий респондентам обосновать свое мнение, объяснить, почему они так считают;
5) закрытый вопрос на интенсивность мнения, показывающий, насколько респондент убежден в своей точке зрения.
Наиболее распространенными форматами ответа на простые закрытые вопросы являются: оценочная шкала; контрольный список (меню); выбор между суждениями, выражающими установку или мнение; ранжирование.
В случаях, когда закрытый вопрос является в строгом смысле шкалой или пунктом шкалы (индекса), к его формату обычно предъявляют особые требования, которые мы рассмотрим в разделе, посвященном конструированию шкал (см. гл. 6). Пока же достаточно будет дать общую характеристику форматов ответа.
Типичная оценочная шкала - это шкала согласия с суждением (суждениями). Респонденту предлагается оценить степень своего согласия с некоторым мнением или высказыванием, т. е. расположить самого себя на одномерном континууме, крайними точками которого являются полное согласие и полное несогласие с высказыванием. Обычно предполагается также, что респондент способен осуществить такую оценку по крайней мере на порядковом (ординальном) уровне, т. е. отнести себя к какой-то градации оценочной шкалы ("скорее согласен", "совершенно согласен" и т. п.). Оценки могут быть представлены в вербальной или графической форме. Примеры оценочных шкал представлены на рис. 7.
Вербальная
"Большинство людей пользуются правилами вежливости, чтобы прикрыть жестокость конкурентной борьбы."
[ ] совершенно согласен;
[ ] согласен;
[ ] затрудняюсь сказать;
[ ] не согласен;
[ ] совершенно несогласен.
Графическая
Совершенно 1 2 3 4 5 Совершенно
несогласен согласен
? 0 +
(Несогласие) (Согласие)
Рис. 7. Примеры оценочных шкал

К оценочным шкалам можно отнести так же те, которые выражают оценку респондентом своего положения на континуумах удовлетворенности чем-либо, значимости какого-то мнения, интенсивности установки. На рис. 8 приведен пример графической оценочной шкалы для оценки значимости высказывания (проблемы) для респондента. Самому большому кружку соответствует максимальная субъективная значимость, наименьшему -минимальная (респонденту даются соответствующие инструкции по заполнению опросника).
Особый тип оценочных шкал - это шкалы категориальной оценки, используемые в методах, подобных "семантическому дифференциалу" (СД). Подробный анализ процедур семантического шкалирования выходит за пределы данного раздела, но общий подход таков: респондент должен многократно оценить некий объект или несколько объектов (личность, товар, профессию и т. п.) по шкалам, каждая из которых задана двумя полюсами, точнее - парой противоположных по смыслу прилагательных (антонимов). Мы назвали СД-подобные шкалы особым типом оценочных шкал, имея в виду их использование для специальных исследовательских задач и довольно сложные методы анализа результатов. Важно, однако, обратить внимание на то обстоятельство, что описанные нами выше оценочные шкалы с большими основаниями могут рассматриваться в качестве частных, "вырожденных" случаев семантического шкалирования - с одним объектом оценивания (например, "Я сам") либо с одной шкалой (скажем, шкалой удовлетворенности). Процедуры, в которых используются СД-подобные шкалы, приводят к заполнению параллелепипеда данных типа "субъект х объект оценивания х переменная-признак", что значительно расширяет возможности анализа147. Пример СД-подобного формата ответов приведен ниже.













Рис. 8. Пример графической оценочной шкалы для оценки значимости высказывания для респондента

"Как бы Вы описали психологическую атмосферу в Вашем коллективе?
теплая 1 2 3 4 5 холодная
активная 1 2 3 4 5 пассивная
соревновательная 1 2 3 4 5 дружелюбная"

Вопросы - "меню" требуют от респондента выбора одного или более пунктов из представленного списка. Например, одна из шкал близости межличностных отношений предлагает респонденту отметить в контрольном списке только те виды деятельности, которые обычно осуществляются им совместно с близким человеком. Приведем фрагмент списка148:
1. стирка [ ];
2. приготовление еды [ ];
3. просмотр телепередач [ ];
............................................
8. прогулки пешком, поездки [ ];
9. обсуждение личных проблем [ ];
10. посещение музеев, выставок [ ].

Выбор между суждениями, выражающими установку по отношению к некоторому объекту, предполагает, что респондент выберет то суждение, которое отражает степень его благожелательности по отношению к объекту. Упорядоченность суждений вдоль некоторого "установочного" континуума обычно очевидна и для исследователя, и для самого опрашиваемого (о более сложных методах измерения установок вы узнаете из раздела главы 6, посвященного шкалам).
Приведем пример.
"Существуют разные подходы к наказанию за особо тяжкие преступления. Какое из приведенных ниже суждений отражает Вашу точку зрения на смертную казнь как меру наказания:
? это наименее приемлемый из всех способов наказания преступников;
? это не очень приемлемый метод наказания, однако он не хуже других;
? это вполне приемлемое наказание за некоторые виды преступлений;
? это вполне приемлемая мера наказания преступников;
? другой ответ (напишите, пожалуйста)
__________________________".

Ранжирование как формат ответа подразумевает, что респондент упорядочивает весь представленный ему список - пунктов, суждений, объектов и т. п.- вдоль одномерного континуума какого-то качества (при этом не отмечая своего собственного положения на континууме). Чаще всего производится ранжирование по предпочтительности, важности, значимости, популярности. В массовых опросах нередко используются упрощенные подходы к ранжированию (скажем, "Назовите трех самых популярных и трех наименее популярных политиков из перечисленных..."). Это позволяет экономить время участников опроса, но значительно сильнее, чем принято думать, снижает качество и сопоставимость данных.
Многие реальные форматы ответов сочетают в себе черты двух или трех описанных типов. Важно, однако, чтобы задача респондента, определяемая избранным форматом ответа, была однозначно понимаемой и логически непротиворечивой.

Макет анкеты (опросника)
Общий вид и структура анкеты (опросника) не менее важны, чем содержание и словесное оформление вопросов. Плохое оформление или неясные инструкции часто ведут к невосполнимым пропускам в данных.
Общая рекомендация, равно применимая и к вопросникам, заполняемым в ходе интервью, и к анкетам, заполняемым самим респондентом, заключается в том, что поля и интервалы между вопросами (или блоками вопросов) должны быть достаточно велики. Стремление "ужать" вопросник, сделать его объем небольшим, чтобы не отпугнуть респондентов, на практике приводит к появлению "слепого", путаного и визуально непривлекательного инструмента сбора данных. Вопросы должны печататься только на одной стороне листа. Поля должны быть не меньше 2,5 см., что необходимо для кодирования данных. Альтернативы ответа лучше располагать вертикально, а не горизонтально. (Когда они перечисляются в одной строке, респондент чаще пропускает средние позиции.) Излишне говорить, что наличие нескольких незаполненных строк для ответа положительно сказывается на желании опрашиваемых подробно ответить на открытый вопрос.
Большинство социологов-практиков убеждены, что наиболее удобной формой для фиксации ответа на закрытый вопрос является перечеркивание "квадратика" рядом с избранным ответом (или проставление в нем "галочки"), например:
да,

нет,

не знаю.

Возможно также использование квадратных ? ] или круглых ( ) скобок. Если каждая из позиций ответа имеет заранее присвоенный цифровой код, то можно попросить респондента обвести соответствующие цифры кружком:

05 да,

нет,

07 не знаю.

Последний вариант, однако, менее предпочтителен: во-первых, не все смогут обвести цифры достаточно аккуратно (что приведет к некоторым проблемам при вводе данных), и, во-вторых, обильно усеянная цифрами анкета некоторыми респондентами воспринимается как математическая головоломка. Разумеется, последние два замечания относятся лишь к анкетам, заполняемым респондентами: интервьюеров можно обучить безошибочной работе с цифровыми годами.
Важную роль в структуре анкеты играют вопросы-фильтры (или "отсекающие" вопросы). Они позволяют отобрать группу респондентов, которые могут (в силу своего статуса, опыта, заинтересованности или знаний) ответить на следующие за вопросом-фильтром зависимые вопросы. Для остальных респондентов зависимые вопросы будут попросту нерелевантны. Скажем, спрашивать о том, какое средство контрацепции они предпочитают (зависимый вопрос), имеет смысл у тех респондентов, которые пользовались или пользуются контрацептивами (вопрос-фильтр). Естественно, вопрос-фильтр всегда предваряет зависимые вопросы, которые респонденты, давшие "не тот" ответ, пропускают. Недопустимо, как уже говорилось, сочетать вопрос-фильтр и зависимый вопрос в одном "условном" вопросе: "Если у Вас есть собака, кормите ли Вы ее сухим кормом "Педигри пал"?". Ответ: "нет" дадут и те люди, которые не держат собак, и те, кто не кормят своих собак сухим кормом, и те, кому особенно не нравится "Педигри пал". (Конечно, использование развернутых ответов для каждой из логически возможных альтернатив может помочь в решении проблемы интерпретации, но в этом случае ваш список "подсказок" станет длиннее, чем инструкция по использованию кофемолки.) Очень удобно, когда вопросы-фильтры и зависимые вопросы выделены с помощью графических средств: стрелок, рамок, цвета и т. п. Примером может служить рис. 9
1 . Есть ли у Вас дети?

[ ? Да
[ ] Нет (переходите к вопросу 4)
При ответе "да" на первый вопрос:
2. Сколько у Вас детей? (Напишите) _________
3. Каков возраст самого старшего из Ваших детей? __ лет

Рис. 9. Пример зависимых вопросов

Иногда социологу нужно задать несколько вопросов, имеющих одинаковые категории ответа (в частности, это могут быть вопросы-пункты, входящие в одну шкалу). В этом случае целесообразно использовать табличный вопрос. Использование табличных вопросов делает анкету более компактной и, кроме того, позволяет респонденту увидеть смысловую и логическую организацию однотипных вопросов. Пример табличного вопроса с вербальной оценочной шкалой приведен на рис. 10.
Порядок вопросов в анкете обычно определяется несколькими простыми правилами:

Вопрос анкеты
Ответ
Совершенно согласен
согласен
Не согласен
Совершенно не согласен
Не знаю
Принимая решение, лучше всего опираться на мнение старших, более опытных людей


? ?


? ?


? ?


? ?


? ?
Обществу нужна "сильная рука", насаждающая закон и порядок

? ?

? ?

? ?

? ?

? ?
Адвокаты помогают преступникам и мошенникам "выйти сухими из воды"


? ?


? ?


? ?


? ?


? ?

Рис. 10. Пример табличного представления вопроса

заполняемой анкеты, чтобы это были не "демографические" вопросы о возрасте, национальности и т. п., сразу придающие анкете несколько официальный характер);
2) постарайтесь обеспечить какое-то смысловое соответствие между начальными вопросами и заявленными целями опроса;
3) группируйте вопросы в смысловые блоки, по возможности разделяя их графически: это не только облегчит задачу составления вопросника, но и придаст последнему в глазах опрашиваемых вид упорядоченного целого, а не хаотического и бессвязного нагромождения вопросов;
4) стремитесь всегда двигаться от более простых вопросов к более сложным и от более конкретных - к более абстрактным;
5) избегайте однообразия в конструкции вопросов и выборе формата для ответов, если вопросы следуют друг за другом;
6) не забывайте о возможном влиянии "соглашательской" установки на ответ: меняйте "направленность" вопросов, измеряющих одну и ту же установочную переменную;
7) избегайте слишком резких переходов от конкретных вопросов, относящихся к повседневной жизни и опыту, к мировоззренческим, установочным или "сензитивным" вопросам: трудно предсказать, как отреагирует человек, которого вы внезапно спросите: "Доводилось ли Вам лечиться от венерических болезней?" или "Веруете ли Вы в Бога?" (иногда в практике массовых опросов используют мало информативные или даже вовсе неинформативные "буферные" вопросы, сглаживающие такого рода переход);
8) в некоторых случаях есть смысл использовать небольшие "введения" к каждому блоку вопросов (например, "В следующем разделе нашей анкеты мы хотели бы узнать, что москвичи думают о городском транспорте");
9) небольшие подсказки и конкретные инструкции по заполнению должны содержаться не только в общем введении к анкете, но и везде, где это необходимо для ясного понимания респондентом сути стоящей перед ним задачи (скажем, "В случае, если ни один из предложенных ответов не соответствует Вашему мнению, впишите Ваш ответ..." или "Напишите "1" рядом с фамилией самого любимого телеведущего...").
Во введении к анкете должны содержаться сведения о целях исследования, о том, кто проводит данный опрос. Кроме того, уместны заверения в конфиденциальности (анонимности), какие-то объяснения по поводу того, как был выбран данный респондент (скажем, "случайным образом"). Если анкета заполняется самим респондентом, нужно указать, каким образом, когда и кому (по какому адресу) она должна быть возвращена. Практика показывает, что чрезмерно длинные и обстоятельные интродукции не приводят к сколько-нибудь существенному улучшению качества ответов или увеличению мотивации к сотрудничеству. И в случае интервью, и в ситуации, когда респондент сам отвечает на вопросы, лучше перейти к сути дела сразу же, после небольшого введения: все равно опрошенные не уделят должного внимания касающимся вас и вашего проекта деталям, если они (детали) будут представлены до начала опроса. Намного лучше, если, завершив интервью, вы вручите респонденту визитную карточку, памятный значок с символикой института, который вы представляете, и т. п. Желательно также поблагодарить респондента за сотрудничество.
Если составленный вами вопросник будет заполняться в ходе личного интервью, нужно сразу же позаботиться о составлении памятки для интервьюеров. Полезно также использовать внутри вопросника шрифтовые выделения, позволяющие отделить те инструкции и замечания, которые адресованы только интервьюеру, от предназначенных респонденту и зачитываемых интервьюером вслух. Лучше, если все уточняющие реплики, инструкции и вводные фразы, которые интервьюеру предстоит использовать, будут включены непосредственно в текст вопросника (в скобках, с помощью курсивных выделений и т. п.). В ином случае интервьюеру придется заучивать памятку наизусть - от вводных фраз до "До свидания"149.

Дополнительная литература
Клюшина Н. А. Причины, вызывающие отказ от ответа // Социологические исследования. 1990. № 1. С. 98-104.
Методы сбора информации в социологических исследованиях. Кн. 1. Социологический опрос / Отв. ред. В. Г. Андреенков, О. М. Маслова. М.: Наука, 1992.
Маслова О. М. Познавательные возможности открытых и закрытых вопросов // Социологические исследования. 1984. № 2. С. 129-138.
Ноэль Э. Массовые опросы. М.: Прогресс, 1978. С. 76-120.
Рукавишников В. О., Паниотто В. И., Чурилов Н. Н. Опросы населения (методический опыт). М.: Финансы и статистика, 1984.
Шуман Г., Прессер С. Открытый и закрытый вопрос // Социологические исследования. 1982. № 3.
Ядов В. А. Социологическое исследование: методология, программа, методы. 2-е изд., перераб. и доп. М.: Наука, 1987. С. 130-166.

ГЛАВА 6. КАЧЕСТВО ИЗМЕРЕНИЯ.
СОЦИОЛОГИЧЕСКИЕ ИНДЕКСЫ И ШКАЛЫ

Проблема качества социологического измерения
В предыдущей главе мы сравнительно много говорили о переходе от теоретических конструктов к конкретным эмпирическим показателям и анкетным вопросам и сравнительно мало - о том, что обеспечивает законность такого перехода и возможность правильной и осмысленной интерпретации "сырых" ответов. Сейчас нам предстоит восполнить этот пробел, рассмотрев возникающие здесь проблемы качества социологического измерения и построения социологических индексов и шкал.
Как уже говорилось ранее, переменная-признак, включенная в модель измерения, может задаваться совокупностью эмпирических индикаторов (в предельном случае - одним индикатором), наблюдаемые значения которых содержат, помимо истинного, ошибочный компонент. Задача оценки качества измерения - это, говоря обобщенно, задача разделения истинного значения и ошибки. Еще одна проблема, стоящая перед исследователем, связана с необходимостью использовать несколько показателей (вопросов анкеты, данных наблюдения и т. п.) для построения суммарного индекса или шкалы, позволяющих получать более точные, т. е. менее подверженные смещению, оценки интересующей исследователя переменной. Индексы и шкалы позволяют перейти от многообразия конкретных, наблюдаемых переменных-индикаторов, отражающих лишь отдельные аспекты теоретического понятия, к более абстрактным переменным теоретической модели. Так, например, конкретный вопрос об участии в голосовании дозволяет сделать определенные выводы о политической активности людей, однако ограничившись только этим вопросом, вы ничего не узнаете о других аспектах и формах политической активности. Кроме того, использование нескольких показателей позволяет уменьшить влияние посторонних факторов на ваши оценки величины или разброса значений переменной и сделать получаемые результаты более устойчивыми и воспроизводимыми. Иными словами, использование индексов и шкал ведет к повышению надежности и валидности измерения. С рассмотрения этих понятий мы и начнем данную главу.

Надежность и валидность измерения
Качество отдельных индикаторов, суммарных показателей (индексов) и шкал определяется их надежностью и валидностью.
Надежность измерения связана с его устойчивостью и воспроизводимостью. Показатель может считаться надежным в той мере, в которой полученные оценки могут быть воспроизведены на данной совокупности объектов измерения. Основной вид надежности - это надежность-повторяемость (или диахронная, ретестовая надежность). Оценка ретестовой надежности отражает результаты повторного применения одного и того же показателя (вопроса, теста) для одной и той же выборки случаев (респондентов) в разные моменты времени. Если люди отвечают на вопрос одинаково и в первом, и во втором, и во всяком последующем случае, то этот вопрос надежен. Если тест умственных способностей дает те же результаты при повторной проверке на одной и той же группе старшеклассников, то это надежный тест.
Важно отметить, что надежность инструмента измерения не отражает его точность или правильность. Скажем, если на вопрос о доходе респонденты дважды дадут совершенно идентичные ответы, завышенные на какие-нибудь 100%, мы имеем дело с абсолютно надежным, но неточным показателем. Если, в другом случае, термометр с безукоризненной надежностью показывает электрическое сопротивление кожи, у нас нет оснований говорить о правильности, адекватности измерения. Оценка надежности-повторяемости - это корреляция между результатами повторных измерений. В случае единичного вопроса-индикатора достаточно просто сопоставить ответы одной и той же группы людей, полученные в первом опросе, с ответами, данными двумя неделями или месяцем позднее, и вычислить коэффициент корреляции (см. гл. 8). На практике хорошей можно считать корреляцию 0,8 и выше.
К недостаткам оценок надежности-повторяемости следует отнести, во-первых, сложность проведения повторных замеров на больших выборках, типичных для социологии. Во-вторых, истинное значение переменной также может изменяться с течением времени, например, политические симпатии могут измениться за неделю в результате каких-то скандальных разоблачений, а зарплата - существенно возрасти за месяц из-за введения обязательного индексирования в условиях инфляции. В последнем случае перед исследователем встанет трудноразрешимая задача отделить колебания, вызванные изменением истинного значения переменной, от колебаний, связанных с надежностью показателя. Поэтому так важен еще один вид надежности - надежность-согласованность. Оценить надежность-согласованность можно лишь в том случае, если для измерения одной и той же переменной используют множество индикаторов. Зато для такой оценки достаточно однократного измерения. В психологическом тестировании, например, используют батареи тестов, нацеленных на измерение одной способности или одного личностного качества. Социологи - если они располагают достаточными средствами и техническими возможностями - используют индексы и шкалы, состоящие из множества отдельных вопросов-индикаторов.
Самый простой способ оценки надежности-согласованности - это "расщепление пополам". Если, например, у нас есть 12 вопросов, предположительно измеряющих политическую активность, где каждому вопросу присвоен 1 балл, а максимальной политической активности соответствует суммарный индекс 12 баллов, то применяется следующая процедура:
1. Вопросы в случайном порядке разбиваются на два равных списка (по 6 вопросов в каждом) и предъявляются один раз группе испытуемых.
2. Далее подсчитывается коэффициент корреляции между результатами одних и тех же испытуемых по разным "половинам" теста: чем выше его значение, тем согласованнее оценки истинного значения политической активности, получаемые с помощью данного набора индикаторов. Не исключено, однако, что полученная таким способом оценка надежности150 окажется весьма чувствительной к способу "расщепления пополам": коэффициент корреляции будет заметно меняться в зависимости от способа составления двух списков.
Еще одна элементарная процедура, позволяющая оценить надежность отдельного вопроса (высказывания, пункта шкалы), - это проверка его корреляции с суммарным баллом, т. е. с суммарным значением индекса. Если для данной группы опрошенных коэффициент корреляции между отдельным вопросом о частоте зарубежных поездок и суммарным "индексом ксенофобии" оказался равен 0,3, то можно предположить, что названный вопрос не отражает истинного значения переменной "уровень ксенофобии" и может быть исключен из опросника151. Ведь строго определенная надежность - это та доля измеренного разброса оценок, которая относится к истинному разбросу значений измеряемой переменной (мы пользуемся здесь менее строгим и скорее содержательным определением, поскольку пока не обсуждали необходимые статистические понятия). Очевидно, что коррелирование с суммарным баллом - это процедура, применимая для имеющих довольно простую структуру суммарных индексов и шкал (примеры вы найдете дальше в этой главе).
В любом случае важно располагать явной моделью измерения теоретической переменной, так как лишь она позволит предсказать, каковы ожидаемые отношения между отдельными индикаторами и насколько применимы описанные простые методы оценки надежности. Чтобы убедиться в этом, достаточно сравнить модель с множеством эффект-индикаторов латентной переменной с моделью, включающей только причинные индикаторы (см. рис. 3 и 4). Очевидно, что эффект-индикаторы должны быть высоко согласованны и с латентной, переменной-свойством, которую они призваны измерять, и друг с другом. Однако это не так уж очевидно для причинных индикаторов: скажем, и образование, и доход - важные компоненты понятия "социально-экономический статус". Однако даже если образование растет, доход имеет право вести себя как угодно, т. е. он вовсе не должен показывать непременно высокую корреляцию с образованием. Иными словами, если от надежных эффект-индикаторов следует ожидать высокой скоррелированности друг с другом (при использовании методов "расщепления пополам" или корреляции с суммарным баллом), то для причинных индикаторов столь простой подход к оценке надежности неприменим. Разработать подходящий метод оценки надежности здесь можно, лишь анализируя взаимосвязи разных индикаторов и разных теоретических переменных в модели измерения. Прогнозируя ожидаемую направленность и величину этих связей, исследователь может оценить степень соответствия своих предсказаний наблюдаемым данным и сделать вывод о качестве индикатора. Самыми универсальными методами оценки надежности эмпирических индикаторов являются факторный анализ и путевой анализ. В идеале для оценки надежности используют несколько индикаторов (два-три) и по крайней мере две волны панели152.
Очень важно помнить, что понятие надежности связано со случайными ошибками измерения, т. е. с ошибками, которые никаким систематическим образом не связаны друг с другом или какими-то систематически действующими внешними переменными (скажем, полом или возрастом респондентов). Типичные источники ненадежности - это случайные несистематические факторы, связанные с колебаниями внимания респондентов, неоднозначностью формулировки вопроса, ведущей к различию в его восприятии в разных случаях; несистематическими различиями в проведении интервью; различиями в кодировании открытых вопросов, или с ошибками при вводе данных. Например, если предложить даже очень опытным специалистам классифицировать сотню населенных пунктов по заранее разработанной схеме кодирования типов поселений, то, вероятнее всего, можно будет найти по крайней мере несколько расхождений в получившихся классификациях. Некоторые расхождения будут связаны с наличием "предельных" случаев, не поддающихся однозначной классификации по предложенным правилам, некоторые - с механическими ошибками записи или невнимательностью. Предварительная оценка надежности вопросов социологической анкеты требует прежде всего "отбраковки" неясно сформулированных вопросов, на которые люди часто отвечают случайным образом. Столь же низка надежность вопросов, на которые респонденты попросту не способны ответить, так как не имеют никакого мнения по затронутой проблеме или ничего не знают о ней. Далеко не все опрошенные, столкнувшись с иррелевантным вопросом, честно ответят "не знаю" или "не помню". Многие дадут наугад выбранный ответ из вежливости или нежелания демонстрировать свою неосведомленность.
Методы увеличения надежности нами уже обсуждались (см. гл. 4, 5). Во-первых, нужно стремиться к использованию множественных индикаторов. Когда же это невозможно, т. е. существуют теоретические или практические трудности в измерении одной переменной разными способами, то следует использовать самые устоявшиеся и общепринятые показатели (например, если можно лишь один раз спросить респондента о его возрасте, то лучше всего использовать в точности такую же формулировку вопроса и те же категории ответа, какие используются в общенациональных переписях, масштабных панельных исследованиях и т.п.).
К другим методам увеличения надежности можно отнести "отсев" иррелевантных вопросов, анализ словесной формулировки вопроса, обучение и контроль интервьюеров, совершенствование методов кодирования данных и процедур ввода.
Валидность измерения, в самом общем смысле, характеризует соответствие измерения его цели. Эмпирический показатель валиден (обоснован, правилен) в той мере, в какой он действительно отражает значение той теоретической переменной, которую предполагалось измерить. Очевидно, что нет смысла говорить о валидности какого-то индикатора самого по себе. Валидность инструмента измерения состоит в однозначностш и правильности получаемых результатов относительно измеряемого свойства объектов, т. е. относительно предмета измерения. Можно сказать, что валидность определяет "чистоту" измерения теоретического конструкта. Когда измерение является непосредственным, т.е. мы можем прямо подсчитать количество эталонных единиц измеряемого свойства, и на результаты измерения влияют только случайные ошибки, надежность и валидность неразличимы, валидность инструмента измерения равна его надежности153. Если мы измеряем интересующее нас свойство лишь косвенно, используя какой-то индикатор, возникает различие между надежностью и валидностью. Индикатор может обладать высокой надежностью (воспроизводимостью), но при этом измерять интересующий нас социологический конструкт недостаточно "чисто". Уже на интуитивном уровне очевидно, что вполне надежный инструмент может измерять нечто другое, помимо интересующего исследователя качества (например, не столько политическую активность, сколько конформизм). Косвенное измерение обычно содержит и случайный, и неслучайный ошибочный компонент. Именно неслучайный компонент, включающий в себя систематическую (скоррелированную) ошибку и, реже, имеющую одну и ту же величину для каждого случая постоянную ошибку измерения, определяет валидность показателя. Характерными примерами систематической ошибки измерения в социологическом опросе или эксперименте являются уже упоминавшиеся эффекты "памяти", социальной желательности, установки за позитивный или негативный ответы. Они влияют не только на правильность, валидность индикатора интересующей исследователя переменной, но и на правильность и обоснованность результатов анализа данных: скоррелированная ошибка измерения может воздействовать на любые статистические показатели, в том числе на показатели взаимосвязи между переменными и на оценки значимости различий между подгруппами. Иными словами, конечным итогом "пользования невалидных индикаторов могут оказаться неверные содержательные выводы.
Проблема валидности измерения - сложнейшая проблема социологической методологии. Валидное измерение - это прежде всего результат валидной модели измерения, т. е. результат обоснованной и ясной концептуализации теоретических представлений. Здесь мы опишем лишь основные виды валидности и традиционные методы валидации, т. е. установления валидности измерений.
Валидностъ по содержанию показывает, в какой мере избранные исследователем индикаторы отражают различные аспекты теоретического понятия. Иными словами, речь идет о представительности данной совокупности измерений да отношению к концептуальной структуре переменной-признака, о полноте операционализации теоретических понятий. Например, экзамен по статистике может рассматриваться как валидный инструмент измерения статистических знаний студентов, так как экзаменационные вопросы отражают содержание лекций и учебников. Однако если все вопросы относятся лишь к одному разделу прочитанного курса - скажем, к нормальному распределению, - то результаты экзамена будут отражать, например, умение студентов переводить "сырые" баллы в стандартные оценки, но ничего не скажут о знании корреляции и регрессии.
Основная процедура оценки валидности по содержанию - это суждение эксперта. В некоторых случаях связь между теоретическими понятиями и измеряющими их индикаторами столь ясна, что никакие специальные обоснования попросту не требуются: понятно, что термометр измеряет температуру. Здесь можно говорить об очевидной (иногда-лицевой, от англ. face validity) валидности показателя. Очевидная валидность тем выше, чем тождественнее понимание цели вопроса, теста или иного показателя профессионалом-социологом и неискушенным респондентом. Вопрос о частоте покупки шампуня, по всей вероятности, не содержит в себе никаких подвохов и позволяет судить именно о том типе потребительского поведения, который описан в вопросе. Однако в более сложных случаях содержательная валидность отнюдь не сводится к очевидной. Набор простых вопросов о излюбленном способе проведения досуга, предпочитаемой марке автомобиля, частоте чтения престижного журнала и т. п. может быть нацелен на измерение "стиля жизни" респондента (в данном случае измерение позволяет отнести человека к одной из номинальных категорий стиля жизни - "выживающий", "достиженческий", "экзистенциальный", "социальный" и т. п.154). Судить о полноте этого набора и относительной значимости вопросов для измерения понятия "стиль жизни" могут только специалисты. Основой такого экспертного суждения является теоретическое определение, концептуализация исследовательской переменной. Обычно экспертное суждение о валидности по содержанию выносится более или менее стихийно, после публикации результатов исследования. Иногда все же удается использовать более организованные процедуры - метод параллельных панелей или метод нескольких судей155. В первом случае две или три последовательные панели специалистов проводят всю процедуру валидации по содержанию, т. е. сравнивают существующие дефиниции, составляют список возможных индикаторов и оценивают их репрезентативность по отношению к исследуемой концептуальной области. Если сравнение индикаторов, независимо отобранных в двух и более панелях, обнаруживает множество совпадений, можно говорить о высокой содержательной валидности.
Метод нескольких судей (экспертов) полезен в тех случаях, когда переменная-признак, которую предполагается измерить, имеет многомерную структуру. Если, например, социолог разрабатывает воображаемую шкалу социально-экономического благополучия регионов, то полезно обратиться к специалистам в таких областях, как демография, социальная политика, занятость, налоговая система и т. п. Опрос экспертов позволит выявить существенные факторы, входящие в шкалу, оценить их сравнительную значимость и найти релевантные эмпирические индикаторы.
Критериальная валидность (или валидность по критерию) показывает, насколько хорошо результаты по данному тесту или индикатору согласуются с результатами измерения другого показателя, называемого критерием. Чаще всего критерий - это та переменная, которая и представляет практический интерес для исследователя, но не может быть измерена в данный момент. Например, критериальная валидность вступительных экзаменов определяется той академической успеваемостью, которую в дальнейшем продемонстрируют студенты (т. е. академическая успеваемость является в данном случае критерием). Можно также предположить, что тест моральной оценки девиантного поведения для подростков обладает критериальной валидностью по отношению к реальному отклоняющемуся поведению. Индикатор, обладающий доказанной критериальной валидностью, может рассматриваться как переменная-предиктор, позволяющая предсказывать индивидуальные значения переменной-критерия. ^Конечно, нужда в предикторе, замещающем собственно критерий, возникает лишь в тех случаях, когда оценки по критерию получить трудно, т. е. речь идет о давно прошедших или еще не наступивших событиях, либо переменную-критерий трудно измерить из-за практических или этических соображений. Валидность предиктора обычно тем выше, чем ближе он к критерию. Скажем, идеальным методом отбора курсантов авиационного училища мог бы стать пробный краткосрочный курс обучения с проверкой практических навыков управления самолетом в финале: прошедшие проверку претенденты имели бы все шансы стать настоящими профессионалами. Однако такой метод слишком дорогостоящ и на практике используют тесты интеллекта, испытания визуально-моторной координации и другие показатели, установив предварительно их критериальную валидность. В другом случае проективный личностный тест (типа ТАТ - теста тематической апперцепции, подразумевающего составление рассказов по фотографиям с неопределенным сюжетом) позволит выявить признаки психоза либо травмирующего сексуального опыта в прошлом пациента. Полное психиатрическое обследование могло бы занять очень много времени, да и данные о плохом обращении в детстве получить довольно трудно.
К основным типам критериальной валидности относят прогностическую, конкурентную и постдиктивную ("предсказывающую-назад") валидности.
Прогностическая критериальная валидность описывает точность, с которой значения данной переменной - обычно характеризующей отдельного индивида или группу - могут быть предсказаны на основании текущих значений какой-то другой переменной (предиктора). Очевидно, что наилучшим показателем такой прогностической точности будет корреляция между значениями переменной-предиктора и значениями переменной-критерия для одной и той же выборки. Тогда - в пределах ошибки выборки - коэффициент корреляции будет равен коэффициенту прогностической валидности.
Конкурентная валидность по критерию - это степень соответствия между текущими значениями переменной-критерия и переменной-предиктора. Попросту говоря, исследователь использует результаты измерения по одному признаку для того, чтобы оценить значение другой переменной. Причина может заключаться в том, что измерение непосредственно переменной-критерия трудноосуществимо, занимает слишком много времени и т. п. Проблема конкурентной валидности весьма значима для эмпирической социологии, где многие поведенческие или установочные переменные измеряются не непосредственно, а через самоописания, ответы на анкетные вопросы, иными словами, через вербальное поведение. Например, мы можем оценить конкурентную валидность анкетного вопроса о частоте посещения дискотеки студентами-отличниками с помощью серии включенных наблюдений за реальным поведением данной группы. Уже ранние исследования конкурентной валидности фактографических вопросов в социологии показали, что даже для относительно "безобидных", несензитивных индикаторов конкурентная валидность может изменяться в самых широких пределах.
В так называемом Денверском исследовании валидности, проведенном С. Стауффером и соавторами в 1947 г., сопоставлялись данные ответов респондентов на фактографические вопросы и данные официальной статистики местных организаций. Речь шла о регистрации избирателей, участии в голосовании, взносах в городскую казну, о наличии водительских прав и читательского билета и т. п. Сопоставляя данные официальной статистики (критерий) с ответами респондентов (предиктор), исследователи обнаружили, что величина расхождений составляла от нескольких процентов до почти 50%, в зависимости от содержания вопроса.
Следует, однако, помнить и об ограничениях, присущих объективным показателям-критериям: данные официальных документов также нередко основаны на самоотчетах и нередко подвержены ошибкам измерения. Все же в некоторых случаях процедура конкурентной валидации имеет преимущество перед предиктивной, так как первая не требует от исследователя длительного ожидания того момента, когда можно будет измерить значения критерия. Если, например, исследователь хочет оценить критериальную валидность теста профессиональных интересов, разработанного для студентов, как предиктора успешной профессиональной карьеры, то ему необязательно ждать десять лет, чтобы измерить значение переменной-критерия. Достаточно провести тестирование профессиональных интересов для двух "крайних" групп уже работающих специалистов - преуспевших и наименее преуспевших в профессии в данный момент времени. Высокая корреляция между тестовым баллом и успешностью работы (или статистически значимое различие тестовых баллов "крайних" групп) будет свидетельствовать о конкурентной валидности теста. Условиями, при которых выводы о конкурентной валидности индикатора могут все же оказаться ошибочными, являются избирательное выбывание из выборки (самоотбор) и реактивность переменной-предиктора. Самоотбор в нашем примере может иметь место в том случае, если среди выбывших из выборки (бывших студентов, отказавшихся от профессиональной карьеры в данной области и не охваченных по этой причине проводимым тестированием) будут сверхпредставлены высоко- либо низкомотивированные, т. е. естественное выбывание будет носить неслучайный характер. В случае реактивности индикатора наши испытуемые будут отвечать на вопросы теста мотивации не так, как они отвечали будучи студентами (из-за повлиявших на них профессионального опыта, изменения социального статуса и т. п.) И все же существуют нереактивные переменные-предикторы, конкурентная валидность которых вполне поддается обоснованию. Примером могут служить такие стабильные характеристики, как коэффициент интеллекта или "фоновые" переменные (социальное происхождение, национальная принадлежность и т. п.).
Наконец, в некоторых случаях мы заинтересованы в том, чтобы установить точность, с которой мы можем оценить наличие какого-то критерия-признака или черты, присущей индивиду (группе) в прошлом. Пример использования проективного психологического теста для постдиктивного "прогноза" детских травм приведен выше. Эта ситуация обозначается как оценка постдиктивной валидности.
Описанные нами виды валидности существенны в тех ситуациях, когда перед исследователем стоит задача сравнить некий показатель с уже существующими или с используемым в практике критерием. Иными словами, критериальная валидность показателя - это корреляция с другим, предположительно "чистым", эмпирическим показателем. Однако существует и другой подход к валидности, где оценка индикатора основана на том, насколько хорошо его "поведение" соответствует теоретическим ожиданиям. Такая оценка может быть проведена лишь в рамках целостной теоретической модели, описывающей отношения между теоретическими переменными, их индикаторами, случайными и неслучайными ошибками измерения. Предположим, мы хотим проверить валидность новой шкалы групповой сплоченности. Основываясь на существующих теоретических представлениях, мы можем предположить, что большей групповой сплоченности соответствует меньшая частота открытых конфликтов и большая интенсивность коммуникаций. Сравнив различные по уровню групповой сплоченности группы и определив для них значения других двух переменных (частота конфликтов и интенсивность коммуникаций), мы увидим, насколько хорошо "ведет" себя разработанный нами показатель групповой сплоченности. Если паттерн его отношений с двумя другими переменными соответствует предсказаниям теории, то мы можем заключить, что новая шкала валидна, т. е. измеряет именно ту теоретическую переменную, которая нас интересует. Этот вид валидности обычно обозначают термином "конструктная валидность"156. (Иногда используют также обозначение "концептуальная валидность".)
Со статистической точки зрения абсолютная конструктная валидность предполагает, что весь наблюдаемый разброс в значениях показателя связан исключительно с измеряемым теоретическим конструктом. Если же часть вариации индикатора связана с другой переменной - будь то другой теоретический конструкт или систематическая ошибка измерения,- конструктная валидность окажется меньше.
Легко заметить, что оценка конструктной валидности предполагает какую-то связь между проверкой содержательных теоретических гипотез и проверкой качества измерения. Действительно, оценка конструктной валидности посредством сопоставления теоретической модели "поведения" изучаемой переменной с реальными отношениями индикаторов требует включения модели измерения (см. выше) в более широкую теоретическую модель.
Предположим, мы используем некоторый суммарный показатель - индекс "демократизма политической системы", состоящий из ряда индикаторов (Х1, Х2, Х3), каждый из которых имеет свой собственный "вес" в индексе демократизма. К таким индикаторам могут относиться наличие парламента (номинальная дихотомическая157 переменная), количество независимых телерадиокомпаний и т.п. Исходя из теоретической модели, мы ожидаем, что степень "демократизма" находится в обратной связи с долей ВНП, расходуемой на модернизацию вооружений. Основываясь на этой модели (см. рис. 11), можно проверить конструктную валидность изобретенного нами индекса демократизма.


С










Рис. 11. Модель взаимосвязи для переменных "демократизм"
и "доля расходов на вооружение"
Собрав необходимые данные для 10-15-и национальных государств, мы можем обнаружить, что наш индекс "демократизма" невалиден, так как ожидаемое отношение между теоретическими переменными (с) не выполняется, их корреляция равна нулю. Просмотрев наши данные, мы, например, обнаружим, что в некоторых странах, почитаемых за образец демократического общественного устройства, изрядную часть бюджета составляют военные расходы, тогда как некоторые деспоты из "банановых республик" вполне обходятся кремневыми ружьями. Однако вывод о невалидности нашего измерения "демократизма" верен лишь в том случае, если верны наши теоретические представления о связи демократии и пацифизма. Если же демократия и пацифизм отнюдь не связаны друг с другом, наши результаты вовсе не доказывают низкую валидность индикатора: вполне возможно, что как раз "демократию" мы измеряли правильно, но неверна была наша теоретическая гипотеза. Существует своеобразное отношение дополнительности между собственно теоретическими моделями и моделями измерения. Оценить качество показателей в модели измерения (см. левую часть рис. 11) можно, лишь приняв теоретическую модель как безусловно верную. Для оценки справедливости собственно теоретической модели (см. верхнюю часть рисунка), нужно принять предположение о конструктной валидности индикаторов и провести новое исследование с новыми данными.
Существуют сложные статистические методы, позволяющие одновременно оценивать модель измерения и теоретическую модель (часто их называют "LISREL-методы"). Они применимы лишь к моделям с несколькими индикаторами для каждой переменной. Однако некоторые методологи полагают - на наш взгляд, справедливо, - что попытки проверить модель измерения и совокупность теоретических гипотез на одних и тех же данных чреваты возможностью ошибочных выводов. Если теория, предсказания которой мы используем для проверки конструктной валидности, относительно нова и не стала еще общепринятой истиной, мы просто не сможем определить, связан ли отрицательный результат исследования с невалидностью показателя, или причиной всему - ложные теоретические представления. Кроме того, может оказаться, что мы отберем худший из показателей, ибо именно он поддерживает неверную теорию. Поэтому проверка конструктной валидности индикаторов и проверка теорий требуют от нас разных исследований, множественных показателей и разных матриц данных.

Конструирование индексов и шкал
Использование нескольких индикаторов, как было показано выше, увеличивает валидность и надежность измерения переменных. Здесь, однако, возникает новая проблема: как использовать полученные значения индикаторов для того, чтобы охарактеризовать каждый "случай" (каждого респондента, группу, страну и т. п.) одним числовым значением, однозначно определяющим его положение на одномерном континууме переменной-признака, для измерения которой мы использовали данный набор индикаторов. Иными словами, нужно осуществить обратный переход от набора значений эмпирических индикаторов, описывающих каждую конкретную единицу анализа, к упорядочению всех единиц анализа по оси интересующей нас переменной. Такое упорядочение и называется собственно шкалой, мерой выраженности переменной-признака, а логика перехода от набора наблюдаемых значений к шкальным значениям называется моделью шкалирования. Заметим сразу, что некий набор индикаторов - например, набор оценочных шкал (см. гл. 5) - может использоваться для измерения более чем одной переменной, и, следовательно, данные о наблюдаемых значениях этих индикаторов в принципе позволяют упорядочить "случай" по нескольким переменным, т.е. по нескольким шкалам. Однако это уже задача многомерного шкалирования, мы же пока ограничимся обсуждением одномерных шкал и индексов.
Если вернуться к структурированной матрице данных "переменная х случай", то можно увидеть, что процедура конструирования шкалы может быть описана и как процедура "сжатия" матрицы данных, уменьшения ее размерности. Предположим, три строки нашей матрицы соответствуют переменным-индикаторам "доход", "род занятий" и "образование". Мы включили эти индикаторы в наше исследование ради того, чтобы охарактеризовать социально-экономический статус каждого респондента, т.е. расположить их от низкого статуса к высокому. Если мы вместо трех строк, соответствующих доходу, образованию и профессии, введем в нашу матрицу данных одну строку, отражающую положение каждого респондента на сконструированной нами шкале СЭС, размерность матрицы уменьшится. Однако сначала нам нужно решить, как объединить три значения - три строки матрицы - в одно, т. е. нам нужно избрать модель шкалирования.
Пусть, скажем, три строки нашей матрицы данных - это полученные каким-то образом (тестирование, опрос экспертов и т. п.) оценки "жизнерадостности", "энергичности" и "независимости". Исследователь предполагает, что эти три индикатора могут быть использованы для измерения важной для его теории переменной "сила Я". Все, что ему нужно сделать - это решить, как перевести оценки в строках 1-3 в оценки "силы Я" (см. рис. 12).

Переменные-
индикаторы
Субъект ("случай")
Л.М.
Ф.Ж.
К.Р.
...
1. жизнерадостность
2
0
2
...
2. энергичность
2
2
2
...
3. независимость
0
2
2
...





Рис. 12. Фрагмент матрицы данных "переменные х субъекты"

Самый простой и очевидный способ - это суммировать для каждого индивида оценки по каждому индикатору. Получившийся суммарный балл будет отражать индивидуальные различия в "силе Я", так как позволит упорядочить всех респондентов от минимального к максимальному значению этой переменной (в нашем примере - от 0 до 6 баллов). Еще одно преимущество суммирования - увеличение разброса индивидуальных значений. Действительно, максимально возможное различие по первичным индикаторам составляло 2 балла (от 0 до 2). В суммарном показателе разница между индивидуальными значениями может составить 6 баллов. Следовательно, суммарный балл - это более "чуткий" и надежный инструмент для упорядочения и может быть назван шкалой в смысле определения, данного нами выше. Однако в социологии суммарные показатели чаще называют индексами, чтобы подчеркнуть их единственное важное отличие от "больших" шкал. Индекс позволяет эффективно "свернуть" информацию, содержавшуюся в исходных индикаторах (вопросах, пунктах, тестах), однако от суммарного балла нельзя вернуться к исходной матрице, точнее, к тому паттерну ответов, который стоит за данным значением индекса. Если сформулировать это корректнее, индекс не позволяет учитывать различия в структуре ответов респондентов. Если снова обратиться к рисунку 12, то можно заметить, что субъекты Л. М. и Ф.Ж. имеют одинаковый суммарный балл, равный 4 (достаточно высокое значение!). Но можно ли считать несущественным то обстоятельство, что у Л. М. нулевой уровень независимости, а Ф. Ж. получил тот же суммарный балл из-за недостатка оптимизма? Предположим, даже довольно мрачный человек может обладать значительной "силой Я", но следует ли считать столь же "сильным" того, кто легко поддается давлению окружения?
В принципе индексы безусловно применимы в тех случаях, когда модель измерения (см. выше) предполагает, что некая латентная, т. е. не измеряемая непосредственно переменная, может быть измерена с помощью совокупности качественно однородных показателей. Во многих случаях различия в значимости, важности отдельных индикаторов можно учесть с помощью "взвешивания", пересчета значений с учетом "веса" каждого индикатора в латентной переменной. Так в примере с "силой Я" можно домножить все индивидуальные значения в строке "независимость" на 2, если принять предположение о том, что независимость влияет на латентную переменную с двукратным эффектом.
Экономисты часто используют индексы розничных цен, отражающие динамику стоимости жизни. При этом разные товарные группы, например, имеющие неодинаковое значение в потребительском бюджете, - как, скажем, хлеб и деликатесы - учитываются с разными весовыми коэффициентами. Но и в этом случае индекс остается несовершенным типом шкалы: эмпирическая информация здесь используется лишь для шкалирования различий между субъектами (или другими единицами анализа), но не для шкалирования различий между пунктами-ответами {эмпирическими индикаторами). Используя "взвешивание", мы вводим априорные ограничения на упорядочение входящих в индекс индикаторов, не зависящие от данных наблюдения.
Своеобразным переходом между моделью суммарного балла (индекса) и основными моделями шкалирования является шкала Р. Ликерта (Лайкерта). Исходным материалом для ее построения служат оценочные шкалы согласия-несогласия с суждениями, которые выражают более или менее "благожелательную" установку (см. раздел "Выбор формата для ответов" в гл. 5). Количество категорий ответа - "согласен", "совершенно согласен" и т. п. - обычно варьирует от двух до семи. Респондент получает балл по каждому суждению в зависимости от избранного им ответа. Присуждаемый данному ответу балл в свою очередь определяется "благожелательностью" ответа по отношению к измеряемой установке (интенсивностью согласия с суждением), т. е. ответы также упорядочены на одномерном континууме (от крайне негативной установки к крайне позитивной). Баллы, полученные за каждый ответ, суммируются. Суммарный балл, полученный индивидуумом, характеризует уже его собственное положение на установочном континууме (например, "консерватор", "умеренный консерватор", "умеренный либерал", "либерал"). Отметим сразу, что эта же модель шкалирования может использоваться и для измерения мотивации или осведомленности (соответственно респондента просят оценить степень важности какого-то объекта или сказать, верно или неверно определенное утверждение). Для отбора списка суждений, составляющих шкалу Ликерта, исходный список высказываний предъявляют репрезентативной выборке респондентов (так называемой выборке стандартизации). В окончательный список попадают те высказывания, для которых были получены высокие оценки надежности - согласованности и валидности. Обычно используют описанные нами ранее методы оценки надежности и валидности (коррелирование с суммарным баллом, сравнение "крайних групп" и т. п.).
Приведем в качестве примера некоторые высказывания "Теста для измерения художественно-эстетической потребности молодежи"158 (в скобках дан ключ к каждому высказыванию, показывающий, за какой ответ присуждается балл):
1. Думаю, что вполне можно обойтись без общения с произведениями искусства (неверно).
2. Я не люблю стихов (неверно).
3. Я коллекционирую записи классической музыки (верно).
4. ................................................................................................
Шкалирование по описанной модели дает ординальный уровень измерения.
Шкалы социальной дистанции Э. Богардуса - старейшая модель социологического шкалирования, не утратившая, однако, своей популярности. Исследователь разрабатывает совокупность вопросов, отражающих различную степень близости отношений с определенной социальной или этнической группой, например:
1. Согласны ли Вы, чтобы хорваты жили с Вами в одном городе?
2. Согласны ли Вы жить по соседству с хорватами?
3. Согласны ли Вы работать в одном отделе (учреждении) с хорватом?
4. Позволите ли Вы своей дочери выйти замуж за хорвата?
Предполагается, что согласие с каждым последующим утверждением отражает переход к очередной градации ординальной шкалы установок - от меньшей близости к большей. Существенным требованием к избранной совокупности вопросов является их содержательная валидность, иными словами, здесь необходимы экспертные процедуры, описанные выше. Важно также убедиться в обоснованности предположения об одномерности шкалируемой переменной. Если в данных, полученных при использовании шкал социальной дистанции, встречаются "нелогичные" (так называемые нешкалируемые) индивидуальные паттерны ответов, причиной чаще всего бывает влияние другой переменной. Примером нешкалируемого паттерна ответов может служить ситуация, когда респондент, отрицательно ответивший на "слабые" вопросы, неожиданно соглашается с более "сильными", предполагающими высокую степень близости (среди специалистов по социологическим методам имеет хождение соответствующая шутка: если человек, не желающий жить в одном городе с черными, согласен выдать свою дочь замуж за черного, это не ошибка измерения: просто он одинаково ненавидит негров и собственную дочь).
Шкала равнокажущихся интервалов Л. Терстоуна позволяет достичь более высокого уровня измерения установок, чем ординальный. Она представляет собой целый класс методов интервального шкалирования и будет рассмотрена здесь в качестве наиболее простого примера159.
Первая шкала равнокажущихся интервалов была описана в работе 1929 года и предназначалась для измерения остановок по отношению к церкви как социальному институту160. Этой работой мы воспользуемся для того, чтобы проиллюстрировать основные этапы предложенной Терстоуном процедуры.
Шкала Терстоуна позволяет расположить и суждения, и индивидов вдоль одномерного континуума установки, полюсам которого соответствует крайне благожелательное и крайне негативное отношение к объекту установки (церкви, партии, прогрессивному налогообложению или чему-либо еще). Шкальный балл суждения или индивида отражает степень этой благожелательности или неблагожелательности.
На первом этапе исследователь составляет максимально широкий список суждений (высказываний), выражающих интересующую его установку. Так, Терстоун собирал мнения коллег, студентов, высказывания из публикаций, касающихся церкви. Здесь уместны также интервьюирование, использование открытых вопросов ("Что Вы думаете о...?"), групповая дискуссия и т. п. Собранные суждения были подвергнуты первичному отбору. Исследователи отсеяли те высказывания, которые не удовлетворяли обычным требованиям к конструированию вопросов - двусмысленные, слишком длинные, содержащие специальные термины и т.п. (см. гл. 5 ). При первичном отборе суждений для шкалы Терстоуна используют и некоторые специальные критерии:
1. Исключаются суждения, относящиеся скорее к прошлому, чем к настоящему (например, "В средневековье церковь играла важную роль в общественной жизни").
2. Исключаются суждения, описывающие факты, а не мнения и отношения. Конечно, далеко не всегда можно отделить высказывания, описывающие фактическое положение дел, от прочих. Скажем, слова "Бог любит нас всех" - факт для верующего, хотя другие люди могут усмотреть в них определенное отношение к религии. В практических целях вполне достаточно руководствоваться следующим критерием для выявления фактических суждений, подлежащих устранению из шкалы Терстоуна: фактом является любое высказывание, для установления истинности которого могут быть использованы какие-то "посюсторонние" процедуры верификации.
3. Исключаются также суждения, содержащие слова "все", "всегда", "никто", "никогда", так как этим словам люди обычно придают различный смысл, что затрудняет интерпретацию.
В результате исходный список из 350-400 суждений сокращается до 100-120. Следующим этапом является "судейская" процедура, позволяющая определить шкальное значение для каждого суждения и провести среди них окончательный отбор. Терстоун предложил разделить гипотетический континуум благожелательного-неблагожелательного отношения к церкви на 11 категорий (от "А" до "К"), разделенных субъективно равными интервалами. Требование субъективного равенства интервалов между градациями весьма существенно для построения шкалы Терстоуна и обычно его специально подчеркивают в инструкции для "судей" (например, "Представьте, что карточки с буквами от "А" до "К" представляют расположенные на равном расстоянии градации шкалы, так что градации "А" соответствует максимально благожелательное отношение к Х (объекту установки), а "К" - максимально неблагожелательное, негативное отношение"). Каждое из утверждений списка печатается на отдельной карточке, которые и раздаются "судьям" (в конструировании шкалы установок по отношению к церкви участвовало 300 таких экспертов). Задача "судей" заключается в том, чтобы разложить все 100-120 суждений по 11 рубрикам соответственно степени выраженного в них благожелательного или неблагожелательного отношения к объекту остановки.
Подчеркнем, что "судей" не просят высказать их собственное мнение, они должны лишь рассортировать высказывания.
Шкальное значение (балл) каждого из высказываний определяется распределением оценок "судей", поэтому началом следующего этапа (собственно построения шкалы) является подсчет процента экспертов, положивших высказывание в определенную стопку. Далее подсчитывается суммарный (кумулятивный) процент "судей", отнесших суждение к данной градации и предшествующим градациям. Терстоун присваивал использовавшимся градациям числовые значения от 1 (градация "А", максимально благожелательное отношение к церкви) до 11 (градация "К"). Проиллюстрируем дальнейшее на примере гипотетического суждения N, данные для которого представлены в таблице 6.1.
Таблица 6.1
Распределение "судейских" оценок для суждения N

Градация (числовое значение)
"А" (1)

"В" (2)

"С" (3)

"D" (4)

"Е" (5)

"F" (6)

"G" (7)

"Н" (8)

"I" (9)

"J" (10)

"K" (11)

Процент судей, отнесших суждение к данной градации
1

2

2

1

3

33

34

12

7

3

2

Кумулятивный процент
1

3

5

6

9

42

76

88

95

98

100


Распределение кумулятивных (накопленных) процентов позволяет вычислить значения медианы и междуквартильного размаха. Медиана, или процентиль 50 в распределении накопленных частот, - это такое значение на шкале "А" - "К", относительно которого половина судей дала большие, а другая половина - меньшие оценки данного утверждения161. Медиана, таким образом, делит пополам упорядоченное множество значений признака. Вычислить медиану мы можем по следующей формуле:


В методе Терстоуна ширина интервала между соседними численными градациями по определению равна 1 (равнокажущиеся интервалы). В используемом нами примере границами интервала, где расположена медиана (процентиль 50), являются градации "F" и "G" (см. табл. 6.1). Фактической нижней границей интервала медианы будет значение 6,5162, отсюда:



Значение медианы и принимается за шкальный балл ("цену") суждения. Для гипотетического суждения N в нашем примере он оказался равен 6,7. (В принципе более простым является графический метод нахождения медианы. Для этого на миллиметровой бумаге строится кривая накопленных процентов - огива, позволяющая легко найти числовое значение, соответствующее процентилю 50.)
Ясно, однако, что не все суждения, получившие оценку "судей", в равной мере пригодны для шкалы: некоторые из суждений получат весьма согласованные и единодушные оценки экспертов, тогда как другие вызовут разнобой во мнениях. Для оценки внутренней согласованности отдельных высказываний шкалы Терстоун применил меру разброса судейских оценок - междуквартильный размах. (Здесь снова вместо распределения абсолютных частот экспертных оценок используется распределение процентилей, т. е. накопленные частоты выражают в кумулятивных процентах, что позволяет сравнивать выборки разного объема.) Междуквартильный размах - это расстояние между первым и третьим квартилем распределения. Первый квартиль (Q1) задается точкой на оси, до которой лежит 25% полученных оценок суждения, а третий ((Q3) - точкой, выше которой лежит 25% оценок. (Легко видеть, что второму квартилю соответствует медиана.) Для вычисления междуквартильного размаха (Q3 ? Q1) сначала устанавливаются значения, соответствующие первому и третьему квартилям распределения. Для этого используются формулы, аналогичные формуле для медианы, с соответствующими поправками: берется фактическая нижняя граница интервала соответствующего квартиля, кумулятивный процент для нижней границы интервала данного квартиля и т. д. Так, для первого квартиля формула подсчета такова:

Для нашего примера с суждением N:



Читатель может самостоятельно выписать аналогичную формулу для третьего квартиля (75 процентиль), произвести необходимые подсчеты и убедиться, что для вымышленного суждения N междуквартильный размах (Q3 ? Q1) составит 1,7. Те суждения, для которых разброс оценок, измеренный через междуквартильный размах, оказывается слишком велик, исключаются из шкалы Терстоуна. Предполагается, что высказывание, получившее столь разные оценки, воспринимается слишком неоднозначно. Так, Терстоун исключил из первоначально предъявленного "судьям" списка 90 высказываний из 130. В результирующей шкале оставляют одно-два высказывания для каждого деления шкалы, чтобы все градации предполагаемого установочного континуума оказались в равной мере представлены.
Если получившуюся шкалу предъявить теперь группе респондентов, то индивидуальным баллом каждого субъекта, выражающим меру "благожелательность" его установки, можно считать медиану (или средний балл) всех суждений, с которыми он согласился.
Многие критики шкалы Терстоуна указывали на возможность влияния на получаемые результаты характеристик "судейской" группы и широты диапазона предлагаемых суждений163. Все же существуют веские основания считать, что такая шкала обладает вполне удовлетворительной воспроизводимостью и в среднем диапазоне дает уровень измерения, превосходящий ординальный (является так называемой шкалой разностей). Удаление или прибавление пункта шкалы не меняет шкальных значений других пунктов-высказываний. Приведем некоторые примеры высказываний, включенных Терстоуном в окончательный вариант шкалы установок по отношению к церкви (в скобках указан шкальный балл суждения):
* "Я думаю, что церковь - это наиважнейший социальный институт в современной Америке" (0,2);
* "Когда я нахожусь в храме, мне доставляет удовольствие наблюдать за службой, особенно если при этом звучит хорошая музыка" (4,0);
* "Я ощущаю потребность в какой-то религии, но не нахожу того, что мне нужно, ни в одной из существующих церквей" (6,1);
* "С моей точки зрения, церковь безнадежно устарела" (9,1).
В основе шкалы Гутмана также лежит идея кумулятивности: одни высказвания-пункты имеют большую "нагрузку" на одномерном континууме шкалируемой переменно-признака, другие - меньшую. Модель шкалирования, предложенная Гутманом, подразумевает, что в идеальном случае респондент, согласившийся с более "нагруженным" пунктом, согласится и со всеми менее "нагруженными". Таким образом, знание максимального шкального балла респондента позволяет полностью воссоздать паттерн его ответов. Шкалируемая переменная-признак не обязательно является установкой, она может характеризовать поведение: одна из первых гутмановских шкал, например, содержала пункты, описывающиен симптомы реактивного невроза, расстройства сна, тошнота, страх и т.п.164 В предложенной Гутманом процедуре обычно используется совокупность дихотомических вопросов, т.е. вопросов, на которые могут быть даны лишь два ответа: "да" или "нет", "согласен" или "не согласен". Совокупность вопросов или утверждений, составляющих гутмановскую шкалу, должна обладать одним существенным свойством: вероятность положительного ответа монотонно возрастает с ростом значения шкалируемой (латентной) переменной. Отсюда следует, что субъекты, имеющие больший шкальный балл, т.е. большее значение латентной переменной, с большей вероятностью дают положительный ответ на каждый отдельный вопрос165. Это условие легко проиллюстрировать на примере следующих вопросов о росте (для простоты изложения предположим, что ошибка измерения отсутствует, т.е. все респонденты знают и точно сообщают свой истинный рост):
1. Верно ли, что Ваш рост превышает 1,50 м?
2. Верно ли, что Ваш рост превышает 1,60 м?
3. Верно ли, что Ваш рост превышает 1,70 м?
Эти вопросы образуют идеальную гутмановскую шкалу: если ошибка измерения отсутствует, любой респондент, ответивший положительно на вопрос 3, дает положительный ответ и на вопросы 2 и 1. Вообще, зная максимальный балл респондента, мы можем полностью воссоздать его паттерн ответов. Для вопросов о росте все возможные паттерны ответов (шкальные типы) приведены в табл. 6.2.
Таблица 6.2
Ответы на вопросы о росте для четырех гипотетических респондентов

Вопрос, № п/п
Респондент
1
2
3
А
+
+
+
Б
+
+
?
В
+
?
?
Г
?
?
?

Если респондентов и вопросы расположить на одной шкале латентной переменной (в данном случае, "роста"), то станет очевидным, что респонденты реагируют на вопросы в зависимости от своего ранга (положения) на этой же шкале: респондент данного роста, позитивно прореагировавший на некий вопрос-пункт, будет также позитивно реагировать на все пункты, имеющие более низкий ранг (в нашем примере, на все более "низкорослые" вопросы-пункты). Скажем, для примера с ростом совместное упорядочение вопросов и респондентов на гутмановской шкале могло бы выглядеть, как на рисунке 13.



Низкий рост Высокий рост






Рис. 13. Шкала Гутмана для трех вопросов о росте
и четырех респондентов

Легко видеть, что в нашем примере самыми "популярными" (имеющими наибольшую частоту положительных ответов) будут менее "нагруженные" по шкалируемой переменной вопросы. С другой стороны, большее число положительных ответов будет у тех респондентов, для которых значение шкалируемой переменной выше.
Для того чтобы определить, является ли данная совокупность вопросов шкалируемой, т.е. дает ли она хорошее приближение к идеальной модели шкалирования по Гутману, нужно, во-первых, убедиться, что вопросы по своему смыслу могут соответствовать вышеописанному условию монотонного возрастания вероятности положительного ответа. Так, например, рассмотренные выше вопросы шкалы социальной дистанции Богардуса теоретически могут составить гутмановскую шкалу. Однако так называемые точечные вопросы ? например: "Верно ли, что Ваш рост равен 1,65 м?" ? наверняка не могут быть использованы в рамках рассматриваемой шкальной модели. Дальнейшая процедура построения гутмановской шкалы заключается в проверке соответствия реальных данных модели совершенной шкалы Гутмана и ее лучше рассмотреть на конкретном примере.
Допустим, некий социолог пытается измерить переменную "благопристойность", которую он почему-то связывает со стремлением следовать нормативным предписаниям, регулирующим публичное (т. е. безличное) социальное общение. Среди использованных им вопросов есть три следующих:
1. Вы обычно стучите в дверь кабинета или комнаты, прежде чем войти (верно, неверно).
2. В публичных обсуждениях или дискуссиях Вы высказываете свое мнение лишь тогда, когда Вас прямо об этом попросят (верно, неверно).
3. Вы предпочтете промолчать, если Вам покажется, что Ваше справедливое и существенное замечание может вызвать раздражение у окружающих (верно, неверно).
Конечно, можно предположить, что некоторые из изобретенных исследователем вопросов отражают скорее "социальную тревожность" или "конформизм", но в данном случае мы будем руководствоваться тем, что идеальных индикаторов не бывает: бывают индикаторы, дающие лучшее или худшее приближение к идеальной шкале для реальных данных.
Итак, социологу предстоит проверить, насколько полученное им эмпирическое распределение ответов соответствует тем теоретически возможным паттернам ответов на три вопроса, которые в таблице 6.2 образуют безупречный "параллелограмм", характерный для идеальной гутмановской шкалы. Для случая трех вопросов возможны четыре "правильных" паттерна ответов, обозначаемых обычно как школьные типы ответов:
1. + + +
2. + + ?
3. + ? ?
4. ? - -
Предположим, что наш социолог получил следующую картину распределения шкальных типов (см. табл. 6.3).
Таблица 6.3
Распределение ответов для шкальных типов

Вопросы


Ответы
Вопрос 1 ("стук в дверь")
Вопрос 2 ("публичная дискуссия")
Вопрос 3 ("опасение вызвать раздражение")
Число случаев, N

Паттерн ответа
("+" - "верно",
"-" - "неверно"):

+
+
+
30

+
+
-
50
+
-
-
45
-
-
-
10

Всего 135

Судя по таблице 6.3, априорное упорядочение вопросов совпало с реальным: самый "легкий" первый вопрос оказался и самым популярным (см. выше), тогда как на самый "тяжелый" вопрос шкалы положительно ответили лишь 30 опрошенных: нежелание высказывать свою точку зрения требует значительно большего количества "благопристойности", чем привычка стучать в дверь.
Если бы использованный нами исходный порядок вопросов не совпал бы с их реальным ранжированием по числу позитивных ответов, то это само по себе не доказывало бы "нешкалируемости" данной совокупности пунктов: для того, чтобы получить столь же красивую "гутмановскую" картину распределения ответов, как в предыдущей таблице 6.2, было бы достаточно просто переставить столбцы таблицы так, чтобы первым оказался самый популярный вопрос с наибольшим числом положительных ответов и т. д. (Упорядоченную таким образом таблицу обычно называют шкалограммной матрицей, или шкалограммой.)
Реальной проблемой в нашем примере, как и в большинстве случаев построения гутмановской шкалы, стало наличие так называемых нешкальных типов, т. е. таких паттернов ответа, которые попросту не укладываются в логику одномерной модели с монотонно возрастающей вероятностью ответа. Примером "нешкального" паттерна мог бы быть положительный ответ на третий вопрос при отрицательных ответах на первые два вопроса (- - +). То обстоятельство, что некий респондент, бесцеремонно входящий в чужую дверь без стука, боится открыто выразить свое мнение, может быть и случайной ошибкой, и результатом влияния какой-то посторонней переменной: возможно, отвечая на третий вопрос, этот человек думал не о хороших манерах, а о том, что высказывать свое мнение открыто в его привычной среде "невыгодно", недальновидно и т. п. Для того чтобы проверить шкальную гипотезу о том, что данная совокупность вопросов дает хорошее приближение к гутмановской шкале, нам следует трактовать "нешкальные" типы ответа как ошибки и оценить, насколько велико отклонение от идеальной модели. Пусть наш исследователь получил следующее распределение "нешкальных" типов (см. табл. 6.4).
Разумно предположить, что "нешкальный" тип - - + можно отнести к шкальному типу - - - с одной ошибкой. Второй "нешкальный" паттерн ответа - + + можно рассматривать как отклонение от школьного типа + + + также с одной ошибкой (если бы мы отнесли этот "нешкальный" паттерн к типу - - -, то ошибок было бы две, а не одна). Существуют разные способы оценки приемлемости наблюдаемых отклонений от совершенной шкалы, содержащей лишь шкальные паттерны ответа. Здесь мы воспользуемся самым простым и грубым, рассчитав коэффициент воспроизводимости шкалы Rep (от англ. reproducibility) по следующей формуле:

В нашем примере мы, основываясь на идеальной модели шкалы, можем воспроизвести (предсказать) по три ответа для 143 респондентов. Всего мы сделаем 429 предсказаний для отдельных ответов. Из них 8 ответов окажутся ошибочными (каждая ошибка будет отличаться от ожидаемого ответа только на 1 балл). Коэффициент воспроизводимости составит, таким образом, 0,98 (или 98%).
Таблица 6.4
Распределение ответов для "нешкальных" типов

Вопросы

Ответы
Вопрос 1
("стук в
дверь")

Вопрос 2
("публичная
дискуссия")
Вопрос 3

стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>