Close

04.06.2020

Выборка в социологическом исследовании или как получать достоверную информацию быстро и надежно (часть 2)

Авторы статьи — А.М. Степанов, социолог отдела аналитических и социологических исследований, М.В. Иванов, начальник отдела аналитических и социологических исследований МАУ «ИРСИ».

Параметры расчета выборочной совокупности

Вне зависимости от метода расчета выборки нужно помнить о ключевых параметрах, влияющих на объем выборочной совокупности. Таких параметров мы выделим три – это общий объём, однородность и абсолютная ошибка.

Общий объем генеральной совокупности. Чем больше изучаемая генеральная совокупность, тем больший объем выборки нам может понадобиться для репрезентативного исследования. Однако это утверждение касается лишь определенного числового диапазона! Увеличение выборки идет не пропорционально увеличению генеральной совокупности. Ведь если речь пойдет о генеральной совокупности как о малочисленной величине, исчисляемой десятками и сотнями единиц, то целесообразно предположить, что чем больше будет объем выборки, тем точнее данные. В идеале можно и нужно стремиться, чтобы в таком случае выборка составляла не менее 50%, а то и 2/3 изучаемой генеральной совокупности. Если же (а чаще всего это так и есть) мы имеем дело с генеральными совокупностями, исчисляемыми десятками, сотнями тысяч и миллионами (например, население крупного города, региона, страны), то, конечно же, мы не будем опрашивать ни 50%, ни 25%, ни 10%. Нам понадобится значительно меньшее число участников опроса (респондентов). Стоит отметить, что при сравнении выборки при объеме генеральной совокупности в 100 тысяч и 1 миллион человек, разница в объеме выборки может составить всего несколько десятков респондентов (см. таблицу).

+ В этих случаях достаточным будет более 50% от объема выборки.

Источник: Мангейм Дж.Б., Рич Р.К. Политология: Методы исследования. – М., 1997. С.517.

Однородность генеральной совокупности. В данном случае речь идёт об однородности признаков у единиц генеральной совокупности. То есть чем более схожи между собой единицы генеральной совокупности, тем меньше потребуется объем выборки для представления репрезентативных результатов исследования. Причем под однородностью рассматриваемых признаков мы можем понимать и социально-демографические характеристики (пол, возраст, уровень образования, район проживания, социальное положение), ценностные и социально-политические ориентации, культурно-языковые различия, материальный достаток и т.д.

Размер ошибки (погрешности) выборки. Задачи и характер исследования определяют допустимый размер погрешности полученных данных. Самым оптимальным и часто используемым вариантом при расчете выборки является ошибка в 5%, она позволяет получить данные с высокой степенью репрезентативности и при этом не затратить много ресурсов на опрос излишнего числа респондентов. Для прикладного исследования нормальной будет выборка с ошибкой 4–5%. Ошибка выборки, рассчитываемой ВЦИОМ, ФОМ (для федеральных исследований), находится на уровне не ниже 2,5%. Стандартные выборки МАУ ИРСИ по г. Ярославлю обеспечивает ошибку выборки в диапазоне от 3,6 до 4,8%. Если говорить простым языком о том, что собой представляет ошибка выборки в 5%, то можно представить, что в случае проведения 100 одинаковых исследований по одной и той же теме и с одинаковым объемом выборки в 95 случаях из 100 результаты исследования будут совпадать с мнением всей генеральной совокупности. Однако в определенных случаях требуется снижение ошибки выборки, которое чаще всего производится посредством наращивания объема выборочной совокупности.

В зависимости от имеющихся ресурсов и задач исследования для формирования выборки существует несколько способов. В первую очередь нужно понимать, что отбор единиц в выборочную совокупность может происходить как случайным образом, так и неслучайным. Случайной или вероятностной выборкой можно назвать только ту выборочную совокупность, в которой соблюдается принцип равной вероятности для каждой единицы генеральной совокупности попасть в выборку. Такой способ формирования выборки наиболее актуален для небольшого объема генеральной совокупности, поскольку при изучении больших групп принцип равной вероятности для всех элементов генеральной совокупности соблюсти крайне затруднительно или нецелесообразно, с точки зрения высоких затрат ресурсов. Для  соблюдения принципа равной вероятности случайной выборки зачастую используют механический отбор, такой отбор возможен только при наличии полного списка единиц генеральной совокупности, которые можно упорядочить по определенному признаку. В рамках механического отбора из списка выбирается случайным образом первый элемент, который служит отправной точкой, и каждый последующий выбирается через определенный шаг. Размер шага определяется частным размера генеральной совокупности и размера предполагаемой выборки K(шаг) = N(генеральная совокупность)/n(выборочная совокупность).

Другим способом для соблюдения принципа случайности в выборке может быть стратифицированный (районированный) отбор. Данный метод полезен в случае неоднородной генеральной совокупности и подразумевает разделение единиц генеральной совокупности, на более мелкие группы по определенным признакам. Внутри каждой выделенной группы производится отбор единиц в выборочную совокупность случайным образом или при помощи механического отбора. Наиболее корректно использовать этот метод в том случае, когда в результате разделения на группы по выбранным признакам внутри каждой группы образуется небольшое количество единиц, или когда существует полный список единиц каждой выделенной группы, что позволяет в дальнейшем отборе соблюсти принцип равной возможности для каждой единицы попасть в выборку.

Кластерный (гнездовой) отбор является еще одним методом при формировании случайной выборки, в рамках данного метода производиться случайным образом отбор целых групп (кластеров) из генеральной совокупности. Впоследствии производится отбор единиц из кластеров в выборочную совокупность, в зависимости от объема кластера это могут быть как и все единицы кластера, так и часть из них, отобранная случайным образом. Например, в случае отбора по территориальному признаку кластером могут служить населенные пункты, отобранные в случайном порядке. В зависимости от количества населения производится опрос всех жителей или только жителей, отобранных случайным образом. При наличии полного списка единиц в каждом кластере возможен отбор единиц с применением механического отбора. 

В исследованиях, где в качестве генеральной совокупности выступают тысячи или даже миллионы людей, наиболее удобно использовать выборки с неслучайным отбором, где отбор производится по заранее заготовленной схеме или стихийным образом. Стихийная выборка подразумевает опрос по принципу «всех подряд» из наиболее доступных респондентов. Здесь, как правило, производится опрос наиболее удобных для интервьюера респондентов. Зачастую стихийная выборка страдает слабой репрезентативностью по причине несоответствия некоторых признаков выборочной совокупности признакам генеральной. Происходит это вследствие упущения в ходе исследования некоторых значимых категорий респондентов, которые являются труднодоступными для интервьюера. Поэтому данный способ формирования выборки может использоваться в условиях ограниченности ресурсов.

Наиболее предпочтительным выглядит вариант с использованием квотной выборки. Суть данного метода сводится к тому, чтобы выделить несколько интересующих социальных групп по признакам, обусловленным задачами исследования. Далее необходимо рассчитать объем респондентов для опроса в каждой группе, то есть объем квоты для каждой группы, руководствуясь сохранением пропорций признаков  генеральной совокупности в выборке. На примере гендерной характеристики можем представить, что если в генеральной совокупности соотношение женщин и мужчин 55% на 45%, то именно такое же соотношение женщин и мужчин должно быть в рамках выборочной совокупности.

Аналогичным образом  составляются квоты и по другим признакам. Целью данного подхода является максимальное повторение в рамках выборки свойств и особенностей генеральной совокупности. Иногда для упрощения поиска респондентов, подходящих под критерии отбора, может использоваться метод «снежного кома». Особенность «снежного кома» во многом объясняется названием метода и подразумевает поиск контактов подходящих для опроса людей у респондентов, уже участвовавших в опросе. Как правило, это выглядит следующим образом: по завершении опроса интервьюер интересуется у респондента, нет ли среди его друзей и знакомых, подходящих под параметры исследования, и просит дать контакты подходящих людей. Данная процедура повторяется до тех пор, пока не будет опрошено необходимое количество респондентов. Основной минус данного метода отбора респондентов заключается в предъявлении высоких требований к коммуникативным навыкам интервьюеров, поскольку контакты родственников и друзей являются персональными данными, и многие респонденты отказываются их давать, особенно если интервьюеру не удается расположить собеседника к себе.

Еще одним методом отбора для построения неслучайной выборки является метод основного массива, который подразумевает отбор единиц, имеющих наибольшую удельную значимость, по мнению исследователя; и если существует возможность, то отбирается абсолютное большинство единиц из генеральной совокупности. Данный метод может быть полезен, когда объектом для изучения являются узкая категория людей, специалисты той или иной отрасли. В случае необходимости проведения опроса, например среди медработников в регионе, отбирается несколько наиболее крупных медицинских учреждений как имеющих наибольший вес, и проводится опрос медработников данных учреждений. Но если количество медучреждений не столь велико, и возможен охват абсолютного большинства медработников, то проводится опрос более 50% медицинских работников региона.

Существует еще несколько вариантов составления выборочной совокупности, некоторые методы являются комбинированием уже перечисленных, но хотелось бы рассмотреть применение наиболее оптимальных методов построения выборки на примере населения г. Ярославля. Золотым стандартом, на наш взгляд, при проведении исследования, где в качестве генеральной совокупности выступают все жители Ярославля, является применение квотной выборки.  Мы используем при расчете квот трехмерное распределение, а именно распределение по половому признаку, возрасту и району проживания, что позволяет в рамках выборочной совокупности повторить пропорции генеральной совокупности по указанным признакам. Такой подход позволяет учесть мнение всех категорий жителей Ярославля: мужчин и женщин, молодежи, работающего населения, пенсионеров, жителей всех районов города. При этом сохраняется удельная значимость каждой из указанных категорий так же, как в генеральной совокупности.  Как это выглядит? Например, если в Ярославле в Дзержинском районе проживает гораздо больше жителей города, чем в Кировском районе города, то мнение жителей Дзержинского района имеют гораздо большее влияние на формирование мнения всего населения города, чем мнение жителей Кировского района. Наша задача состоит в том, чтобы сохранить подобную пропорциональность генеральной совокупности в рамках выборки. Если говорить о конкретных цифрах, то для репрезентативных результатов мнения жителей города с населением более чем 600 тыс. при использовании квотной выборки и соблюдением ошибки не более 5% достаточно опросить 400 человек. В случае, когда проблема исследования носит более дифференцированный характер, и предполагается, что данная проблема может затрагивать различные категории жителей по-разному, целесообразно расширить объем выборки до 500-600 человек.

В случае, когда проблема исследования носит общий или даже глобальный характер, и предполагается, что дифференциация по полу и возрасту, району проживания вряд ли может серьезно оказывать влияние на мнение респондента, может использоваться метод стихийной выборки. Метод стихийного отбора позволяет существенно сократить время и ресурсы на проведение исследования, однако в таком случае рекомендуется расширить объем выборки до 600, а в некоторых случаях до 750 или даже 1000 человек, чтобы минимизировать вероятность потери какой-либо категории респондентов в процессе проведения опроса.

Использование случайных методов формирования выборки для проведения опроса среди населения достаточно крупного города выглядит нерационально и порой даже нереалистично. Ведь жители Ярославля в качестве генеральной совокупности есть  величина непостоянная, поскольку ежедневно жители города как приезжают, так и покидают город, и в таких условия обеспечить принцип равного шанса попадания в выборку для всех жителей Ярославля проблематично. Использование механического отбора требует полного списка всех жителей Ярославля с контактными данными, получение которого не представляется возможным в силу федерального закона «О персональных данных», а также выглядит нецелесообразным ввиду высокой трудоемкости процесса и больших временных затрат на построение выборки.

Подводя итог, хочется сказать о том, что грамотно составленная выборка на сегодняшний день — это ключ к оперативному получению достоверной и актуальной информации, которая поможет в принятии правильных управленческих решений. Главное достоинство использования выборки — это, конечно же, экономия времени и трудовых ресурсов. Получаемая информация с течением времени  и в зависимости от происходящих процессов в обществе может быстро терять актуальность и уже не отражать полной картины социальной реальности, что в свою очередь может повлечь принятие ошибочных решений. Отсюда можно сделать вывод о том, что исследование, задачей которого является получение объективной информации о текущем положении дел, проведенное в кротчайшие сроки с использованием грамотно составленной выборки, даст более актуальную информацию и объективную картину, чем исследование с большим охватом опроса в 6,  10, 15 и более тысяч человек. Исследование с бОльшим охватом респондентов требует бОльшего времени для проведения опроса, за этот период положение дел может значительно измениться, и ответы, полученные в начале исследования, могут к его окончанию стать устаревшими и неактуальными; как итог — будет потерян весь смысл такого исследования. Желаете получить достоверную, актуальную и надежную информацию по вашей проблеме в результате проведения социологического исследования? Специалисты МАУ ИРСИ помогут вам в этом!