Часто буває так, що необхідно проаналізувати яке-небудь конкретне соціальне явище і отримати інформацію про нього. Такі завдання часто виникають в статистиці і при статистичних дослідженнях. Перевірити цілком певне соціальне явище найчастіше буває неможливим. Наприклад, як дізнатися думку населення або всіх мешканців певного міста з якого-небудь питання? Питати абсолютно всіх – справа практично неможливе і дуже трудомістке. У таких випадках нам і необхідна вибірка. Саме це поняття, на якій ґрунтуються практично всі дослідження і аналізи.
Що таке вибірка
При аналізі конкретного соціального явища необхідно отримати інформацію про нього. Якщо взяти будь-яке дослідження, то можна помітити, що дослідження та аналізу підлягає не кожна одиниця сукупності об’єкта дослідження. До уваги береться тільки певна частина всієї цієї сукупності. Ось цей процес і є вибіркою: коли досліджуються лише деякі одиниці з безлічі.
Звичайно ж, багато чого залежить від виду вибірки. Але є і основні правила. Головне з них свідчить, що відбір із сукупності повинен бути абсолютно випадковим. Одиниці сукупності, які будуть використані, не повинні бути обрані з-за якого-небудь критерію. Грубо кажучи, якщо необхідно набрати сукупність з населення певного міста і відібрати тільки чоловіків, то в дослідженні буде помилка, тому що відбір був проведений не випадково, а відібраний за гендерною ознакою. Практично всі методи вибірки базуються на цьому правилі.
Правила вибірки
Для того щоб відібрана сукупність відображала основні якості всього явища, вона повинна бути побудована за конкретними законами, де основну увагу необхідно приділяти наступним категоріям:
- вибірка (вибіркова сукупність);
- генеральна сукупність;
- репрезентативність;
- помилка репрезентативності;
- одиниця сукупності;
- способи побудови вибірки.
Особливості вибіркового спостереження та складання вибірки полягають у наступному:
- Всі отримані результати засновані на математичних законах і правилах, тобто при правильному проведенні дослідження і при правильних розрахунках результати не будуть спотворені за суб’єктивною ознакою
- Дає можливість значно швидше і з меншими витратами часу і ресурсів отримати результат, вивчаючи не весь масив подій, а тільки їх частину.
- Може бути застосовано для вивчення різних об’єктів: від конкретних питань, наприклад, вік, стать цієї групи, до вивчення громадської думки або рівня матеріального забезпечення населення.
Вибіркове спостереження
Вибіркове – це таке статистичне спостереження, при якому дослідженню підлягає не вся сукупність, що вивчається, а лише деяка, відібрана певним чином її частину, а отримані результати вивчення цієї частини поширюються на всю сукупність. Ця частина називається вибірковою сукупністю. Це єдиний спосіб вивчення великого масиву об’єкта дослідження.
Але вибіркове спостереження може використовуватися тільки в тих випадках, коли необхідно дослідити лише малу групу одиниць. Наприклад, при дослідженні співвідношення чоловіків до жінок у світі, буде використовуватися вибіркове спостереження. Зі зрозумілих причин – взяти під увагу кожного жителя нашої планети неможливо.
А ось при такому ж дослідженні, але не всіх жителів землі, а певного 2 «А» класу в конкретній школі, певного міста, певної країни, може обійтися без вибіркового спостереження. Адже проаналізувати весь масив об’єкта дослідження – цілком можливо. Необхідно порахувати хлопчиків і дівчаток цього класу – от і буде співвідношення.
Вибіркова і генеральна сукупність
Насправді все не так складно, як звучить. В будь-якому об’єкті вивчення є дві системи: генеральна і вибіркова сукупність. Що ж це таке? Всі одиниці належать до генеральної. А до вибіркової – ті одиниці загальної сукупності, які були взяті для вибірки. Якщо все правильно зроблено, то відібрана частина буде становити зменшений макет всієї (генеральної) сукупності.
Якщо говорити про генеральної сукупності, то можна виділити всього два її різновиди: визначена та невизначена генеральна сукупність. Залежить від того, чи відомо загальна кількість одиниць даної системи чи ні. Якщо це визначена генеральна сукупність, то вибірку буде робити легше з-за того, що відомо, який відсоток від загальної кількості одиниць складатиме вибірка.
Цей момент дуже необхідний в дослідженнях. Наприклад, якщо необхідно дослідити відсоток недоброякісної продукції кондитерських виробів на конкретному заводі. Припустимо, що генеральна сукупність вже визначена. Точно відомо, що в рік це підприємство виробляє 1000 кондитерських виробів. Якщо зробити вибірку 100 випадкових кондитерських виробів з цієї тисячі і відправити їх на експертизу, то похибка буде мінімальною. Грубо кажучи, дослідженню підлягало 10 % всієї продукції, і за результатами можемо, прийнявши до уваги помилку репрезентативності, говорити про недоброякісність всієї продукції.
А якщо провести вибірку 100 кондитерських виробів з невизначеною генеральної сукупності, де їх насправді було, припустимо, 1 млн одиниць, то результат вибірки і самого дослідження буде критично неправдоподібним і неточним. Відчуваєте різницю? Тому визначеність генеральної сукупності у більшості випадків вкрай важлива і дуже сильно впливає на результат дослідження.
Репрезентативність сукупності
Отже, тепер один з найголовніших питань – якою повинна бути вибірка? Це найголовніший момент дослідження. На цьому етапі необхідно розрахувати вибірку і відібрати одиниці із загального числа в неї. Сукупність була відібрана правильно, якщо певні особливості і характеристики генеральної сукупності залишається і у вибірковій. Це називається репрезентативністю.
Іншими словами, якщо після відбору частина зберігає ті ж самі тенденції та особливості що і всі кількість досліджуваного, то така сукупність називається репрезентативною. Але не кожна певна вибірка може бути відібрана репрезентативної сукупності. Бувають і такі об’єкти дослідження, вибірка яких просто не може бути репрезентативною. Звідси і виникає поняття помилки репрезентативності. Але про це поговоримо докладніше трохи більше.
Як зробити вибірку
Отже, щоб репрезентативність була максимальною, виділяють три основні правила вибірки:
- Самим унікальним показником числа вибірки вважається 20 %. Статистична вибірка 20 % буде практично завжди давати результат максимально наближена до дійсності. У той же час немає потреби переносити в зібрану більшу частину генеральної сукупності. 20 % вибірки – це той показник, який вироблений багатьма дослідженнями. Наведемо ще трохи теорії. Чим більша вибірка, тим менша помилка репрезентативності і точніше результат дослідження. Чим ближче буде вибіркова сукупність до генеральної за кількістю одиниць, тим більш точними і правильними будуть результати. Адже якщо досліджувати всю систему, тоді результат буде 100 %. Але тут вже немає вибірки. Це ті дослідження, в яких досліджується весь масив, всі одиниці, тому це нас не цікавить.
- У разі недоцільності обробки 20 % генеральної сукупності допускається вивчення одиниць сукупності в кількості не менше 1001. Це також один з показників дослідження масиву об’єкта дослідження, який виробився з часом. Звичайно ж, він не дасть точних результатів при великих масивах дослідження, але максимально наблизить до можливої точності вибірки.
- В статистиці існує безліч формул і зведених таблиць. В залежності від об’єкта дослідження і від критерію вибірки, існує доцільність вибору тієї чи іншої формули. Але цей пункт використовується в складних багатоетапних дослідженнях.
Похибка (помилка) репрезентативності
Головною характеристикою якості обраної вибірки є поняття «похибки репрезентативності». Що ж це таке? Це певні розбіжності між показниками вибіркового і суцільного спостереження. За показниками похибки репрезентативності ділять на надійну, звичайну і наближену. Інакше кажучи, припустимі відхилення в розмірі до 3 %, від 3 до 10 % та від 10 до 20 % відповідно. Хоча в статистиці бажано, щоб похибка не перевищувала 5-6 %. В іншому випадку є підстави говорити про недостатню репрезентативність вибірки. Для обчислення похибки репрезентативності і того, як вона впливає на вибіркову або генеральну сукупність, до уваги беруться багато факторів:
- Імовірність, з якою необхідно отримати точний результат.
- Кількості одиниць вибіркової сукупності. Як вже згадувалося раніше, чим менше одиниць складе вибірка, тим більше буде помилка репрезентативності, і навпаки.
- Однорідність досліджуваної сукупності. Чим більш різнорідною є сукупність, тим більше буде похибка репрезентативності. Можливість сукупності бути репрезентативною залежить від однорідності всіх її складових одиниць.
- Спосіб відбору одиниць у вибіркову сукупність.
В конкретно заданих дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником на підставі програми спостереження і згідно з даними раніше проведених досліджень. Як правило, вважається допустимою гранична помилка вибірки (помилка репрезентативності) в межах 3-5 %.
Більше – не завжди краще
Також варто пам’ятати, що головне при організації вибіркового спостереження – це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, так як це може призвести до невиправданого збільшення обсягу даних вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження.
В той же час не можна надмірно збільшувати розмір похибки репрезентативності. Адже в цьому випадку, хоча і відбудеться зменшення обсягу вибіркової сукупності, це призведе до погіршення достовірності отриманих результатів.
Які питання зазвичай ставиться перед дослідником
Будь-яке дослідження якщо й проводиться, то для якоїсь мети та для отримання якихось результатів. При проведенні вибіркового дослідження, як правило, ставляться початкові питання:
- Визначення необхідної кількості одиниць вибіркової сукупності, тобто те, скільки одиниць буде досліджуватися. До того ж, для точного дослідження сукупність має бути репрезентативною.
- Розрахунок похибки репрезентативності з встановленим рівнем ймовірності. Відразу варто відзначити, що вибіркових досліджень не буває з рівнем ймовірності 100 %. Якщо та інстанція, яка проводила вивчення певного сегмента, стверджує, що їх точні результати з імовірністю 100 %, то це брехня. Багаторічна практика вже встановила відсоток ймовірності правильно проведеного вибіркового дослідження. Цей показник дорівнює 95,4 %.
Способи відбору одиниць у вибірку дослідження
Не кожна вибірка є репрезентативною. Іноді один і той самий ознака по-різному виражений в цілому і в її частині. Для досягнення вимог репрезентативності доцільним є використання різних прийомів створення вибірки. Причому використання того чи іншого способу залежить від конкретних обставин. Серед таких прийомів створення вибірки виділяють:
- випадковий відбір;
- механічний відбір;
- типовий відбір;
- серійний (гніздовий) відбір.
Випадковий відбір являє собою систему заходів, спрямованих на випадковий відбір одиниць сукупності, коли ймовірність потрапити у вибірку є рівною для всіх одиниць генеральної сукупності. Цей прийом доцільно застосовувати тільки у випадку однорідності і невеликої кількості властивих їй ознак. В іншому випадку деякі характерні риси ризикують бути не відбитим у вибірці. Ознаки випадкового відбору лежать в основі всіх інших способів побудови вибірки.
При механічному відбір одиниць проводиться через певний інтервал. Якщо необхідно сформувати вибірку конкретних злочинів, можна вилучати з усіх карток статистичного обліку зареєстрованих злочинів кожну 5-ту, 10-ту або 15-ю картку залежно від їх загальної кількості і наявних розмірів вибірки. Недоліком цього способу є те, що перед відбором необхідно мати повний облік одиниць сукупності, потім потрібно провести ранжування і лише після цього можна проводити вибірку з певним інтервалом. Цей метод займає багато часу, тому він і не часто використовується.
Типовий (районований) відбір – вид вибірки, при якій генеральну сукупність поділяють на однорідні групи за певною ознакою. Іноді дослідники вживають замість «груп» інші терміни: «райони» і «зони». Потім з кожної групи у випадковому порядку відбирається певна кількість одиниць, пропорційно питомій вазі групи в загальній сукупності. Типовий відбір часто здійснюється в декілька етапів.
Серійний відбір – це такий метод, при якій відбір одиниць проводиться групами (серіями) і обстеженню підлягають усі одиниці відібраної групи (серії). Перевагою цього способу є те, що інколи відібрати окремі одиниці складніше, ніж серії, наприклад, при вивченні особи, яка відбуває покарання. В рамках відібраних районів, зон застосовується вивчення всіх одиниць без винятку, наприклад, вивчення всіх осіб, які відбувають покарання в якомусь певному закладі.