Тема на семинара: извадка в социологическите изследвания Ключови понятия. Изследване на населението и извадката

Емпиричните изследвания се считат за едно от основните средства за изследване на социалните отношения и процеси. Те предоставят надеждна, пълна и представителна информация.

Специфика на техниките

Емпиричните осигуряват знание за записване на факти. Те допринасят за установяването и обобщаването на обстоятелства чрез косвено или пряко регистриране на събития, характерни за изследваните отношения, обекти и явления. Емпиричните методи се различават от теоретичните по това, че обектът на анализ е:

  1. Поведение на индивидите и техните групи.
  2. Продукти от човешката дейност.
  3. Вербални действия на индивиди, техните преценки, възгледи, мнения.

Примерни изследвания

Емпиричното изследване винаги е насочено към получаване на обективна и точна информация и количествени данни. В тази връзка при извършването му е необходимо да се осигури представителност на информацията. Съответно правилно извадкова популация. ТоваТова означава, че подборът трябва да се извърши по такъв начин, че данните, получени от тясна група, да отразяват тенденциите, настъпващи в общата маса от респонденти. Например, при анкетиране на 200-300 души, получените данни могат да бъдат екстраполирани към цялото градско население. Показателите на извадката от съвкупността ни позволяват да подходим по различен начин към изследването на социално-икономическите процеси в региона и в страната като цяло.

Терминология

За по-добро разбиране на проблемите, свързани с проучванията за вземане на проби, е необходимо да се изяснят някои определения. Единицата за наблюдение е прекият източник на информация. Може да бъде индивид, група, документ, организация и т.н. Генералната съвкупност екомплекс от наблюдателни единици. Всички те трябва да са свързани с проблема, който се изучава. Подлежи на директен анализ. Проучването се извършва в съответствие с разработени методи за събиране на информация. За да определите тази част от целия масив от респонденти, използвайте понятието "извадкова съвкупност". Способността му да отразява основните параметри на общата маса от хора се нарича представителност. В някои случаи няма съвпадения. Тогава те говорят за грешката в представителността.

Осигуряване на представителност

Въпросите, свързани с него, са разгледани подробно в рамките на статистиката. Проблемите са комплексни, тъй като, от една страна, говорим за осигуряване на количествено представяне, което дава общо население. Товаозначава по-специално, че групите респонденти трябва да бъдат представени в оптимален брой. Количеството трябва да е достатъчно за нормално представяне. От друга страна, имаме предвид и качествено представяне. Тя предполага определен предметен състав, който образува извадкова популация. ТоваТова означава, че например не можем да говорим за представителност, ако се изследват само мъже или само жени, възрастни хора или млади хора. Проучването трябва да се проведе във всички представени групи.

Примерни характеристики

Този термин се разглежда в два аспекта. На първо място, той се определя като комплекс от елементи от общия набор от хора, чието мнение се изучава - това е извадкова популация. Товасъщо и процесът на създаване на определена категория респонденти, като същевременно се гарантира представителност според изискванията. В практиката има няколко вида и вида селекция. Нека да ги разгледаме.

Видове

Има три от тях:

  1. Спонтанен извадкова популация. Тованабор от респонденти, избрани на принципа на доброволността. В същото време осигурява наличието на единици от общата маса хора в конкретна учебна група. Спонтанният подбор се използва доста често в практиката. Например по време на проучвания в пресата, в пощата. Тази техника обаче има значителен недостатък. Невъзможно е да се представи качествено целият обем на общата извадка. Тази техника се използва с оглед на икономията. В някои проучвания този вариант е единственият възможен.
  2. Спонтанен извадкова популация. Товаедна от основните техники, използвани в обучението. Основният принцип на такъв подбор е да се гарантира, че всяка единица за наблюдение има възможност да попадне от общата маса индивиди в тясна група. За това се използват различни техники. Например, това може да е лотария, механична селекция или таблица с произволни числа.
  3. Стратифицирана (квотна) извадка. Основава се на формирането на качествен модел на общата маса респонденти. След това единиците се избират в извадката. Например, извършва се по възраст или пол, по сегмент от населението и т.н.

Видове

Съществуват следните проби:

Допълнително

Пробите също могат да бъдат зависими или независими. В първия случай експерименталната процедура и резултатите, които ще бъдат получени по време на нея за една група респонденти, имат определено въздействие върху друга. Съответно независими проби не предполагат такъв ефект. Тук обаче трябва да се отбележи един важен момент. Една група от субекти, по отношение на които е проведено психологическо изследване два пъти (дори ако е насочено към изучаване на различни качества, характеристики, признаци), по подразбиране ще се счита за зависима.

Вероятностни селекции

Нека да разгледаме някои видове проби:

  1. Случаен. Предполага се хомогенност на общата популация, една вероятност за наличност на всички компоненти и наличието на пълен списък от елементи. Обикновено процесът на подбор използва таблица с произволни числа.
  2. Механични. Този тип произволна извадка включва подреждане по определен критерий. Например по телефонен номер, по азбучен ред, по дата на раждане и т.н. Първият компонент се избира произволно. След това всеки k елемент се избира със стъпка n. Размерът на общата популация ще бъде N=k*n.
  3. Стратифицирани. Тази извадка се използва, когато общата популация е хетерогенна. Последният е разделен на страти (групи). Във всяка от тях селекцията се извършва механично или на случаен принцип.
  4. Сериен. Изборът на групи се извършва на случаен принцип. Вътре в тях обектите се изучават масово.

Невероятностни селекции

Те включват извадка не по принципа на случайността, а по субективни критерии: типичност, наличност, равно представителство и др. Следните селекции попадат в тази категория:

Нюанс

За да се осигури представителност, е необходим точен и пълен списък на единиците от съвкупността. Обектите на наблюдение, като правило, са едно лице. По-добре е да изберете от списъка, като номерирате единиците и използвате таблица с произволни числа. Но квазислучайният метод също се използва доста често. Това включва избиране на всеки n елемент от списък.

Влияещи фактори

Обемът на съвкупността е броят на нейните единици. Според специалистите не е задължително тя да е голяма. Несъмнено колкото по-голям е броят на анкетираните, толкова по-точен е резултатът. В същото време обаче големият обем не винаги гарантира успех. Например, това се случва, когато общият набор от респонденти е разнороден. Една популация ще се счита за хомогенна, ако контролираният параметър, например нивото на грамотност, е разпределен равномерно, тоест няма кухини или кондензации. В този случай ще бъде достатъчно да интервюирате няколко души. Въз основа на резултатите от проучването ще бъде възможно да се заключи, че повечето хора имат нормално ниво на грамотност. От това следва, че представителността на информацията се влияе не от количествените характеристики, а от качествените характеристики на съвкупността - по-специално нивото на нейната хомогенност.

Грешки

Те представляват отклонението на средните параметри на извадката от съвкупността от стойностите на общата маса на анкетираните. На практика грешките се идентифицират чрез сравнение. При анкетиране на възрастни обикновено се използва информация от преброявания, статистика и резултати от минали проучвания. Контролните параметри обикновено са сравнение на средните стойности на популациите (общи и извадкови), определянето на грешката в съответствие с това и намаляването на това отклонение се нарича контрол на представителността.

заключения

Извадковото изследване е начин за събиране на данни за нагласите и поведението на хората чрез проучване на специално подбрани групи респонденти. Тази техника се счита за надеждна и икономична, въпреки че изисква известна техника. За основа служи извадката. Той действа като определен дял от общата маса хора. Селекцията се извършва с помощта на специални техники и има за цел получаване на информация за цялата популация. Последният от своя страна е представен от всички възможни обществени обекти или тази група от тях, която ще бъде изследвана. Често популацията е толкова голяма, че интервюирането на всеки представител би било скъп и тромав процес. Затова се използва неин умален модел. Извадката включва всички, които получават въпросници, които се наричат ​​респонденти, които всъщност действат като обект на изследване. Най-просто казано, тя се състои от много хора, които са анкетирани.

Заключение

Целите на изследването се определят от конкретни категории, включени в съвкупността. Що се отнася до специфичния дял от общата маса на хората, той се състои от субекти, включени в групи, използващи математически изчисления. За да изберете единици, е необходимо описание на обекта в първоначалната популация. След определяне на броя на субектите се определя методът или методът за формиране на групи. Резултатите от проучването ще ни позволят да опишем изследваната характеристика по отношение на всички представители на общата маса хора. Както показва практиката, се провеждат предимно селективни, а не цялостни изследвания.

Статистическото изследване е много трудоемко и скъпо, така че възниква идеята непрекъснатото наблюдение да се замени със селективно.

Основната цел на непродължителното наблюдение е да се получат характеристиките на изследваната статистическа съвкупност за изследваната част.

Селективно наблюдениее метод на статистическо изследване, при който общите показатели на съвкупността се установяват само за една част въз основа на условията на случаен подбор.

При извадковия метод се изследва само определена част от изследваната съвкупност, а изследваната статистическа съвкупност се нарича генерална съвкупност.

Извадкова съвкупност или просто извадка може да се нарече част от единици, избрани от генералната съвкупност, които ще бъдат обект на статистическо изследване.

Значението на метода на извадката: с минимален брой изследвани единици, статистическите изследвания ще се извършват за по-кратки периоди от време и с най-малко пари и труд.

В обща съвкупност делът на единиците, които имат изследваната характеристика, се нарича общ дял (обозначен R),и средната стойност на изследваната променлива черта е общата средна (обозначена Х).

В извадкова популация пропорцията на изследваната характеристика се нарича пропорция на извадката или част (означена с w), средната стойност в извадката е извадкова средна стойност.

Ако по време на периода на изследването се спазват всички правила на неговата научна организация, тогава методът на вземане на проби ще даде доста точни резултати и следователно този метод е препоръчително да се използва за проверка на данни от непрекъснато наблюдение.

Този метод е широко разпространен в държавната и извънведомствената статистика, тъй като при изучаване на минималния брой изследвани единици дава възможност за задълбочено и точно изследване.

Изследваната статистическа съвкупност се състои от единици с различни характеристики. Съставът на извадката може да се различава от състава на популацията; това несъответствие между характеристиките на извадката и популацията представлява извадкова грешка.

Грешките, присъщи на извадковото наблюдение, характеризират размера на несъответствието между данните от извадковото наблюдение и цялата популация. Грешките, които възникват по време на извадковото наблюдение, се наричат ​​грешки на представителността и се делят на случайни и систематични.

Ако извадката от популацията не възпроизвежда точно цялата популация поради прекъснатия характер на наблюдението, тогава това се нарича случайни грешки и техните размери се определят с достатъчна точност въз основа на закона за големите числа и теорията на вероятностите.

Систематичните грешки възникват в резултат на нарушаване на принципа на случайността при избора на единици съвкупност за наблюдение.

2. Видове и схеми за избор

Размерът на извадковата грешка и методите за нейното определяне зависят от вида и дизайна на селекцията.

Има четири вида избор на популация от единици за наблюдение:

1) случаен;

2) механични;

3) типичен;

4) сериен (вложен).

Случаен избор– най-често срещаният метод за подбор в случайна извадка, наричан още метод на теглене на жребий, при който за всяка единица от статистическата съвкупност се изготвя билет с пореден номер.

След това необходимият брой единици от статистическата съвкупност се избира на случаен принцип. При тези условия всеки от тях има една и съща вероятност да бъде включен в извадката, например печеливши тиражи, когато от общия брой издадени билети определена част от числата, на които се случват печалбите, е избрана на случаен принцип. В този случай всички числа имат еднаква възможност да бъдат включени в извадката.

Механична селекция- това е метод, при който цялата съвкупност се разделя на групи с хомогенен обем по случаен критерий, след което се взема само една единица от всяка група. Всички единици от изследваната статистическа съвкупност са предварително подредени в определен ред, но в зависимост от размера на извадката, необходимият брой единици се избира механично на определен интервал.

Типичен избор –Това е метод, при който изследваната статистическа съвкупност се разделя по съществен типичен признак на качествено хомогенни групи от един и същи тип, след което от всяка от тези групи произволно се избира определен брой единици, пропорционални на специфичното тегло на групата в цялата популация.

Типичният подбор дава по-точни резултати, тъй като включва представители на всички типични групи в извадката.

Сериен (клъстер) избор.На селекция подлежат цели групи (серии, гнезда), избрани произволно или механично. За всяка такава група или серия се извършва непрекъснато наблюдение и резултатите се прехвърлят към цялата популация.

Точността на пробата зависи и от схемата за вземане на проби. Вземането на проби може да се извърши по схема за многократно или еднократно вземане на проби.

Повторна селекция.Всяка избрана единица или серия се връща към цялата популация и може да бъде въведена отново в извадката. Това е така наречената схема с върната топка.

Неповтаряща се селекция.Всяка изследвана единица се отстранява и не се връща в популацията, така че не се изследва повторно. Тази схема се нарича невърната топка.

Неповтарящото се вземане на проби дава по-точни резултати, тъй като при еднакъв размер на извадката наблюдението обхваща по-голям брой единици от изследваната популация.

Комбинирана селекцияможе да премине през един или повече етапа. Извадката се нарича едноетапна, ако се изследват веднъж избрани единици от съвкупността.

Извадката се нарича многоетапна, ако подборът на популацията се извършва на етапи, последователни етапи и всеки етап, етап на подбор има своя собствена единица за подбор.

Многофазно вземане на проби - на всички етапи на вземане на проби се запазва една и съща единица за вземане на проби, но се извършват няколко етапа, фази на извадкови изследвания, които се различават по ширината на програмата за изследване и размера на извадката.

Характеристиките на параметрите на генералните и извадковите съвкупности са обозначени със следните символи:

н– обем на генералната съвкупност;

н– размер на извадката;

х– обща авария;

х– извадкова средна;

Р– общ дял;

w –примерен дял;

2 – обща дисперсия (вариация на признака в генералната съвкупност);

2 – извадково отклонение на една и съща характеристика;

? – стандартно отклонение в популацията;

? – стандартно отклонение в извадката.

3. Грешки при вземане на проби

Всяка единица в извадково наблюдение трябва да има равни възможности с другите да бъде избрана - това е основата на правилната случайна извадка.

Правилно произволно вземане на проби е подбор на единици от цялата популация чрез теглене на жребий или други подобни средства.

Принципът на случайността е, че включването или изключването на даден елемент от извадката не може да бъде повлияно от друг фактор освен случайността.

Примерен дяле съотношението на броя на единиците в извадката от съвкупността към броя на единиците в генералната съвкупност:


Правилният случаен подбор в чист вид е оригиналът сред всички други видове подбор; той съдържа и прилага основните принципи на селективното статистическо наблюдение.

Двата основни вида общи показатели, които се използват в извадковия метод, са средната стойност на количествена характеристика и относителната стойност на алтернативна характеристика.

Фракцията на пробата (w) или особеността се определя от съотношението на броя единици, притежаващи изследваната характеристика м,към общия брой единици в извадката от популацията (n):


За да се характеризира надеждността на извадковите показатели, се прави разлика между средната и максималната грешка на извадката.

Грешката на извадката, наричана още грешка на представителността, е разликата между съответната извадка и общите характеристики:

?x =|x – x|;

?w =|x – p|.

Само примерните наблюдения са обект на грешка при вземане на проби.

Извадкова средна стойност и извадково съотношение– това са случайни променливи, които приемат различни стойности в зависимост от единиците от изследваната статистическа съвкупност, които са включени в извадката. Съответно, извадковите грешки също са случайни променливи и също могат да приемат различни стойности. Следователно се определя средната стойност на възможните грешки - средната извадкова грешка.

Средната извадкова грешка се определя от размера на извадката: колкото по-голям е броят, при равни други условия, толкова по-малка е средната извадкова грешка. Като обхващаме все по-голям брой единици от генералната съвкупност с извадково изследване, ние характеризираме цялата генерална съвкупност все по-точно.

Средната извадкова грешка зависи от степента на вариация на изследваната характеристика, на свой ред степента на вариация се характеризира с дисперсия? 2 или w(l – w)– за алтернативен знак. Колкото по-малка е вариацията и дисперсията на признака, толкова по-малка е средната грешка на извадката и обратно.

В случай на случайно повторно вземане на проби, средните грешки се изчисляват теоретично по следните формули:

1) за средна количествена характеристика:


Където? 2 – средна стойност на дисперсия на количествена характеристика.

2) за дял (алтернативен атрибут):


И така, каква е дисперсията на черта в популацията? 2 не е известна точно, на практика те използват стойността на дисперсията S 2, изчислена за извадковата популация на базата на закона за големите числа, според който извадковата популация, с достатъчно голям размер на извадката, доста точно възпроизвежда характеристики на общата популация.

Формулите за средната грешка при вземане на проби за случайно повторно вземане на проби са както следва. За средната стойност на количествена характеристика: общата дисперсия се изразява чрез селективната дисперсия чрез следната връзка:


където S 2 е стойността на дисперсията.

Механично вземане на проби– това е подбор на единици в извадкова съвкупност от генералната съвкупност, която се разделя по неутрален критерий на равни групи; Извършва се по такъв начин, че от всяка такава група се избира само една единица за извадката.

При механичната извадка единиците от изследваната статистическа съвкупност предварително се подреждат в определен ред, след което механично се избира определен брой единици през определен интервал. В този случай размерът на интервала в популацията е равен на обратната стойност на пропорцията на извадката.

При достатъчно голяма популация механичният подбор е близък до самослучайния по отношение на точността на резултатите. Следователно, за определяне на средната грешка на механичното вземане на проби се използват формули за самослучайно неповтарящо се вземане на проби.

За избор на единици от разнородна съвкупност се използва така наречената типична извадка; тя се използва, когато всички единици от генералната съвкупност могат да бъдат разделени на няколко качествено хомогенни сходни групи според характеристиките, от които зависят изследваните показатели.

След това от всяка типична група се извършва индивидуален подбор на единици в извадковата популация, като се използва чисто случайна или механична извадка.

Вземането на проби обикновено се използва при изследване на сложни статистически съвкупности.

Типичното вземане на проби дава по-точни резултати. Типизирането на генералната съвкупност гарантира представителността на такава извадка, представянето на всяка типологична група в нея, което позволява да се изключи влиянието на междугруповата дисперсия върху средната грешка на извадката. Следователно, когато се определя средната грешка на типична извадка, средната стойност на дисперсиите в рамките на групата действа като индикатор за вариация.

Серийното вземане на проби включва случаен подбор от обща съвкупност от равни групи, за да бъдат подложени на наблюдение всички единици в такива групи без изключение.

Тъй като в рамките на групите (сериите) се изследват всички единици без изключение, средната грешка на извадката (при избиране на равни серии) зависи само от вътрешногруповата (междусерийната) дисперсия.

4. Методи за разпространение на резултатите от пробите сред общата популация

Характеристиките на популацията въз основа на резултатите от извадката са крайната цел на наблюдението на извадката.

Извадковият метод се използва за получаване на характеристики на съвкупността по определени извадкови показатели. В зависимост от целите на изследването това става чрез директно преизчисляване на извадкови показатели за генералната съвкупност или чрез изчисляване на корекционни коефициенти.

Методът на директното преизчисляване е, че с него показателите на извадката споделят wили средно хсе прилагат към общата съвкупност, като се вземе предвид грешката на извадката.

Методът на корекционните коефициенти се използва, когато целта на метода на извадката е да изясни резултатите от непрекъснатото счетоводно отчитане. Този метод се използва за уточняване на данните от годишните преброявания на животновъдството на населението.

Всъщност ще започнем не с един, а с три въпроса: Какво е вземане на проби? кога е представителен? какво е тя?

Тоталност - това е всяка група от хора, организации, събития, които ни интересуват, по отношение на които искаме да направим заключения и случва се,или обект - всеки елемент от такава колекция 1 .проба – всяка подгрупа от набор от случаи (обекти), избрани за анализ. Ако искахме да проучим дейността по вземане на решения на държавните законодатели, бихме могли да проучим такава дейност в държавните законодателни органи на Вирджиния, Северна Каролина и Южна Каролина, а не във всичките петдесет щата и от това, разпространявамполучени данни за населението, от което са избрани тези три държави. Ако искахме да проучим системата за предпочитания на гласоподавателите в Пенсилвания, бихме могли да го направим, като анкетираме 50 работници в САЩ. С. Стийл” в Питсбърг и разшири резултатите от проучването до всички избиратели в щата. По същия начин, ако искахме да измерим интелигентността на студентите, бихме могли да тестваме всички защитни играчи, записани в щата Охайо за даден футболен сезон и след това да обобщим резултатите за населението, от което те са част. Във всеки пример процедираме по следния начин: създаваме подгрупа в популацията, съвсем Ние изучаваме подробно тази подгрупа или извадка и разширяваме нашите резултати към цялата популация. Това са основните етапи на вземане на проби.

Въпреки това изглежда съвсем ясно, че всяка от тези проби има значителни недостатъци. Например, въпреки че законодателните органи на Вирджиния, Северна Каролина и Южна Каролина са част от набор от законодателни органи на щатите, те, поради исторически, географски и политически причини, вероятно ще работят по много сходни начини и много различно от законодателните органи на такива различни щати като Ню Йорк, Небраска и Аляска. Въпреки че петдесет работници в стоманодобивната промишленост в Питсбърг може наистина да са избиратели в щата Пенсилвания, те, по силата на социално-икономически статус, образование и житейски опит, може да имат възгледи, които се различават от тези на много други хора, които също са избиратели. По същия начин, докато футболистите на щата Охайо са студенти, те може да се различават от другите студенти по различни причини. Тоест, въпреки че всяка от тези подгрупи наистина е извадка, членовете на всяка систематично се различават от повечето други членове на популацията, от която са избрани. Като отделна групанито едно от тях не е типично от гледна точка на разпространението на признаци на мнения, мотиви на поведение и характеристики в общата популация, с която се свързва. Съответно политолозите биха казали, че нито една от тези извадки не е представителна.

Представителна извадка е извадка, в която всички основни характеристики на популацията, от която е съставена извадката, са представени в приблизително същото съотношение или със същата честота като този знаксе появява в тази обща популация. По този начин, ако 50% от всички щатски законодателни събрания се срещат само веднъж на всеки две години, приблизително половината от състава на представителна извадка от щатски законодателни събрания трябва да бъде от този тип. Ако 30% от гласоподавателите в Пенсилвания са сини якички, около 30% от представителя пробите за тези гласоподаватели (не 100%, както в примера по-горе) трябва да бъдат сини якички. И ако 2% от всички студенти са спортисти, приблизително същата част от представителна извадка от студенти трябва да са спортисти. С други думи, представителната извадка е микрокосмос, по-малък, но точен модел на популацията, която е предназначена да отразява. До степента, в която извадката е представителна, заключенията, базирани на изследването на тази извадка, може безопасно да се приеме, че се отнасят за първоначалната популация. Това разпространение на резултатите е това, което наричаме обобщаемост.

Може би една графична илюстрация ще помогне да се обясни това. Да предположим, че искаме да проучим моделите на членство в политически групи сред възрастните в САЩ. Фигура 5.1 показва три кръга, разделени на шест равни сектора. Фигура 5.1a представя цялата разглеждана популация. Членовете на населението се класифицират според политическите групи (като партии и групи по интереси), към които принадлежат. В този пример всеки възрастен принадлежи към поне една и не повече от шест политически групи; и тези шест нива на членство са равномерно разпределени в съвкупността (следователно равните сектори). Да предположим, че искаме да изследваме мотивите на хората за присъединяване към група, груповия избор и моделите на участие, но поради ограничения на ресурсите сме в състояние да изследваме само един на всеки шест члена на населението. Кой трябва да бъде избран за анализ?

Ориз. 5.1. Формиране на извадка от генералната съвкупност

Една от възможните проби от даден обем е илюстрирана със защрихованата област на Фиг. 5.1b, но тя очевидно не отразява структурата на популацията. Ако трябва да направим обобщения от тази извадка, ще заключим: (1) че всички възрастни американци принадлежат към пет политически групи и (2) че цялото групово поведение на американците съответства на поведението на тези, които принадлежат конкретно към петте групи. Знаем обаче, че първото заключение не е вярно и това може да ни постави под съмнение относно валидността на второто. По този начин, Извадката, показана на фигура 5.1b, не е представителна, защото не отразява разпределението на дадено свойство на съвкупността (често наричано параметър ) в съответствие с действителното му разпределение. Такава извадка се казва изместен къмчленове на пет групи или изместен в посока отвсички други модели на групово членство. Въз основа на такава предубедена извадка обикновено стигаме до погрешни заключения за населението.

Това може да се демонстрира най-ясно от бедствието, сполетяло списанието Literary Digest през 30-те години, което организира проучване на общественото мнение относно изборните резултати. Literary Digest беше периодично издание, което препечатваше редакционни статии на вестници и други материали, отразяващи общественото мнение; това списание беше много популярно в началото на века. В началото на 1920 г. списанието провежда мащабна национална анкета, в която бюлетини са изпратени по пощата на повече от милион души с молба да посочат любимия си кандидат на предстоящите президентски избори. В продължение на няколко години резултатите от социологическите проучвания на списанието бяха толкова точни, че изглежда, че едно проучване през септември направи изборите през ноември без значение. И как може да възникне грешка при толкова голяма извадка? През 1936 г. обаче се случва точно това: с голямо мнозинство от гласовете (60:40) победата е прогнозирана за републиканския кандидат Алф Ландън. Ландън загуби на изборите от човек с увреждания - Франклин Д. Рузвелт – с почти същия резултат, с който трябваше да спечели. Доверието в Literary Digest беше толкова сериозно накърнено, че списанието излезе от печат малко след това. Какво стана? Много е просто: анкетата на Digest използва предубедена извадка. Пощенски картички бяха изпратени на хора, чиито имена бяха извлечени от два източника: телефонни указатели и списъци с регистрации на автомобили. И въпреки че преди този метод на подбор не се е различавал много от другите методи, нещата са много различни сега, по време на Голямата депресия от 1936 г., когато по-малко богатите гласоподаватели, най-вероятните поддръжници на Рузвелт, не можеха да си позволят да притежават телефон, камо ли кола. Така всъщност извадката, използвана в анкетата на Дайджест, беше изкривена към онези, които най-вероятно са републиканци, но все пак е изненадващо, че Рузвелт се справи толкова добре.

Как да решим този проблем? Връщайки се към нашия пример, нека сравним образеца на фиг. 5.1b с образеца на фиг. 5.1c. В последния случай една шеста от популацията също е избрана за анализ, но всеки от основните типове популация е представен в извадката в пропорцията, в която е представен в цялата популация. Такава извадка показва, че един на всеки шестима възрастни американци принадлежи към една политическа група, един на всеки шест принадлежи към две и т.н. Такава извадка би разкрила и други разлики между членовете, които могат да бъдат свързани с участието в различен брой групи. По този начин извадката, представена на фиг. 5.1c, е представителна извадка за разглежданата популация.

Разбира се, този пример е опростен поне по два изключително важни начина. Първо, повечето популации, представляващи интерес за политолозите, са по-разнообразни от илюстрираното. Хора, документи, правителства, организации, решения и т.н. се различават един от друг не по една, а по много по-голям брой характеристики. Следователно представителната извадка трябва да бъде такава, че всекиедна от основните области, която беше различна от другите, беше представени пропорционално на дела си в общата сума. Второ, ситуацията, при която действителното разпределение на променливите или атрибутите, които искаме да измерим, не е известно предварително, е много по-често срещана от обратното - може да не е измерено в предишно преброяване. По този начин представителната извадка трябва да бъде проектирана така, че да отразява точно съществуващото разпределение, дори когато не сме в състояние директно да оценим нейната валидност. Процедурата на извадката трябва да има вътрешна логика, която да ни убеди, че ако можем да сравним извадката с преброяването, тя наистина би била представителна.

За да осигурят възможност за точно отразяване на сложната организация на дадена популация и известна степен на увереност, че предложените процедури могат да направят това, изследователите се обръщат към статистически методи. В същото време те действат в две посоки. Първо, използвайки определени правила (вътрешна логика), изследователите решават кои конкретни обекти да изследват и какво точно да включат в конкретна извадка. Второ, използвайки много различни правила, те решават колко обекта да изберат. Няма да изучаваме подробно тези многобройни правила, а само ще разгледаме ролята им в политическите изследвания. Нека започнем нашето разглеждане със стратегии за избор на обекти, които формират представителна извадка.

Учебни цели

  1. Правете ясна разлика между понятията преброяване (ценз) и извадка.
  2. Познайте същността и последователността на шестте етапа, прилагани от изследователите за получаване на извадкова съвкупност.
  3. Дефинирайте понятието "рамка за вземане на проби".
  4. Обяснете разликата между вероятностно и детерминистично вземане на проби.
  5. Правете разлика между вземане на проби с фиксиран размер и многоетапно (последователно) вземане на проби.
  6. Обяснете какво представлява целенасоченото вземане на проби и опишете неговите силни и слаби страни.
  7. Дефинирайте понятието квотна извадка.
  8. Обяснете какво е параметър в процедура за вземане на проби.
  9. Обяснете какво е производно множество.
  10. Обяснете защо концепцията за извадково разпределение е основна концепция в статистиката.

И така, изследователят е дефинирал точно проблема и е осигурил дизайн на изследване и инструменти за събиране на данни, подходящи за решаването му. Следващият етап от изследователския процес трябва да бъде изборът на елементите, които ще бъдат изследвани. Възможно е да се проучи всеки елемент от дадено население, като се направи пълно преброяване на това население. Пълното проучване на населението се нарича преброяване. Има и друга възможност. Определена част от съвкупността, извадка от елементи на голяма група, се подлага на статистическо изследване и въз основа на данните, получени от тази подгрупа, се правят определени заключения по отношение на цялата група. Възможността за обобщаване на резултатите, получени от извадкови данни за по-голяма група, зависи от метода, по който е събрана пробата. Голяма част от тази глава ще бъде посветена на това как трябва да бъде избрана извадката и защо трябва да бъде така.

Преброяване (ценз)
Пълно преброяване на населението.
проба
Колекция от елементи на подмножество по-голяма групаобекти.

Концепцията за "популация" или "колекция" може да се отнася не само за хора, но и за фирми, работещи в производствената промишленост, до организации за търговия на дребно или едро или дори до напълно неодушевени обекти, като части, произведени в предприятие; това понятие се определя като целия набор от елементи, които отговарят на определени определени условия. Тези условия ясно определят както елементите, които принадлежат към целевата група, така и елементите, които трябва да бъдат изключени от разглеждане.

Изследванията за определяне на демографския профил на потребителите на замразена пица трябва да започнат с идентифициране кой трябва и не трябва да бъде класифициран като такъв. Хората, които поне веднъж са опитвали тази пица, спадат ли към тази категория? Хората, които купуват поне една пица на месец? През седмицата? Хора, които ядат повече от определено минимално количество пица за един месец? Изследователят трябва да бъде много точен при идентифицирането на целевата група. Необходимо е също така да се гарантира, че извадката е взета от целевата популация, а не от „някаква“ популация, какъвто е случаят, когато рамката за извадка е неподходяща или непълна. Последният е списък от елементи, от които ще се формира действителната извадка.

Изследователят може да предпочете метод на извадка пред проучване на цялото население по няколко причини. Първо, пълно проучване на населението е дори сравнително малък размеризисква много големи материални и времеви разходи. Често, докато приключи преброяването и се обработят данните, информацията вече е остаряла. В някои случаи квалификацията е просто невъзможна. Да кажем, че изследователите са се заели да проверят дали действителният експлоатационен живот на електрическите лампи с нажежаема жичка съответства на изчисления, за което трябва да ги държат включени, докато не се повредят. Ако по този начин разгледаме цялата наличност от лампи, ще се получат надеждни данни, но няма да има какво да се търгува.

И накрая, за изненада на начинаещите, изследователят може да предпочете вземането на проби пред цензурата, за да гарантира точността на резултатите. Провеждането на преброявания изисква участието на голям персонал, което увеличава вероятността от систематични грешки (неизвадкови). Този факт е една от причините Бюрото за преброяване на населението на САЩ да използва извадкови проучвания, за да провери точността на различни видове преброявания. Правилно чухте: може да се провеждат извадкови проучвания, за да се провери точността на данните за квалификацията.

Примерни стъпки за проектиране

На фиг. Фигура 15.1 показва последователност от шест стъпки, която примерен изследовател може да следва. На първо място е необходимо да се определи целевата популация или набор от елементи, за които изследователят иска да знае нещо.

Например, когато изучават предпочитанията на децата, изследователите трябва да решат дали изследваната популация ще се състои само от деца, само родители или и двете.

Съвкупност (популация)
Набор от елементи, които отговарят на определени условия.
Рамка за вземане на проби
Списък на елементите, от които ще бъде направена пробата; може да се състои от териториални единици, организации, лица и други елементи.

Една компания тества своите електрически „състезания“ само върху деца. Зарадваха децата. Родителите реагираха различно на новия продукт. Майките не харесваха факта, че атракцията не учи децата на това внимателно отношениекъм колите и татковците не бяха доволни от факта, че продуктът е направен като играчка.
Възможна е и обратната ситуация. Една компания започна да произвежда нов хранителен продукт и стартира национална рекламна кампания, в която главната роля беше възложена на преждевременно развито дете. Компанията тества ефективността на рекламите само върху майки, които бяха във възторг. Децата намериха този „ускорител“, а с него и самия рекламиран продукт, за отвратителни. Продуктът е завършен 1.

Изследователят трябва да реши от кого или какво ще се състои съответната популация: лица, семейства, фирми, други организации, транзакции с кредитни картии т.н. Когато се вземат такива решения, е необходимо да се вземе решение за елементите, които трябва да бъдат изключени от популацията. Трябва да се извърши както времева, така и географска връзка на елементите, която в някои случаи може да бъде предмет на допълнителни условия или ограничения. Например, ако говорим за физически лица, интересуващата ни популация може да се състои само от лица над 18 години, или само от жени, или само от лица с поне средно образование.

Задачата за определяне на географски граници за целевата група в международните маркетингови изследвания може да бъде особено предизвикателна, тъй като увеличава хетерогенността на разглежданата система. Например, относителното съотношение на градските и селските райони може да варира значително в различните страни. Териториалният аспект оказва сериозно влияние върху състава на населението в рамките на една държава. Например в северната част на Чили компактно живее предимно индианско население, докато в южните райони на страната живеят предимно потомци на европейци.

Покритие (честота)
Изразен като процент, съотношението на елементите от популация или група, които отговарят на условията за включване в извадката.

Най-общо казано, колкото по-просто е дефинирана целевата популация, толкова по-високо е нейното покритие (честота) и толкова по-лесна и евтина е процедурата за вземане на проби. Покритие (честота)съответства на процента елементи от популация или група, които отговарят на условията за включване в извадката. Покритието пряко влияе върху времето и материалните разходи, необходими за провеждане на проучване. Ако покритието е голямо (тоест голяма част от елементите на популацията удовлетворяват един или повече прости критерии, използвани за идентифициране на потенциални респонденти), времето и материалните разходи, необходими за събиране на данни, са сведени до минимум. Обратно, с нарастването на броя на критериите, на които трябва да отговарят потенциалните респонденти, се увеличават както материалните, така и времевите разходи.

На фиг. Фигура 15.2 показва дела на възрастното население, занимаващо се с определени спортове. Данните на фигурата показват, че изследването на хора, занимаващи се с мотоциклетизъм (само 3,6% от общия брой възрастни) е много по-трудно и скъпо, отколкото изследването на хора, извършващи редовни разходки (27,4% от общия брой възрастни). Основното е изследователят да бъде прецизен при определянето кои елементи трябва да бъдат включени в изследваната съвкупност и кои да бъдат изключени от нея. Ясното формулиране на целта на изследването значително улеснява решаването на този проблем. Втората стъпка в процеса на подбор на извадката е да се определи рамката на извадката, която, както вече знаете, е списъкът с елементи, от които ще бъде съставена извадката. Нека целевата популация на едно изследване са всички семейства, живеещи в района на Далас. На пръв поглед добра и лесно достъпна рамка за извадка би бил телефонният указател на Далас. При по-внимателно разглеждане обаче става очевидно, че списъкът на семействата, съдържащ се в указателя, не е напълно правилен, тъй като номерата на някои семейства са пропуснати от него (разбира се, не включва семейства, които нямат телефон), докато някои семейства имат няколко телефонни номера. Лица, които наскоро са сменили местожителството си и съответно телефонния си номер, също не са включени в указателя.

Опитни изследователи откриват, че рядко има точно съвпадение между рамката на извадката и целевата съвкупност от интереси. Една от най-креативните стъпки в дизайна на извадката е определянето на подходяща рамка за извадка, когато изброяването на елементи от популацията е трудно. Това може да изисква вземане на проби от работни блокове и префикси, когато например се използва произволно набиране поради недостатъци в телефонните указатели. Значителното увеличение на работните единици през последните 10 години обаче направи тази задача по-трудна. Подобни ситуации могат да възникнат по време на селективно наблюдение на териториални зони или организации с последващо вземане на подпроби, когато, да речем, целевата популация е индивиди, но няма точен текущ списък от тях.

Източник: Въз основа на данни, съдържащи се в SSI LITE TM: Л ow Incidence Tнасочен Сусилване" (Fairfield, Conn.: Survey Sampling, Inc., 1994).

Третият етап от процедурата за вземане на проби е тясно свързан с определянето на рамката за вземане на проби. Изборът на метод или процедура за вземане на проби зависи до голяма степен от рамката за вземане на проби, възприета от изследователя. Изискват се различни видове проби различни видоверамки за вземане на проби. Тази и следващата глава ще предоставят общ преглед на основните типове проби, използвани в маркетинговите проучвания. При описанието им трябва да стане очевидна връзката между извадковата рамка и начина на нейното формиране.

Четвъртата стъпка в процедурата за вземане на проби е определянето на размера на извадката. Този проблем е разгледан в гл. 17. На петия етап изследователят трябва действително да избере елементите, които ще бъдат изследвани. Методът, използван за тази цел, се определя от избрания тип проба; Когато обсъждаме методите за вземане на проби, ще говорим и за избора на нейните елементи. И накрая, изследователят трябва действително да анкетира избраните респонденти. На този етап има голяма вероятност да направите редица грешки.
Тези проблеми и някои методи за разрешаването им са разгледани в гл. 18.

Видове пробовземни (пробовземни) планове

Всички методи за контрол на пробите могат да бъдат разделени на две категории: наблюдение на вероятностни проби и наблюдение на детерминистични проби. Всеки член на популацията може да бъде включен във вероятностна извадка с определена определена различна от нула вероятност. Вероятността за включване на определени членове на популацията в извадката може да варира, но вероятността за включване на всеки елемент в нея е известна. Тази вероятност се определя от специфичната механична процедура, използвана за избор на елементите на пробата.

За детерминистичните проби оценката на вероятността за включване на всеки елемент в извадката става невъзможна. Представителността на такава извадка не може да бъде гарантирана. Например, Allstate Corporationразработи система за обработка на данни за застрахователни претенции за 14 милиона домакинства (нейни клиенти). Компанията планира да използва тези данни, за да определи моделите в търсенето на нейните услуги - например вероятността домакинство, което притежава Mercedes Benz, да притежава и ваканционен дом (което ще изисква застраховка). Въпреки че базата данни е много голяма, компанията няма средства да оцени вероятността всеки конкретен клиент да предяви иск. Следователно компанията не може да бъде сигурна, че данните за клиентите, които предявяват искове, са представителни за всички клиенти на компанията; и в още по-малка степен - по отношение на потенциални клиенти.

Всички детерминистични проби се основават на индивидуалната позиция, преценка или предпочитание на изследователя, а не на механична процедура за избор на елементи на извадката. Такива предпочитания понякога могат да осигурят добри оценки на характеристиките на популацията, но няма начин да се определи обективно дали дадена извадка е подходяща за поставената задача. Оценка на точността на резултатите от вземането на проби може да бъде направена само ако са известни вероятностите за избор на определени елементи. Поради тази причина вероятностната извадка обикновено се счита за по-добър метод за оценка на големината на грешката на извадката. Пробите могат също да бъдат разделени на проби с фиксиран размер и последователни проби. При работа с извадки с фиксиран размер размерът на извадката се определя преди началото на изследването, а анализът на резултатите се предхожда от събирането на всички необходими данни. Ще се интересуваме основно от проби с фиксиран размер, тъй като това е типът, който обикновено се използва в маркетинговите проучвания.

Вероятностна извадка
Извадка, в която всеки елемент от съвкупността може да бъде включен с известна ненулева вероятност.
Детерминистично вземане на проби
Извадка въз основа на определени лични предпочитания или преценки, които определят избора на определени елементи; в този случай оценката на вероятността за включване на произволен елемент от популацията в извадката става невъзможна.

Все пак не трябва да се забравя, че има и последователни проби, които могат да се използват с всеки от основните модели на вземане на проби, обсъдени по-долу.

При последователно вземане на проби броят на избраните елементи е неизвестен предварително; той се определя въз основа на поредица от последователни решения. Ако изследването на малка извадка не доведе до надежден резултат, обхватът на изследваните елементи се разширява. Ако резултатът все още остава неубедителен, размерът на пробата се увеличава отново. На всеки етап се взема решение дали полученият резултат се счита за достатъчно убедителен или да продължи събирането на данни. Работата с последователна извадка дава възможност да се оцени тенденцията на данните, докато се събират, което ви позволява да намалите разходите, свързани с допълнителни наблюдения в случаите, когато тяхната осъществимост се окаже нулева.

Както вероятностните, така и детерминистичните модели на вземане на проби се предлагат в редица типове. Например, детерминистичните проби могат да бъдат непредставителни (удобни), преднамерени или квотни проби; те се разделят на прости случайни, стратифицирани или групови (клъстери), те от своя страна могат да бъдат разделени на подвидове. На фиг. Фигура 15.3 показва типовете образци, които ще бъдат обсъдени в тази и следващата глава.

Вземане на проби с фиксиран обем (фиксирано вземане на проби)
Проба, чийто размер се определя предварително; необходимата информация се определя от избраните елементи.
Последователно вземане на проби
Извадка, формирана въз основа на поредица от последователни решения. Ако след разглеждане на малка проба резултатът изглежда неубедителен, се взема предвид по-голяма проба; ако тази стъпка не доведе до резултат, размерът на извадката се увеличава отново и т.н. Така на всеки етап се взема решение дали полученият резултат може да се счита за достатъчно убедителен.

Трябва да се помни, че основните типове вземане на проби могат да се комбинират, за да се формират по-сложни планове за вземане на проби. Ако разбирате техните основни първоначални типове, ще ви бъде по-лесно да разберете по-сложните комбинации.

Детерминистични проби

Както вече беше споменато, при избора на елементи от детерминистична извадка, частните оценки или решения играят решаваща роля. Понякога тези оценки идват от изследователя, но в други случаи изборът на елементи от популацията е оставен на теренните работници. Тъй като елементите не се избират механично, определянето на вероятността за включване на произволен елемент в извадката и съответно грешката на извадката става невъзможно. Непознаването на грешката, дължаща се на избраната процедура за вземане на проби, не позволява на изследователите да оценят точността на своите оценки.

Непредставителни (удобни) проби

Непредставителни (удобни) пробипонякога се наричат ​​случайни, тъй като подборът на елементите на извадката се извършва по „случаен“ начин - избират се онези елементи, които са или изглеждат най-достъпни по време на периода на вземане на проби.

Нашето ежедневие е пълно с примери за такива подбори. Разговаряме с приятели и въз основа на техните реакции и позиции правим изводи за политическите пристрастия, преобладаващи в обществото; местна радиостанция призовава хората да изразят своите възгледи по спорен въпрос и изразените от тях възгледи се тълкуват като преобладаващи; Ние насърчаваме доброволците да си сътрудничат и да работят с тези, които са доброволци, за да ни помогнат. Проблемът с удобните проби е очевиден - не можем да сме сигурни, че проби от този вид действително представляват целевата популация. Все още може да се съмняваме, че мненията на нашите приятели отразяват точно политическите възгледи, преобладаващи в обществото, но често наистина ни се иска да вярваме, че по-големите извадки, избрани по същия начин, са представителни. Нека покажем погрешността на подобно предположение с пример.
Преди няколко години една от местните телевизии в града, в който живее авторът на тази книга, провеждаше ежедневно проучване на общественото мнение по теми, които интересуват местната общност. Проучванията, наречени „Пулсът на Медисън“, бяха проведени по следния начин. Всяка вечер по време на новините в шест часа станцията задаваше на зрителите въпрос по конкретен спорен въпрос, на който те трябваше да дадат положителен или отрицателен отговор.

При положителен отговор трябваше да се обадите на един, при отрицателен отговор трябваше да позвъните на друг телефонен номер. Броят на гласовете „за” и „против” се изчислява автоматично. Новините в десет часа съобщиха резултатите от телефонното проучване. Всяка вечер в студиото се обаждаха от 500 до 1000 души, които искаха да изразят своята позиция по един или друг въпрос; телевизионен коментатор тълкува резултатите от допитването като основно обществено мнение.

Непредставителна (удобна) проба
Понякога се нарича случаен, тъй като подборът на елементите на извадката се извършва по „случаен“ начин – избират се онези елементи, които са или изглеждат най-достъпни по време на периода на вземане на проби.

В един от шестчасовите епизоди на зрителите беше зададен следният въпрос: „Мислите ли, че възрастта за пиене в Медисън трябва да бъде намалена на 18?“ Съществуващата законова възраст беше 21 години. Публиката отговори на този въпрос с изключителна активност - същата вечер почти 4000 души се обадиха в студиото, от които 78% бяха за намаляване на възрастовата граница. Изглежда очевидно, че извадка от 4000 души "трябва да е представителна" за общност от 180 000. Нищо подобно. Както вероятно вече се досещате, определена възрастова група от населението беше много по-заинтересована от известния резултат от вота, отколкото други. Съответно не беше изненадващо, че при обсъждането на този въпрос няколко седмици по-късно се оказа, че студентите са действали съгласувано през времето, определено за проучването. Обаждаха се последователно в телевизията, всеки по няколко пъти. Така нито размерът на извадката, нито процентът на привържениците на либерализацията на закона не са нещо изненадващо. Извадката не беше представителна.

Простото увеличаване на размера на извадката не я прави представителна. Представителността на извадката се осигурява не от размера, а от правилната процедура за подбор на елементите. Когато участниците в проучването са идентифицирани доброволно или елементите на извадката са избрани въз основа на тяхната наличност, планът за извадка не гарантира представителност на извадката. Емпиричните данни показват, че извадките, избрани от съображения за удобство, рядко са представителни (независимо от размера на извадката). Телефонните анкети, които обхващат 800-900 гласа, са най-честата форма на големи, но непредставителни извадки.

Целенасочено вземане на проби
Детерминистично (целенасочено) вземане на проби, чиито елементи се избират ръчно; подбират се точно тези елементи, които според изследователя отговарят на целите на изследването.
Целенасочена извадка, в зависимост от способността на изследователя да идентифицира първоначален набор от респонденти с желаните характеристики; тези респонденти след това се използват като информатори за определяне на по-нататъшния подбор на лица.

За съжаление, много хора приемат резултатите от подобни проучвания с доверие. Един от най-типичните примери за използване на непредставителни извадки в международните маркетингови проучвания е проучване на определени страни, базирано на извадка, състояща се от чужденци, живеещи в този моментна територията на страната, която е инициирала проучването (например скандинавци, живеещи в САЩ). Въпреки че такива проби могат да хвърлят известна светлина върху определени аспекти на въпросното население, трябва да се помни, че тези индивиди обикновено представляват „американизиран“ елит, чиято връзка със собствената им страна може да е доста условна. Не се препоръчва използването на непредставителни извадки при провеждане на описателни или причинно-следствени проучвания. Те са допустими само при проучвателни проучвания, насочени към разработване на конкретни идеи или концепции, но дори и в този случай е за предпочитане да се използват умишлени проби.

Целенасочено вземане на проби

Понякога се нарича целенасочено вземане на проби нефокусиран; техните елементи, които според изследователя отговарят на целите на изследването, се избират ръчно. Проктър и Гембълизползва този метод, когато показва реклами на 13- до 17-годишни, живеещи близо до централата в Синсинати. Подразделението за храни и напитки на компанията нае тази група тийнейджъри, за да действат като пример за потребители. Работейки 10 часа седмично в замяна на 1000 долара и отивайки на концерт, те гледаха телевизионни реклами, посещаваха супермаркети с мениджърите на компанията, за да разгледат продуктовите витрини, тестваха нови продукти и обсъждаха поведение при покупка. Чрез избирането на представители на извадката чрез процес на „набиране“, а не на случаен принцип, компанията може да се съсредоточи върху атрибути, които счита за полезни, като способността на тийнейджъра да се изразява ясно, с риск техните възгледи да не са представителни за тяхната възрастова група.

Както вече беше посочено, отличителна чертаПреднамерената извадка е насоченият подбор на нейните елементи. В някои случаи примерните елементи се избират не защото са представителни, а защото могат да предоставят информация, представляваща интерес за изследователите. Когато съдът разчита на експертни показания, той в известен смисъл прибягва до използването на умишлено вземане на проби. Подобна позиция може да преобладава при разработването на изследователски проекти. По време на първоначалното проучване на въпроса изследователят се интересува преди всичко от определянето на перспективите за изследването, което определя избора на елементи на извадката.

Вземане на проби със снежна топкае вид целенасочена извадка, използвана при работа със специални видове популации. Тази извадка зависи от способността на изследователя да идентифицира първоначален набор от респонденти с желаните характеристики. След това тези респонденти се използват като информатори за определяне на по-нататъшния подбор на лица.

Представете си например, че една компания иска да оцени необходимостта от определен продукт, който би позволил на глухите хора да комуникират по телефона. Изследователите могат да започнат да развиват този проблем, като идентифицират ключови фигури в общността на глухите; последният би могъл да посочи други членове на тази група, които биха се съгласили да участват в проучването. С такава тактика извадката расте като снежна топка.

Докато изследователят е в ранните етапи на изследване на проблема и определяне на перспективите и възможните ограничения на планираното проучване, използването на целенасочено вземане на проби може да бъде много ефективно. Но в никакъв случай не трябва да забравяме за слабостите на извадка от този тип, тъй като тя може да се използва и от изследователя в описателни или причинно-следствени изследвания, което веднага ще се отрази на качеството на техните резултати. Класически пример за такава забрава е индексът на потребителските цени (CPI). Както отбелязва Сюдман ( Судман): „ИПЦ се определя само за 56 града и метрополни области, чийто избор също е повлиян от политическия фактор. Всъщност тези градове могат да представляват само себе си, докато индексът се нарича индекс на цените на потребителските стоки за жителите на града, получаващи почасово заплащане заплати *, И служителии изглежда за повечето хора като индекс, отразяващ нивото на цените във всяка област на Съединените щати. Самият избор на търговски обекти също се извършва неслучайно, в резултат на което оценяването на възможната грешка на извадката става невъзможно"(курсивът е добавен) 2.

* Тоест работници. - Забележка. платно

Квотни проби

Третият тип детерминистично вземане на проби е квотни проби; неговата известна представителност се постига чрез включване в него на същия дял от елементи с определени характеристики, както в изследваната популация (вижте „Прозорец за изследване 15.1“). Като пример можете да помислите да се опитате да създадете представителна извадка от студенти, живеещи в кампуса. Ако в определена извадка, състояща се от 500 души, няма нито един старши ученик, ние ще имаме право да се съмняваме в нейната представителност и легитимността на прилагането на резултатите, получени от тази извадка, към изследваната популация. Когато работи с пропорционална извадка, изследователят може да гарантира, че делът на старшите ученици в извадката съответства на техния дял в общия брой студенти.

Да предположим, че изследовател провежда извадково проучване на студенти и се интересува да гарантира, че извадката отразява не само техния пол, но и тяхното разпределение между курсовете. Нека общият брой на студентите е 10 000: 3200 са студенти първа година, 2600 са студенти втора година, 2200 са студенти трета година и 2000 са студенти четвърта година; от които 7000 момчета и 3000 момичета. За размер на извадката от 1000 пропорционалният план за извадка изисква 320 първокурсници, 260 второкурсници, 220 трети години и 200 абсолвенти, 700 момчета и 300 момичета. Изследователят може да приложи този план, като назначи на всеки интервюиращ конкретна квота, която ще определи с кои ученици трябва да се свърже.

Квотна извадкаДетерминистична извадка, избрана така, че делът на елементите в извадката, които имат определени характеристики, съответства приблизително на дела на същите елементи в изследваната популация; Всеки полеви работник получава квота, която определя характеристиките на населението, с което той трябва да влезе в контакт.

Интервюиращ, който трябва да проведе 20 интервюта, може да бъде инструктиран да попита:

            • шестима първолаци - пет момчета и едно момиче;
            • шестима второкласници - четири момчета и две момичета;
            • четирима третокурсници - три момчета и едно момиче;
            • четирима студенти от четвърти курс - две момчета и две момичета.

Обърнете внимание, че изборът на конкретни елементи на извадката се определя не от изследователския план, а от избора на интервюиращия, предназначен да отговаря само на условията, определени от квотата: интервюирайте петима първокурсници, един първокурсник и т.н.

Имайте предвид също, че тази квота точно отразява разпределението по пол на студентската популация, но донякъде изкривява разпределението на студентите по курсове; 70% (14 от 20) от интервютата са сред момчета, но само 30% (6 от 20) са сред първокурсници, докато те съставляват 32% от общия брой студенти. Квотата, разпределена за всеки отделен интервюиращ, може да не отразява и обикновено не отразява разпределението на контролните характеристики в популацията - само получената извадка трябва да има подходящата пропорционалност.

Трябва да се помни, че пропорционалните извадки зависят от лични, субективни нагласи или преценки, а не от обективна процедура за подбор на елементите на извадката. Освен това, за разлика от умишленото вземане на проби, личната преценка тук принадлежи не на разработчика на проекта, а на интервюиращия. Възниква въпросът дали пропорционалните извадки могат да се считат за представителни, дори ако те възпроизвеждат присъщото съотношение на компоненти на популацията, които имат определени контролни характеристики. В тази връзка трябва да се направят три забележки.

Първо, извадката може да се различава значително от съвкупността по някои други важни характеристики, което може да окаже сериозно влияние върху резултата. Например, ако изследването е посветено на проблема с расовите предразсъдъци сред учениците, важно обстоятелство може да се окаже откъде идват респондентите: от града или от провинцията. Тъй като не е определена квота за характеристиката „от градски/селски произход“, точното представяне на тази характеристика става малко вероятно. Разбира се, има алтернатива: да се определят квоти за всички потенциално значими характеристики. Въпреки това, увеличаването на броя на контролните характеристики води до по-сложна спецификация. Това от своя страна затруднява, а понякога дори невъзможно, избора на примерни елементи и при всички случаи води до увеличаване на цената му. Ако, например, градският или селският произход и социално-икономическият статус също са от значение за проучването, тогава интервюиращият може да трябва да потърси първокурсник, който е градски и е от висшата или средната класа. Съгласете се, че намирането само на първокурсник е много по-лесно.

Второ, много е трудно да се гарантира, че дадена извадка е наистина представителна. Разбира се, възможно е да се провери извадката, за да се гарантира, че разпределението на характеристиките, които не са включени в контролата, съответства на тяхното разпределение в популацията. Такава проверка обаче може да доведе само до негативни заключения. Единственото нещо, което може да бъде идентифицирано, е разминаването на разпределенията. Ако разпределенията на извадката и съвкупността за всяка от тези характеристики се повтарят взаимно, съществува възможност извадката да се различава от съвкупността по някакъв друг, неизрично посочен начин.

И накрая, трето. Когато интервюиращите са оставени сами на себе си, те са склонни да предприемат определени действия. Твърде често прибягват до интервюиране на приятелите си. Тъй като те често се оказват подобни на самите интервюиращи, има опасност от грешка. Доказателствата от Англия показват, че квотните проби са склонни към:

  1. преувеличаване на ролята на най-достъпните елементи;
  2. омаловажаване ролята на малките семейства;
  3. преувеличаване на ролята на семействата с деца;
  4. омаловажаване на ролята на работниците, участващи в индустриалното производство;
  5. омаловажаване на ролята на тези с най-високи и най-ниски доходи;
  6. омаловажаване на ролята на нискообразованите граждани;
  7. омаловажаване на ролята на лица, заемащи ниско социално положение.
Интервюиращите, които избират квоти, като спират случайни минувачи, вероятно ще фокусират вниманието си върху области с голям брой потенциални респонденти, като напр. център за пазаруване, гари и летища, входове на големи супермаркети и други подобни. Тази практика води до свръхпредставяне на тези групи хора, които най-често посещават такива места. Когато се налагат домашни посещения, интервюиращите често са мотивирани от удобство.
Например, те могат да провеждат проучвания само през деня, което води до подценяване на мненията на работниците. Освен всичко друго, те не влизат в порутени сгради и по правило не се изкачват на горните етажи на сгради, които нямат асансьори.

В зависимост от спецификата на проблема, който се изследва, тези тенденции могат да доведат до различни видове грешки, но коригирането им на етапа на анализ на данните изглежда много, много трудно. От друга страна, с обективен подбор на елементи на извадката, изследователите имат на разположение определени инструменти, които позволяват да се опрости процедурата за оценка на представителността на дадена извадка. Когато анализира проблема с представителността на такива проби, изследователят разглежда не толкова състава на извадката, колкото процедурата за подбор на нейните елементи.

Прозорец за проучване: Брилянтно! Но кой ще прочете това?

Всяка година рекламодателите харчат милиони долари за реклами, публикувани в безброй публикации, от Advertising Age до Yankee. Определена оценка на текста и изображението може да се извърши преди публикуването му, както се казва, у дома, в рекламна агенция; истинската му проверка и оценка става едва след публикуването на обявата, заобиколена от десетки еднакво старателно подготвени реклами, борещи се за вниманието на читателя.

Компания Roper Starch в световен мащабсе занимава с оценка на четливостта на реклами, публикувани в потребителски, бизнес, търговски и професионални списания и вестници. Резултатите от изследването се предоставят на вниманието на рекламодатели и агенции – разбира се, срещу съответното заплащане. Тъй като рекламодателите полагат големи усилия всеки ден, за да донесат своите реклами до потребителите, компанията нишестереши да състави извадка, която да предостави на абонатите навременна и точна информация за ефективността на рекламата. Всяка година компанията нишестеанкетира повече от 50 000 души, разглеждайки около 20 000 реклами. Проучвани са около 500 отделни публикации годишно.

Starch използва пропорционално вземане на проби с минимален размер на извадката от 100 читатели от единия пол и 100 читатели от другия пол. Старч стигна до заключението, че с този размер на извадката основните вариации в нивата на четимост се стабилизират. Читателите на възраст над 18 години бяха анкетирани лично и това включваше всички публикации, с изключение на тези, предназначени за специални групи от населението (например момичета на същата възраст бяха анкетирани, за да оценят публикациите на списание Seventeen).

При провеждане на проучвания беше взета предвид зоната на разпространение на конкретна публикация. Да кажем, че проучване на списание Лос Анджелис разглежда читатели, живеещи в Южна Калифорния. Времето се изучаваше национално. Проучването е посветено на отделни броеве на списанието и е проведено в 20-30 града едновременно.

На всеки интервюиращ беше определена малка квота от интервюта, която послужи за минимизиране на пристрастията на проучването. Бяха раздадени въпросници на хора с различни професии и възраст с различни доходи. Всяко подобно изследване дава възможност за представяне на позиции пред доста широка читателска аудитория. При разглеждането на редица професионални, бизнес и браншови издания е отчетена и спецификата на техния абонамент и разпространение. Абонаментните списъци, посветени на публикации с доста тясно разпространение, позволиха да се изберат приемливи респонденти.

Във всяко проучване интервюиращите помолиха респондентите да разгледат публикацията и да попитат дали са забелязали някакви реклами. При положителен отговор регистраторът задава цяла поредица от въпроси, за да прецени степента на възприемане на рекламата.

Тази оценка може да бъде тройна:

  • Обърнете внимание: тези, които вече са обърнали внимание на самия факт на появата на такова съобщение.
  • Срещнахме: тези, които си спомнят някоя част от рекламата, която се отнася до рекламираната марка или рекламодателя.
  • Прочетете: лица, прочели поне половината от рекламата.

След като прегледаха всички реклами, интервюиращите записаха основна класификационна информация: пол, възраст, професия, семейно положение, националност, доход, размер и състав на семейството, което направи възможно кръстосаната таблица на нивото на читателския интерес.

Когато се използват правилно, фирмените данни нишестепозволяват на рекламодателите и агенциите да идентифицират както неуспешните, така и успешните видове рекламни схеми, които привличат и задържат вниманието на читателя. Информацията от този вид е изключително ценна за рекламодатели, които се интересуват преди всичко от ефективността на своята рекламна кампания.

Източник: Roper Starch Worldwide, Mamaronek, NY 10543.

Вероятностни проби

Изследователят може да определи вероятността за включване на всеки елемент от съвкупността във вероятностна извадка, тъй като подборът на нейните елементи се извършва въз основа на някакъв обективен процес и не зависи от капризите и предпочитанията на изследователя или теренния работник. Тъй като процедурата за избор на елементи е обективна, изследователят може да оцени надеждността на получените резултати, което беше невъзможно в случай на детерминистични проби, без значение колко внимателен е изборът на елементи от последните.

Не трябва да се мисли, че вероятностните проби винаги са по-представителни от детерминистичните. Всъщност една детерминистична извадка може да бъде по-представителна. Предимството на вероятностните извадки е, че те позволяват да се оцени възможната грешка на извадката. Ако изследователят работи с детерминистична извадка, той не разполага с обективен метод за оценка на нейната адекватност спрямо целите на изследването.

Проста случайна извадка

Повечето хора са се сблъсквали с проста случайна извадка по един или друг начин, или като част от курс по статистика в колежа, или като са чели за резултатите от съответните проучвания във вестници или списания. При проста случайна извадка всеки елемент, включен в извадката, има същата определена вероятност да бъде включен в извадката и всяка комбинация от елементи от първоначалната популация може потенциално да стане извадка. Например, ако искаме да съставим проста произволна извадка от всички студенти, записани в определен колеж, ще трябва само да направим списък на всички студенти, да присвоим номер на всяко име в него и да използваме компютър, за да изберем на случаен принцип даден брой елементи.

Население

Население
Набор от елементи, които отговарят на определени определени условия; наричана още изследвана (целева) популация.
Параметър
Специфична характеристика или индикатор за обща или изследвана популация.

Общата или изследвана популацияе популацията, от която се прави селекцията. Тази съвкупност (популация) може да бъде описана с редица специфични параметри, които са характеристики на генералната съвкупност, всеки от които представлява определен количествен показател, който отличава една популация от друга.

Представете си, че изследваната популация е цялата възрастно населениеСинсинати. Редица параметри могат да се използват за описание на тази популация: средна възраст, съотношение на населението с висше образование, ниво на доходи и т.н. Моля, имайте предвид, че всички тези показатели имат определена фиксирана стойност. Разбира се, можем да ги изчислим, като направим пълно преброяване на изследваното население. Обикновено ние разчитаме не на квалификации, а на извадката, която избираме и използваме стойностите, получени по време на наблюдението на извадката, за да определим необходимите параметри на популацията.

Нека илюстрираме казаното в таблица 1. 15.1 е пример за хипотетична популация, състояща се от 20 души. Работата с малко хипотетично население като това има редица предимства. Първо, малкият размер на извадката дава възможност за лесно изчисляване на параметрите на популацията, които могат да се използват за нейното описание. Второ, този обхват дава представа какво може да се случи, ако се приеме определен план за вземане на проби. И двете характеристики улесняват сравняването на резултатите от извадката с „истинската“ и в този случай известна стойност на популацията, което не е така в типичната ситуация, в която истинската стойност на популацията е неизвестна. Сравнението на оценката с „истинската“ стойност става особено ясно в този случай.

Да предположим, че искаме да оценим, въз основа на два произволно избрани елемента, средния доход на индивидите в първоначалната популация. Средният доход ще бъде негов параметър. За да оценим тази средна стойност, която обозначаваме като μ, трябва да разделим сумата от всички стойности на техния брой:

Средна популация μ = Сума от елементи на популация / Брой елементи.

В нашия случай изчисленията дават:

Произведен набор

Произведен наборсе състои от всички възможни проби, които могат да бъдат избрани от генералната съвкупност според даден план за вземане на проби (план за вземане на проби). Статистикае характеристика или индикатор на проба. Стойността на извадкова статистика се използва за оценка на конкретен параметър на популацията. Различните проби произвеждат различни статистики или оценки на един и същ параметър на популацията.

Произведен набор
Съвкупността от всички възможни различими проби, които могат да бъдат избрани от популацията съгласно даден план за вземане на проби. Статистика Характеристика или индикатор на извадка.

Помислете за получената популация от всички възможни проби, които могат да бъдат избрани от нашата хипотетична популация от 20 индивида съгласно план за вземане на проби, който предполага размер на извадката от n=2може да се получи чрез случаен неповтарящ се избор.

Нека за момента приемем, че данните за всяка единица от съвкупността - в нашия случай името и дохода на индивида - се записват на чаши, след което се пускат в кана и се смесват. Изследователят изважда един кръг от каната, записва информация от него и го оставя настрана. Той прави същото с втория кръг, изваден от каната. След това изследователят връща двете чаши в каната, смесва съдържанието й и повтаря същата последователност от действия. В табл Фигура 15.2 показва възможните резултати от тази процедура. За 20 кръга са възможни 190 такива сдвоени комбинации.

За всяка комбинация може да се изчисли средният доход. Да кажем за проба AB (k= 1)

к-e извадкова средна = Сума от извадкови елементи / Брой извадкови елементи =

На фиг. 15.4 показва оценката на средния доход за цялата популация и големината на грешката за всяка оценка за извадките k = 25, 62,108,147И 189 .

Преди да започнем да разглеждаме връзката между извадковия среден доход (статистика) и средния доход на населението (параметър, който изисква оценка), нека кажем няколко думи за получената съвкупност. Първо, на практика ние не конструираме агрегати от този вид. Това ще изисква твърде много време и усилия. Практикуващият лекар е ограничен до съставянето само на една проба с необходимия размер. Изследователят използва концепцияполучена популация и свързаната с нея концепция за разпределение на извадката при формулиране на окончателни заключения.

Как ще бъде показано по-долу. Второ, трябва да се помни, че получената популация се дефинира като съвкупността от всички възможни различни проби, които могат да бъдат избрани от популацията съгласно даден план за вземане на проби. Когато някоя част от плана за вземане на проби се промени, получената популация също се променя. По този начин, ако при избора на кръгове изследователят върне първия от отстранените дискове в каната, преди да извади втория, полученият набор ще включва.

проби AA, BB и т.н. Ако обемът на неповтарящите се проби е равен на 3, а не на 2, ще се появят проби от типа ABC и ще има 1140 от тях, а не 190, както беше в случая предишен случай. При преминаване от обикновена случайна извадка към всеки друг метод за избор на елементи на извадката, получената популация също се променя.

Трябва също така да се помни, че избирането на извадка с даден размер от обща съвкупност е еквивалентно на избирането на един елемент (1 от 190) от производна съвкупност. Този факт ни позволява да направим много статистически изводи.

Средна стойност на извадката и средна стойност на популацията

Имаме ли право да приравним средната стойност на извадката към истинската средна стойност на съвкупността? Във всеки случай приемаме, че те са взаимосвързани. Ние обаче вярваме, че ще възникне грешка. Например, може да се предположи, че информацията, получена от интернет потребителите, ще се различава значително от резултатите от проучване на „обикновеното“ население. В други случаи можем да предположим доста близко съвпадение, в противен случай не бихме могли да използваме стойността на извадката, за да оценим общата стойност. Но колко голяма грешка можем да направим в това?

Нека съберем всички примерни средни стойности, съдържащи се в таблицата. 15.2 и разделете получената сума на броя на пробите, т.е. нека осредним средните стойности.
Ще получим следния резултат:

Съвпада със средната стойност на населението. Казват, че в случая имаме работа с безпристрастна статистика.

Една статистика се счита за безпристрастна, ако нейната средна стойност за всички възможни извадки е равна на изчисления параметър на популацията. Моля, обърнете внимание, че тук не говорим за някакво конкретно значение.Частичната оценка може да бъде доста далеч от истинската стойност - вземете например пробите AB или ST. В някои случаи истинската стойност на популацията може да не е постижима чрез разглеждане на всяка възможна извадка, дори ако статистиката е безпристрастна. В нашия случай това не е така: цял набор от възможни проби - например AT - дава средна стойност на извадката, равна на истинската средна стойност на съвкупността.

Има смисъл да се разгледа разпределението на тези извадкови оценки и по-специално връзката между това разпространение на оценките и вариациите в нивата на доходите в населението. Дисперсията на популацията се използва като мярка за вариация. За да определим дисперсията на съвкупността, трябва да изчислим отклонението на всяка стойност от средната, да съберем квадратите на всички отклонения и да разделим получената сума на броя на членовете. Нека означим дисперсията на популацията с a^. Тогава:

Дисперсия на популацията σ 2 = Сума от квадратите на разликите на всеки елемент
население и средно население / Брой елементи на населението =

дисперсия средна стойностнивото на дохода може да се определи по същия начин. Тоест, можем да го намерим, като определим отклоненията на всяка средна стойност от общата им средна стойност, сумирайки квадратите на отклоненията и разделяйки получената сума на броя на членовете.

Можем да определим дисперсията на нивото на средния доход по друг начин, използвайки дисперсията на нивата на доходите в населението, тъй като има пряка връзка между тези две стойности. За да бъдем точни, в случаите, когато извадката представлява само малка част от популацията, дисперсията на средната стойност на извадката е равна на дисперсията на популацията, разделена на размера на извадката:

където σ x 2 е дисперсията на средната извадкова стойност на нивото на дохода, σ 2 е дисперсията на нивото на дохода в генералната съвкупност, н— размер на извадката.

Сега нека сравним разпределението на резултатите с разпределението на количествена характеристика в общата съвкупност. Фигура 15.5 демонстрира, че разпределението на популацията на количествен признак, показано в панел A, е многопиково (всяка от 20-те стойности се появява само веднъж) и е симетрично спрямо истинската средна популация от 9400.

Раздаване на проби
Разпределението на стойностите на определена статистика, изчислена за всички възможни различими проби, които могат да бъдат избрани от популацията съгласно даден план за вземане на проби.

Разпределението на резултатите, показано в поле Б, се основава на данните в таблица 1. 15.3, който от своя страна е компилиран чрез присвояване на стойности от табл. 15.2 към една или друга група в зависимост от техния размер, последвано от преброяване на броя им в групата. Поле B е традиционна хистограма, разглеждана в самото начало на курс по статистика, която представлява разпределение на пробитестатистика. Нека мимоходом отбележим следното: концепцията за извадковото разпределение е най-важната концепция в статистиката; тя е крайъгълният камък за конструиране на статистически изводи. Въз основа на известното извадково разпределение на изследваната статистика можем да направим заключение за съответния параметър на съвкупността. Ако е известно само, че оценката на извадката варира от извадка на извадка, но естеството на тази промяна е неизвестно, става невъзможно да се определи грешката на извадката, свързана с тази оценка. Тъй като извадковото разпределение на една оценка описва нейните вариации от извадка на извадка, то предоставя основа за определяне на валидността на извадковата оценка. Поради тази причина дизайнът на вероятностната извадка е толкова важен за статистическите изводи.

От известните вероятности за включване в извадката на всеки елемент от популацията, интервюиращите могат да намерят извадковото разпределение на различни статистики. Изследователите разчитат на тези разпределения - независимо дали става въпрос за средна стойност на извадката, пропорция на извадката, дисперсия на извадката или някаква друга статистика - когато разширяват резултата от наблюдение на извадката към популацията. Обърнете внимание също, че за проби от размер 2, разпределението на средните стойности на извадката е едновърхово и симетрично спрямо истинската средна стойност.

Така че ние показахме, че:

  1. Средната стойност на всички възможни извадкови средни е равна на общата средна стойност.
  2. Дисперсията на извадковите средни е по определен начин свързана с общата дисперсия.
  3. Разпределението на извадковите средни е едновърхово, докато разпределението на стойностите на количествена характеристика в генералната съвкупност е многопиково.

Централна гранична теорема

Теорема, която гласи, че за прости произволни проби от обем н, изолирани от генералната съвкупност с общо средно μ и дисперсия σ 2, за големи нразпределението на средната стойност на извадката x се доближава до нормалното с център, равен на μ и дисперсия σ 2 . Точността на това приближение се увеличава с увеличаване н.

Централна гранична теорема. Еднопиковото разпределение на оценките може да се разглежда като проявление на централната гранична теорема, която гласи, че за прости произволни проби от обем н, изолирани от общата съвкупност с истинска средна стойност μ и дисперсия σ 2, за големи нразпределението на средните стойности на извадката се доближава до нормално с център, равен на истинската средна стойност и дисперсия, равна на съотношението на дисперсията на съвкупността към размера на извадката, т.е.:

Това приближение става все по-точно, докато растем н. Запомни това. Независимо от вида на популацията, разпределението на средните стойности на извадката ще бъде нормално за извадки с достатъчно голям размер. Какво трябва да се разбира под достатъчно голям обем? Ако разпределението на стойностите на количествена характеристика на генералната популация е нормално, тогава разпределението на извадката означава за извадки с размер н=1. Ако разпределението на променлива (количествена характеристика) в популацията е симетрично, но не е нормално, много малки извадки ще доведат до нормално разпределение на средните стойности на извадката. Ако разпределението на количествена характеристика на генералната съвкупност има изразена асиметрия, има нужда от по-големи извадки. И все пак разпределението на средната стойност на извадката може да се приеме за нормално само в случаите, когато имаме работа с извадка с достатъчен размер.

За да се направят изводи, използвайки нормална крива, изобщо не е необходимо да се изхожда от условието за нормално разпределение на стойностите на количествена характеристика на общата съвкупност. По-скоро разчитаме на централната гранична теорема и в зависимост от разпределението на населението определяме размер на извадката, който би ни позволил да работим с нормална крива. За щастие, нормалното разпределение на статистиката се осигурява от относително малки извадки - Фиг. 15.6 ясно показва това обстоятелство. Оценки на доверителния интервал. Горното може ли да ни помогне да направим определени заключения относно общата средна стойност? Наистина, на практика ние избираме само една, а не всички възможни проби от даден размер, и въз основа на получените данни правим определени изводи по отношение на целевата група.

как става това Както е известно, при нормално разпределение определен процент от всички наблюдения имат определено стандартно отклонение; Да кажем, че 95% от наблюденията се вписват в рамките на ±1,96 стандартни отклонения от средната стойност. Нормалното разпределение на извадковите средни, към които може да се приложи централната гранична теорема, не е изключение в този смисъл. Средната стойност на такова извадково разпределение е равна на общата средна стойност μ, а нейното стандартно отклонение се нарича стандартна грешка на средната стойност:

Оказва се, че:

  • 68,26% от извадковите средни се отклоняват от общата средна с не повече от ± σ x;
  • 95,45% от средните стойности на извадката се отклоняват от общата средна стойност с не повече от ±σ x;
  • 99,73% от средните стойности на извадката се отклоняват от общата средна стойност с не повече от ± σ x,

т.е. определена част от извадката означава в зависимост от избраната стойност zще се съдържа в интервала, определен от стойността z. Този израз може да се пренапише като неравенство:

Обща авария - z < Среднее по выборке < Генеральное среднее + z(Средна квадратна грешка на средната)

Така извадковата средна с определена вероятност се намира в интервала, чиито граници са сборът и разликата на средната стойност на разпределението и определен брой стандартни отклонения. Това неравенство може да се трансформира в:

Примерна средна стойност - z(Средна квадратна грешка на средната)< Генеральное среднее < Среднее по выборке + z(Средна квадратна грешка на средната)

Ако съотношението 15,1 се наблюдава например в 95% от случаите ( z= 1,96), то в 95% от случаите се наблюдава отношение 15,2. В случаите, когато заключението се основава на една извадкова средна стойност, използваме израз 15.2.

Важно е да запомните, че израз 15.2 не означава, че интервалът, съответстващ на дадена проба, трябва непременно да включва общата средна стойност. Интервалът има повече общо с процедурата за подбор.Интервалът, конструиран около дадена средна стойност, може или не може да включва истинската средна стойност на съвкупността. Нашата увереност в правилността на направените заключения се основава на факта, че 95% от всички интервали, конструирани според избрания план за вземане на проби, ще съдържат истинската средна стойност. Вярваме, че нашата извадка попада в тези 95%.

За да илюстрираме тази важна точка, нека си представим за момент, че разпределението на извадката означава за извадки с размер н= 2 в нашия хипотетичен пример е нормално. Таблица 15.4 ясно илюстрира резултата за първите 10 от възможните 190 проби, които могат да бъдат избрани по даден дизайн. Обърнете внимание, че само 7 от 10-те интервала включват голяма или истинска средна стойност. Увереността в правилността на заключението не се дължи на някаква конкретна оценка, а точно процедураоценки. Тази процедура е такава, че за 100 проби, за които ще бъдат изчислени средната стойност на извадката и доверителният интервал, в 95 случая този интервал ще включва истинската обща стойност. Точността на дадена проба се определя от процедурата, по която е избрана пробата. Представителният модел на вземане на проби не гарантира, че всички проби са представителни. Процедурите за статистически изводи се основават на представителността на плана за вземане на проби, поради което тази процедура е толкова критична за вероятностните проби.

Вероятностните проби ни позволяват да оценим точността на резултатите като близостта на направените оценки до истинската стойност. Колкото по-голяма е средната квадратична грешка на статистиката, толкова по-висока е степента на разсейване на оценките и толкова по-ниска е точността на процедурата.

Някои може да бъдат объркани от факта, че нивото на достоверност е свързано с процедурата, а не с конкретната стойност на извадката, но трябва да се помни, че величината на нивото на достоверност за оценка на общата стойност може да бъде коригирана от изследователя. Ако не искате да рискувате и се притеснявате, че може да срещнете един от петте избрани интервала на извадка, който не включва средната стойност на съвкупността, можете да изберете 99% доверителен интервал, в който само един от сто интервала на извадка прави не включва средната стойност на населението. Освен това, ако можете да увеличите размера на извадката, вие ще увеличите нивото на достоверност на резултата, осигурявайки желаната точност при оценката на стойността на популацията. Ще говорим за това по-подробно в гл. 17.

Процедурата, която описваме, има още един компонент, който може да предизвика известно объркване. При оценката на доверителния интервал се използват три величини: x, zи σx. Средната стойност на извадката x се изчислява от данните от извадката, zсе избира въз основа на желаното ниво на увереност. Но какво да кажем за средната квадратична грешка на средното σ x? То е равно на:

и следователно, за да го определим, трябва да зададем стандартното отклонение на количествената характеристика на генералната съвкупност, т.е. 5. Какво да правим в случаите, когато стандартното отклонение снепознат? Този проблем не възниква по две причини. Първо, обикновено за повечето количествени атрибути, използвани в маркетинговите изследвания, вариацията се променя много по-бавно от нивото на повечето променливи, представляващи интерес за маркетолога. Съответно, ако изследването се повтори, можем да използваме предишната, предварително получена стойност на s в изчисленията. Второ, след като извадката е избрана и данните са получени, можем да оценим дисперсията на съвкупността чрез определяне на дисперсията на извадката. Дисперсията на безпристрастна извадка се определя като:

Дисперсия на извадката ŝ 2 = Сума от квадратните отклонения от средната стойност на извадката / (Брой елементи на извадката -1). За да определим дисперсията на извадката, първо трябва да намерим средната стойност на извадката. След това се откриват разликите между всяка от стойностите на извадката и средната извадка; тези разлики се повдигат на квадрат, сумират се и се разделят на число, равно на броя на пробните наблюдения минус едно. Дисперсията на извадката не само осигурява оценка на общата дисперсия, но може да се използва и за оценка на средната квадратична грешка на средната стойност. Когато общата дисперсия σ 2 е известна, средната квадратична грешка σ x също е известна, тъй като:

Когато общата дисперсия е неизвестна, средната квадратична грешка на средната стойност може да бъде само оценена. Тази оценка е дадена ŝ x, което е равно на стандартното отклонение на извадката, разделено на корен квадратен от размера на извадката, т.е. Оценката се определя по същия начин, както беше определена оценката на истинската стойност, но вместо общото стандартно отклонение, стандартното отклонение на извадката се замества във формулата за изчисление. Така, да речем, за проба AB със средна стойност на извадката 5800:

Съответно ŝ = 283 и

и интервалът от 95% е сега

което е по-малко от предишната стойност.

В табл 15,5 смесено формули за изчислениеза различните средства и вариации, обсъдени в тази глава. Формиране на проста случайна извадка. В нашия пример изборът на елементи на извадката беше извършен с помощта на кана, която съдържаше всички елементи на първоначалната популация. Това ни позволи да визуализираме концепциите за получена популация и разпределение на извадката. Не препоръчваме да използвате такъв метод на практика, тъй като това увеличава вероятността от грешка. Чашите могат да се различават както по размер, така и по текстура, което в определени случаи може да доведе до предпочитание към една пред друга. Изборът на участници във виетнамската кампания, извършен чрез лотария, може да служи като пример за такъв тип грешка.

Изборът се извършваше чрез изтегляне на дискове с дати на раждане от голям барабан. Телевизиите излъчиха тази процедура в цялата страна. За съжаление, дисковете бяха заредени в барабана по систематичен начин: януарските дати бяха първи, декемврийските последни. Въпреки че барабанът беше подложен на интензивно въртене, декемврийските дати падаха много по-често от януарските. Впоследствие тази процедура беше преразгледана по такъв начин, че вероятността от такива системни грешки беше значително намалена. Предпочитаният метод за теглене на проста случайна извадка се основава на използването на таблица със случайни числа.

Използването на такава таблица включва следната последователност от стъпки. Първо, на елементите на популацията трябва да бъдат присвоени последователни номера от 1 до н; в нашата хипотетична съвкупност елементът Аще бъде присвоен номер 1, елемент б- номер 2 и т.н. Второ, броят на цифрите в таблицата със случайни числа трябва да е същият като числото н. За н= ще се използват 20 двуцифрени числа; За нмежду 100 и 999 са трицифрени числа и т.н. Трето, началната позиция трябва да бъде определена произволно. Можем да отворим съответната таблица със случайни числа и, затваряйки очи, както се казва, да посочим с пръст към нея. Тъй като числата в таблицата със случайни числа са в произволен ред, началната позиция няма особено значение.

И накрая, можем да се движим във всяка произволно избрана посока - нагоре, надолу или напречно, избирайки тези елементи, чиито номера ще съответстват на произволни числа от таблицата. За да илюстрираме казаното, разгледайте съкратена таблица със случайни числа (Таблица 15.6). Тъй като н= 20, трябва да работим само с двуцифрени числа. В този смисъл табл. 15.6 ни устройва идеално. Нека решим предварително да се придвижим надолу по колоната, но началната позиция е в пресечната точка на единадесетия ред и четвъртата колона, където се намира числото 77. Това число е твърде голямо и следователно трябва да бъде изхвърлено. Следващите две числа също ще бъдат отхвърлени, но четвъртата стойност 02 ще бъде използвана, тъй като 2 съответства на номера на елемента IN.

Следващите пет числа също ще бъдат отхвърлени като твърде големи, докато числото 05 ще показва елемента д. Така че елементите INИ дще стане нашата двуелементна извадка, по която ще съдим за нивото на доходите на тази популация. Възможна е и алтернативна стратегия, при която компютърна програма, която генерира произволни числа, ще се използва като основа за избор. Последните публикации показват, че числата, генерирани от такива програми, не са напълно случайни, което може да се прояви по определен начин при конструирането на сложни математически модели, но могат да се използват за повечето приложни маркетингови изследвания. Обърнете внимание отново, че една проста произволна извадка изисква съставянето на последователно номериран списък от елементи на популацията.

С други думи, всеки член на първоначалната популация трябва да бъде идентифициран. За някои популации това не е трудно да се направи, например, когато се изучават 500-те най-големи американски корпорации, чийто списък е даден в списание Fortune. Този списък вече е съставен, така че формирането на проста произволна извадка в този случай няма да бъде трудно. За други първоначални популации (например за всички семейства, живеещи в определен град), съставянето на общ списък е изключително трудно, което принуждава изследователите да прибягват до други схеми за вземане на проби.

Резюме

Учебна цел 1
Правете ясна разлика между понятията преброяване (ценз) и извадка

Пълно преброяване на населението се нарича квалификация. пробаколекция, образувана от избрани елементи.

Учебна цел 2
Познайте същността и последователността на шестте етапа, прилагани от изследователите за получаване на извадкова съвкупност

Процесът на вземане на проби е разделен на шест етапа:

  1. присвояване на населението;
  2. определяне на рамката за вземане на проби;
  3. избор на процедура за подбор;
  4. определяне на размера на извадката;
  5. избор на примерни елементи;
  6. изследване на избрани елементи.

Учебна цел 3
Дефинирайте понятието "рамка за вземане на проби"

Рамката за вземане на проби е списъкът от елементи, от които ще бъде съставена извадката.

Учебна цел 4
Обяснете разликата между вероятностно и детерминистично вземане на проби

Във вероятностна извадка всеки член на популацията може да бъде включен с определена дадено ненулевовероятност. Вероятностите за включване на определени членове на популацията в извадката може да се различават една от друга, но вероятността за включване на всеки елемент в нея е известна. За детерминистичните проби оценката на вероятността за включване на всеки елемент в извадката става невъзможна. Представителността на такава извадка не може да бъде гарантирана. Цялото детерминистично вземане на проби се основава по-скоро на лично мнение, преценка или предпочитание. Такива предпочитания понякога могат да осигурят добри оценки на характеристиките на популацията, но няма начин да се определи обективно дали дадена извадка е подходяща за поставената задача.

Учебна цел 5
Правете разлика между вземане на проби с фиксиран размер и многоетапно (последователно) вземане на проби

При работа с извадки с фиксиран размер, размерът на извадката се определя преди началото на изследването и анализът на резултатите се предхожда от събирането на всички необходими данни. При последователно вземане на проби броят на избраните елементи е неизвестен предварително; той се определя въз основа на поредица от последователни решения.

Учебна цел 6
Обяснете какво представлява целенасоченото вземане на проби и опишете неговите силни и слаби страни

Елементите в целенасочена извадка се избират ръчно и се представят на изследователя като отговарящи на целите на проучването. Предполага се, че избраните елементи могат да осигурят пълна картина на изследваната популация. Докато изследователят е в ранните етапи на изследване на проблема и определяне на перспективите и възможните ограничения на планираното проучване, използването на целенасочено вземане на проби може да бъде много ефективно. Но в никакъв случай не трябва да забравяме за слабостите на извадка от този тип, тъй като тя може да се използва и от изследователя в описателни или причинно-следствени изследвания, което веднага ще се отрази на качеството на техните резултати.

Учебна цел 7
Дефинирайте понятието квотна извадка

Избира се пропорционална извадка, така че делът на елементите в извадката, които имат определени характеристики, съответства приблизително на дела на същите елементи в изследваната популация; За целта на всеки преброител се дава квота, която определя характеристиките на населението, с което той трябва да контактува.

Учебна цел 8
Обяснете какво е параметър в процедура за вземане на проби

Параметър - определена характеристика или показател на генералната или изследвана съвкупност; определен количествен показател, който отличава една популация от друга.

Учебна цел 9
Обяснете какво е производно множество

Получената популация се състои от всички възможни извадки, които могат да бъдат избрани от популацията съгласно даден план за вземане на проби.

Учебна цел 10
Обяснете защо концепцията за извадково разпределение е основна концепция в статистиката.

Концепцията за разпределение на извадката е крайъгълният камък на статистическите изводи. Въз основа на известното извадково разпределение на изследваната статистика можем да направим заключение за съответния параметър на съвкупността. Ако е известно само, че оценката на извадката варира от извадка на извадка, но естеството на тази промяна е неизвестно, става невъзможно да се определи грешката на извадката, свързана с тази оценка. Тъй като извадковото разпределение на една оценка описва нейните вариации от извадка на извадка, то предоставя основа за определяне на валидността на извадковата оценка.

Често се случва да е необходимо да се анализира конкретно социално явление и да се получи информация за него. Такива задачи често възникват в...

Пробовземането е... Определение, видове, методи и резултати от пробовземането

От Masterweb

09.04.2018 16:00

Често се случва да е необходимо да се анализира конкретно социално явление и да се получи информация за него. Такива задачи често възникват в статистиката и в статистически изследвания. Често е невъзможно да се провери едно напълно дефинирано социално явление. Например, как да разберете мнението на населението или всички жители на определен град по всеки въпрос? Да попитате абсолютно всички е почти невъзможно и отнема много време. В такива случаи се нуждаем от вземане на проби. Това е именно концепцията, на която се основават почти всички проучвания и анализи.

Какво е вземане на проби

Когато се анализира конкретно социално явление, е необходимо да се получи информация за него. Ако направите някакво изследване, ще забележите, че не всяка единица от съвкупността на обекта на изследване подлежи на изследване и анализ. Само определена част от цялата тази съвкупност се взема предвид. Този процес е вземане на проби: когато се изследват само определени единици от набор.

Разбира се, много зависи от вида на пробата. Но има и основни правила. Основният гласи, че изборът от популацията трябва да бъде абсолютно случаен. Съвкупните единици, които ще се използват, не трябва да се избират поради някакъв критерий. Грубо казано, ако е необходимо да се набере население от населението на определен град и да се изберат само мъже, тогава ще има грешка в изследването, тъй като подборът не е извършен на случаен принцип, а е избран въз основа на пола . Почти всички методи за вземане на проби се основават на това правило.

Правила за вземане на проби

За да може избраната съвкупност да отразява основните качества на цялото явление, тя трябва да бъде изградена по определени закони, като основното внимание трябва да се обърне на следните категории:

  • извадка (извадкова съвкупност);
  • население;
  • представителност;
  • грешка в представителността;
  • агрегатна единица;
  • методи за вземане на проби.

Характеристиките на селективното наблюдение и вземане на проби са следните:

  1. Всички получени резултати се основават на математически закони и правила, тоест, ако изследването е извършено правилно и с правилни изчисления, резултатите няма да бъдат изкривени по субективни причини
  2. Позволява да се получат резултати много по-бързо и с по-малко време и ресурси, като се изучава не целият набор от събития, а само част от тях.
  3. Може да се използва за изучаване на различни обекти: от конкретни въпроси, например възраст, пол на групата, която ни интересува, до изследване на общественото мнение или нивото на материална сигурност на населението.

Селективно наблюдение

Извадката е статистическо наблюдение, при което на изследване подлежи не цялата съвкупност от това, което се изследва, а само определена част от нея, подбрана по определен начин, като резултатите, получени от изследването на тази част, се разпределят върху цялата съвкупност. Тази част се нарича извадкова популация. Това е единственият начин да се изследва голям набор от обекти на изследване.

Но извадковото наблюдение може да се използва само в случаите, когато е необходимо да се изследва само малка група единици. Например при изследване на съотношението мъже и жени в света ще се използва извадково наблюдение. По очевидни причини е невъзможно да се вземе предвид всеки жител на нашата планета.

Но при същото изследване, но не на всички жители на земята, а на определен 2 „А” клас в конкретно училище, определен град, определена държава, може и без избирателно наблюдение. В крайна сметка е напълно възможно да се анализира целият масив на обекта на изследване. Необходимо е да се преброят момчетата и момичетата от този клас - това ще бъде съотношението.


Извадка и популация

Всъщност всичко не е толкова трудно, колкото звучи. Във всеки обект на изследване има две системи: генерална съвкупност и извадкова съвкупност. Какво е? Всички звена принадлежат към общото. И към извадката - онези единици от генералната съвкупност, които са взети за извадката. Ако всичко е направено правилно, тогава избраната част ще представлява намален модел на цялата (генерална) популация.

Ако говорим за генералната съвкупност, тогава можем да разграничим само два вида от нея: определена и неопределена генерална съвкупност. Зависи от това дали общият брой единици на дадена система е известен или не. Ако това е конкретна популация, тогава вземането на проби ще бъде по-лесно, защото знаете какъв процент от общия брой единици ще бъдат взети в извадка.

Тази точка е много необходима в изследването. Например, ако е необходимо да се изследва процентът на нискокачествени сладкарски изделия в конкретен завод. Да приемем, че населението вече е определено. Известно е със сигурност, че това предприятие произвежда 1000 сладкарски изделия годишно. Ако вземете проба от 100 произволни сладкарски изделия от тази хиляда и ги изпратите за изследване, тогава грешката ще бъде минимална. Грубо казано, 10% от всички продукти са били обект на изследване и въз основа на резултатите можем, като вземем предвид грешката в представителността, да говорим за лошото качество на всички продукти.

И ако вземете проба от 100 сладкарски продукта от несигурна популация, където в действителност е имало, да речем, 1 милион единици, тогава резултатът от пробата и самото изследване ще бъдат критично неправдоподобни и неточни. Усещате ли разликата? Следователно сигурността на популацията в повечето случаи е изключително важна и оказва голямо влияние върху резултата от изследването.


Представителност на населението

Така че сега един от най-важните въпроси е каква трябва да бъде пробата? Това е най-важният момент от изследването. На този етап е необходимо да се изчисли извадката и да се изберат единици от общия брой в нея. Съвкупността е избрана правилно, ако някои характеристики и характеристики на популацията остават в извадката. Това се нарича представителност.

С други думи, ако след селекцията една част запазва същите тенденции и характеристики като целия брой на извадката, тогава такава съвкупност се нарича представителна. Но не всяка конкретна извадка може да бъде избрана от представителна популация. Има и обекти на изследване, чиято извадка просто не може да бъде представителна. Тук възниква концепцията за пристрастие към представителността. Но нека поговорим за това по-подробно малко по-късно.

Как се прави проба

И така, за да се постигне максимална представителност, има три основни правила за вземане на проби:

  1. Най-уникалният брой на извадката се счита за 20%. Статистическа извадка от 20% почти винаги ще даде резултат, възможно най-близък до реалността. В същото време не е необходимо голяма част от населението да се прехвърля към събраното. 20% от извадката е показателят, който е разработен от много изследвания. Нека дадем още малко теория. Колкото по-голяма е извадката, толкова по-малка е грешката в представителността и толкова по-точен е резултатът от изследването. Колкото по-близо е извадката до генералната съвкупност по отношение на броя на единиците, толкова по-точни и правилни ще бъдат резултатите. В крайна сметка, ако изследвате цялата система, резултатът ще бъде 100%. Но тук вече няма мостра. Това са изследвания, в които се изследва целия масив, всички единици, така че това не ни интересува.
  2. Ако е нецелесъобразно да се обработват 20% от общата съвкупност, е разрешено да се изучават единици на популацията в размер най-малко 1001. Това също е един от показателите за изучаване на масива от обекта на изследване, който се е развил с течение на времето. Разбира се, няма да даде точни резултати с големи изследователски масиви, но ще го доближи максимално до възможната точност на вземане на проби.
  3. В статистиката има много формули и таблици. В зависимост от обекта на изследване и критерия за вземане на проби е препоръчително да изберете една или друга формула. Но тази точка се използва в сложни и многоетапни изследвания.

Грешка (грешка) на представителността

Основната характеристика на качеството на избраната проба е понятието „представителна грешка“. Какво е? Това са определени несъответствия между показателите на извадковото и непрекъснатото наблюдение. Въз основа на индикаторите за грешки представителността се разделя на надеждна, обикновена и приблизителна. С други думи, допустими са отклонения съответно до 3%, от 3 до 10% и от 10 до 20%. Въпреки че в статистиката е желателно грешката да не надвишава 5-6%. В противен случай има основание да се говори за недостатъчна представителност на извадката. За да се изчисли отклонението на представителността и как то влияе върху извадка или популация, се вземат предвид много фактори:

  1. Вероятността, с която трябва да се получи точен резултат.
  2. Брой единици в извадката. Както бе споменато по-рано, колкото по-малко единици съдържа извадката, толкова по-голяма ще бъде грешката в представителността и обратно.
  3. Хомогенност на изследваната популация. Колкото по-разнородна е една популация, толкова по-голямо ще бъде отклонението на представителността. Способността на една популация да бъде представителна зависи от хомогенността на всички нейни съставни единици.
  4. Методът за подбор на единици в извадката.

При специфични изследвания процентът на грешка в средната стойност обикновено се определя от самия изследовател въз основа на програмата за наблюдение и според данни от проведени преди това изследвания. По правило се счита за приемлива максимална грешка на извадката (грешка на представителност) от 3-5%.


Повече не винаги е по-добре

Също така си струва да запомните, че основното при организирането на извадково наблюдение е да се сведе обемът му до приемлив минимум. В същото време не трябва да се стремите към прекомерно намаляване на границите на извадкова грешка, тъй като това може да доведе до неоправдано увеличаване на обема на извадковите данни и следователно до увеличаване на разходите за провеждане на извадкови наблюдения.

В същото време размерът на грешката в представителността не може да бъде прекомерно увеличен. Наистина, в този случай, въпреки че ще има намаляване на размера на извадката, това ще доведе до влошаване на надеждността на получените резултати.

Какви въпроси обикновено се задават на изследователя?

Ако се правят някакви изследвания, те са с някаква цел и за получаване на някакви резултати. Когато провеждате извадково проучване, първоначалните въпроси, които обикновено се задават, са:

  1. Определяне на необходимия брой единици в извадката, т.е. колко единици ще бъдат изследвани. Освен това, за точно изследване, популацията трябва да е представителна.
  2. Изчисляване на грешката на представителност с определено ниво на вероятност. Веднага си струва да се отбележи, че извадковите проучвания нямат 100% ниво на вероятност. Ако органът, който е извършил изследването на определен сегмент, твърди, че техните резултати са точни със 100% вероятност, тогава това е лъжа. Дългогодишната практика вече е установила процента на вероятност за правилно проведено извадково изследване. Тази цифра е 95,4%.

Методи за подбор на изследователски единици в извадката

Не всяка извадка е представителна. Понякога една и съща характеристика се изразява по различен начин в цялото и в част от него. За постигане на изискванията за представителност е препоръчително да се използват различни техники за вземане на проби. Освен това използването на един или друг метод зависи от конкретни обстоятелства. Сред тези техники за вземане на проби са:

  • случаен избор;
  • механична селекция;
  • типична селекция;
  • сериен (клъстерен) избор.

Случайният подбор е система от мерки, насочени към случаен подбор на единици в популацията, когато вероятността да бъдат включени в извадката е еднаква за всички единици в популацията. Тази техника е препоръчително да се използва само в случай на хомогенност и малък брой присъщи характеристики. Иначе някои черти на характерарискът да не бъде отразен в извадката. Характеристиките на случайния подбор са в основата на всички други методи за вземане на проби.

При механичен избор на единици се извършва на определен интервал. При необходимост от формиране на извадка от конкретни престъпления можете да премахнете всяка 5-та, 10-та или 15-та карта от всички статистически карти на регистрираните престъпления в зависимост от общия им брой и наличните размери на извадката. Недостатъкът на този метод е, че преди селекцията е необходимо да има пълен запис на единиците на съвкупността, след което трябва да се извърши класиране и едва след това може да се извърши извадка през определен интервал. Този метод отнема много време, поради което не се използва често.


Типичният (зониран) подбор е вид извадка, при която генералната съвкупност се разделя на хомогенни групи по определен признак. Понякога изследователите използват други термини вместо „групи“: „райони“ и „зони“. След това, от всяка група, определен брой единици се избират на случаен принцип, пропорционално на дела на групата в общата популация. Типичният подбор често се извършва на няколко етапа.

Серийната извадка е метод, при който подборът на единици се извършва в групи (серии) и всички единици от избраната група (серия) подлежат на изследване. Предимството на този метод е, че понякога е по-трудно да се изберат отделни единици, отколкото серии, например, когато се изучава лице, което излежава присъда. В рамките на избрани райони и зони се използва изследване на всички звена без изключение, например изследване на всички лица, изтърпяващи присъди в определена институция.

Улица Киевян, 16 0016 Армения, Ереван +374 11 233 255