8 Viktiga typer av sannolikhetsprovtagning

Denna artikel lyfter fram de åtta viktiga typerna av sannolikhetsprovtagning som används för att bedriva social forskning. Typerna är: 1. Enkel slumpmässig provtagning 2. Systematisk provtagning 3. Stratifierad slumpmässig provtagning 4. Proportional Stratified Sampling 5. Disproportionell Stratified Sampling 6. Optimal Allocation Prov 7. Klusterprovtagning 8. Flerfasprovtagning.

Typ # 1. Enkel slumpmässig provtagning:

Enkel slumpmässig provtagning är på ett sätt grundtemat för alla vetenskapliga provtagningar. Det är den primära sannolikhetsprovtagningsdesignen. Faktum är att alla andra metoder för vetenskaplig provtagning är variationer i den enkla slumpmässiga provtagningen. En förståelse för någon av de raffinerade eller komplexa olika provtagningsförfarandena förutsätter en förståelse för enkel slumpmässig provtagning.

Ett enkelt slumpmässigt prov väljs genom en process som inte bara ger varje element i befolkningen lika stor chans att ingå i provet, men gör också valet av alla möjliga kombinationer av fall i önskad provstorlek lika stor. Antag exempelvis att den har en befolkning på sex barn, nämligen A, B, C, D, E och F.

Det kommer att finnas följande möjliga kombinationer av fall, vilka var och en har två element från denna population, nämligen AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF och EF, dvs i alla 15 kombinationer.

Om vi ​​skriver varje kombination på lika stora kort, lägger korten i en korg, blandar dem ordentligt och låter en blindfoldad person välja en, kommer varje kort att ges samma chans att bli vald / inkluderad i provet.

De två fallen (paret) som skrivs på kortet upptagna av den blinda vikta personen kommer således att utgöra det önskade enkla slumpmässiga provet. Om man önskar välja enkla slumpmässiga prover av tre fall från ovanstående befolkning i sex fall, kommer de möjliga proven, var och en av tre fall, att vara ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF och DEF, dvs 20 kombinationer alls.

Var och en av dessa kombinationer får lika stor chans att välja i provet. Med samma metod kan man välja ett enkelt slumpmässigt urval av fyra fall från denna population.

I princip kan man använda denna metod för att välja slumpmässiga prover av vilken storlek som helst från en population. Men i praktiken skulle det bli en mycket besvärlig och i vissa fall en omöjlig uppgift att lista alla möjliga kombinationer av önskat antal fall. Samma resultat kan erhållas genom att välja enskilda element, en efter en, med ovanstående metod (lotteri) eller genom att använda en bok med slumpmässiga nummer.

Boken med tabeller som innehåller en lista över slumpmässiga tal är uppkallad efter Tippet som först förstod begreppet slumpmässighet i en bok med slumpmässiga nummer.

Denna bok är upprättad med ett mycket komplicerat förfarande på ett sådant sätt att siffrorna inte visar några bevis på systematisk ordning, det vill säga ingen kan uppskatta antalet som följer med utgångspunkt från föregående nummer och vice versa. Låt oss diskutera de två metoderna för att rita ett enkelt slumpmässigt prov.

Lotteri Metod:

Denna metod innebär följande steg:

(a) Varje medlem eller objekt i "befolkningen" tilldelas ett unikt nummer. Det vill säga, inga två medlemmar har samma nummer,

(b) Varje nummer noteras på ett separat kort eller ett chip. Varje chip eller kort ska likna alla andra med avseende på vikt, storlek och form etc.,

c) Korten eller markerna placeras i en skål och blandas noggrant,

(d) En blindfoldig person uppmanas att hämta ett chip eller kort från skålen.

Under dessa omständigheter kan sannolikheten att teckna ett kort förväntas vara detsamma som sannolikheten att dra ett annat kort. Eftersom varje kort representerar en medlem av befolkningen, skulle sannolikheten att välja var och en vara exakt densamma.

Om efter att ha valt ett kort (chip) det ersattes i skålen och innehållet igen grundligt blandat, skulle varje chip ha lika stor sannolikhet att väljas på den andra, fjärde eller nionde ritningen. Ett sådant förfarande skulle i slutändan ge ett enkelt slumpmässigt prov.

Val av prov med hjälp av slumpmässiga nummer :

Vi har redan sagt vad slumpmässiga siffror är. Dessa siffror hjälper till att undvika eventuella förskjutningar (ojämna chanser) för objekt som omfattar en population, att vara med i provet vid val av provet.

Dessa slumptal är så förberedda att de uppfyller det matematiska kriteriet för fullständig slumpmässighet. Varje standardbok om statistik innehåller några sidor av slumpmässiga nummer. Dessa siffror är vanligtvis listade i kolumner på på varandra följande sidor.

Följande är en del av en uppsättning slumptal:

Användningen av tabellerna med slumptalsnummer innefattar följande steg:

(a) Varje medlem av befolkningen tilldelas ett unikt nummer. Till exempel kan en medlem ha nummer 77 och en annan 83, etc.

b) Tabellen med slumpmässiga siffror är inmatad vid en viss slumpmässig punkt (med ett blint mark på någon sida i tabellen) och de fall vars nummer kommer upp när man flyttar från denna punkt nerför kolumnen ingår i provet tills Det önskade antalet fall uppnås.

Antag att vår befolkning består av femhundra element och vi vill rita femtio fall som ett prov. Antag att vi använder de tre sista siffrorna i varje antal fem siffror (eftersom universumstorlek är 500, dvs tre-digital).

Vi går ner i kolumnen som börjar med 42827; men eftersom vi har bestämt oss för att använda endast tre siffror (säg de sista tre) börjar vi med 827 (ignorerar de två första siffrorna). Vi noterar nu varje nummer mindre än 501 (eftersom befolkningen är 500).

Provet skulle fattas bestå av de delar av befolkningen som bär de siffror som motsvarar de valda. Vi slutar efter att vi har valt 50 element (storleken bestämt av oss). På grundval av ovanstående avsnitt i tabellen ska vi välja 12 nummer som motsvarar de valda. Vi ska välja 12 fall som motsvarar numren 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Egenskaper för enkel slumpmässig prov:

Vi ska börja med att överväga en mycket viktig egenskap hos de enkla slumpmässiga proven; den här varelsen, desto större är provets storlek desto mer sannolikt är det att dess genomsnittliga (medelvärde) ligger nära "populationen", dvs det sanna värdet. Låt oss illustrera denna egendom genom att anta en befolkning bestående av sex medlemmar (barn).

Låt dessa barns åldrar vara: A = 2 år, B = 3 år, C = 4 år, D = 6 år, E = 9 år och F = 12 år. Låt oss göra slumpmässiga prover av en, två, tre fyra och fem medlemmar var och en från denna befolkning och se hur i varje fall uppför sig provmedlet (medelvärden) med hänvisning till det sanna "population" -medlet (dvs 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). Tabellen nedan illustrerar beteendeorganets beteende som förknippade med provets storlek.

Tabell som visar de möjliga proven på ett, två, tre, fyra och fem element (barn, från sex personer i åldrarna 2, 3, 4, 6, 9 och 12 år):

I det givna tabellen visas alla möjliga slumpmässiga prover av olika storlekar (dvs 1, 2, 3, 4 och 5) och deras motsvarande medel. Den sanna (populationen) medelvärdet är 6 år. Det här medlet kan naturligtvis beräknas genom att lägga upp medelvärdena för de totala kombinationerna av elementen i befolkningen för en given provstorlek.

I tabellen ser vi till exempel att för provstorleken på tre element finns 20 möjliga kombinationer av element, varvid varje kombination har lika stor chans att väljas som ett prov enligt sannolikhetsprincipen.

Genom att lägga upp medelvärdena för dessa möjliga kombinationer som visas i tabellen får vi totalt poäng på 120. Medelvärdet kommer att vara 120 ÷ 20 = 6, vilket givetvis också är populationsmedlet. Det här håller bra för andra kolumner också.

Låt oss nu granska tabellen noggrant. Vi kommer att finna att för prov av ett element varje (kolumn A) finns det endast ett medelvärde som inte avviker med mer än 1 enhet från den sanna populationen av 6 år. Det vill säga alla andra, dvs. 2, 3, 4, 9 och 12, avviker med mer än en enhet från populationens medelvärde, dvs 6. När vi ökar provets storlek, t.ex. i kolumn B, där provstorleken är 2, vi hittar en större andel medel (medelvärden) som inte avviker från populationens medelvärde med mer än 1 enhet.

Ovanstående tabell visar att för provet av två finns det 15 möjliga kombinationer och därmed 15 möjliga medel. Av dessa 15 medel finns det 5 medel som inte avviker från populationen med mer än 1 enhet.

Det vill säga att det finns 33% av provmedlen som ligger nära populationsmedlet inom +1 och -1 enheter. I tabellens kolumn C ser vi att det finns 20 möjliga kombinationer av element för provstorleken av tre element, var och en.

Från de 20 möjliga provmedlen finner vi att 10, dvs 50% avviker inte från populationens medelvärde med mer än 1 enhet. För provstorleken på fyra element finns det 67% av medel som ligger inom intervallet +1 och -1 enhet från den sanna (populationen) medelvärdet.

Slutligen, för provstorleken på fem element, finns det mycket mer, dvs 83% av sådana medel eller uppskattningar. Läran som visar på våra observationer är ganska tydlig, det vill säga, ju större provet är desto mer sannolikt är det att dess medelvärde kommer att ligga nära populationsmedlet.

Detta är detsamma som att dispersionen av uppskattningar (medel) minskar när provstorleken ökar. Vi kan tydligt se detta i tabellen ovan. För provstorleken på en (kolumn A) är medelantalet det största, dvs mellan 2 och 12 = 10. För provstorleken på två är intervallet mellan 2, 5 och 10, 5 = 8.

För provstorleken på tre, fyra och fem är intervallet av variabilitet av medel respektive 3 till 9 = 6, 3, 8 till 7, 8 = 4 och 4, 8 till 6, 8 = 2. Det kommer också att ses från bordet att ju mer ett prov medel skiljer sig från populationen, men desto mindre sannolikt kommer det att uppstå.

Vi kan representera detta fenomen som hänför sig till enkel slumpmässig provtagning tydligt med hjälp av en serie kurvor som visar förhållandet mellan beräkningsvariationer och provets storlek. Låt oss överväga en stor invånares befolkning. Man kan tänka sig att deras åldrar kommer att sträcka sig mellan under 1 år (åtminstone) och över 80 år (högst).

Den normala och rimliga förväntan skulle vara att det finns mindre fall då man närmar sig ytterligheterna och att antalet fall fortsätter att öka progressivt och symmetriskt när vi flyttar bort från dessa ytterligheter.

Medelåldern för befolkningen är, låt oss säga, 40 år. En sådan fördelning av invånare kan representeras av en kurva som kallas den normala eller klockformade kurvan (A i följande diagram). Låt oss nu anta att vi från denna population tar olika slumpmässiga prover av olika storlekar, t ex 10 100 och 10 000. För någon av provstorleken får vi ett mycket stort antal prover från befolkningen.

Var och en av dessa prover ger oss en viss uppskattning av populationens medelvärde. Några av dessa medel kommer att vara övervärderingar och vissa underskattningar av befolkningskarakteristiken (medel- eller medelåldern). Några medel kommer att vara väldigt nära det, en hel del ganska långt.

Om vi ​​plottar sådana provmedel för en viss provstorlek och förenar dessa punkter kommer vi i varje fall att få en normal kurva. Olika normala kurvor representerar sålunda värdena för provmedel för prover av olika storlekar.

Ovanstående diagram approximerar en bild av hur provmedlet skulle verka i förhållande till provets storlek. Kurvan A representerar åldrarna för enskilda individer. Det uppskattade sättet för prover på 10 personer, var och en från kurvan B som visar en ganska stor dispersion från sann befolkning, dvs. 40 år).

Medlen av prover på 100 personer vardera bildar en normal kurva C som visar mycket mindre avvikelse från populationens medelvärde. Slutligen, medlen från proverna på 10 000 från en kurva som nästan närmar sig den vertikala linjen som motsvarar populationens medelvärde. Avvikelsen av de värden som representerar kurvan D från populationens medelvärde skulle vara försumbar, vilket framgår av diagrammet.

Det kan också mycket enkelt tolkas från ovanstående figur att för prov av vilken storlek som helst är det mest sannolika provmedlet populationsmedelvärdet. Nästa troligast är medelvärdena nära populationens medelvärde.

Således kan vi dra slutsatsen att ju mer ett provmedel avviker från populationen, desto mindre sannolikt är det att det uppstår. Slutligen ser vi också vad vi redan har sagt om provernas beteende, desto större är provet desto mer sannolikt är det att dess medelvärde kommer att ligga nära populationen.

Det är denna typ av beteende hos de enkla slumpmässiga (sannolikhets) proverna med avseende på medelvärdet, proportionerna och andra typer av statistik som gör det möjligt för oss att uppskatta inte bara befolkningskarakteristiken (t.ex. medelvärdet) men också sannolikheten att provet skiljer sig från det sanna befolkningsvärdet med en viss mängd.

En typisk egenskap hos den enkla slumpmässiga provtagningen är att när populationen är stor jämfört med provstorleken (t ex mer än tio gånger så stor), påverkas variablerna av samplingsfördelningar mer av det absoluta antalet fall i prov än av den andel av befolkningen som provet innehåller.

Med andra ord beror storleken på de fel som sannolikt kommer att uppstå som en följd av provtagningen, mer beroende av provets absoluta storlek i stället för den andel som den bär med befolkningen, det vill säga hur stor eller hur liten en del är av befolkning.

Ju större storleken på det slumpmässiga provet är, desto större är sannolikheten att det ger en rimligt bra uppskattning av befolkningskarakteristiken oberoende av dess andel jämfört med befolkningen.

Uppskattningen av en populär omröstning vid en nationell undersökning inom gränserna för en acceptabel felmarginal skulle således inte kräva ett väsentligt större urval än det som skulle krävas för en uppskattning av befolkningsröstning i en viss provins där utfallet av utfallet är i tvivel.

För att utarbeta punkten kommer ett urval av 500 (100% prov) att ge perfekt noggrannhet om en gemenskap hade endast 500 invånare. Ett urval av 500 kommer att ge en något större noggrannhet för en township på 1000 invånare än för en stad på 10.000 invånare. Men bortom den punkt där provet är en stor del av "universet" finns det ingen märkbar skillnad i noggrannhet med ökningarna av storleken på "universum".

För en viss nivån av noggrannhet skulle samma provstorlekar ge samma nivå av noggrannhet för olika befolkningsgrupper, t ex från 10 000 till 10 miljoner. Förhållandet mellan provstorlek och befolkningen i dessa samhällen betyder ingenting, även om det här är viktigt om vi fortsätter med intuition.

Typ # 2. Systematisk provtagning:

Denna typ av provtagning är för alla praktiska ändamål, en approximation av enkel slumpmässig provtagning. Det förutsätter att befolkningen kan identifieras unikt genom sin order. Till exempel kan boende i ett samhälle listas och deras namn omordnas alfabetiskt. Var och en av dessa namn får ges ett unikt nummer. Ett sådant index är känt som "ramen" för den aktuella befolkningen.

Antag att denna ram består av 1000 medlemmar vardera med ett unikt tal, dvs från 1 till 1000. Låt oss säga, vi vill välja ett urval av 100. Vi kan börja med att välja ett tal mellan 1 till 10 (båda ingår). Antag att vi gör ett slumpmässigt urval genom att ange listan och få 7.

Vi fortsätter sedan till valda medlemmar; från och med 7, med ett regelbundet intervall på 10. Den valda för att välja medlemmar: från och med ett regelbundet intervall på 10. Det valda provet skulle således bestå av element som bär nr 7, 17, 27, 37, 47, ... 977, 987, 997. Dessa element tillsammans skulle utgöra ett systematiskt prov.

Man bör komma ihåg att ett systematiskt prov kan anses vara ett sannolikhetsexempel endast om det första fallet (t ex 7) har valts slumpmässigt och därefter valdes tio fall från ramen därefter.

Om det första fallet inte väljas slumpmässigt kommer det resulterande provet inte att vara ett sannolikhetsprov, eftersom de flesta fall som inte ligger på ett avstånd av tio från det initialt valda antalet kommer att ha en nollpunkt (0 ) sannolikhet att ingå i provet.

Det bör noteras att i det systematiska provtagningen när det första fallet slås slumpmässigt finns det i förväg ingen begränsning av chanserna för ett givet fall att ingå i provet. Men när det första fallet väljs väljs chanserna för efterföljande fall avgörande eller ändras. I ovanstående exempel har fallen andra än 17, 27, 37, 47 ... etc. ingen chans att ingå i provet.

Det innebär att systematisk provtagningsplan inte har råd med alla möjliga kombinationer av fall, samma chans att ingå i urvalet.

Resultatet kan således vara ganska bedrägligt om fallen i listan är ordnade i någon cyklisk ordning eller om befolkningen inte blandas grundligt med avseende på de egenskaper som studeras (dvs. inkomst eller studier), dvs på ett sätt att var och en av de tio medlemmarna hade lika chans att bli utvalda

Typ # 3. Stratifierad slumpmässig sampling:

I den stratifierade slumpmässiga provtagningen delas befolkningen först in i ett antal lag. Sådana strator kan baseras på ett enda kriterium, t.ex. utbildningsnivå, vilket ger ett antal strator som motsvarar de olika utbildningsnivåerna) eller vid kombination av två eller flera kriterier (t.ex. ålder och kön), vilket ger strator som män under 30 år och män över 30 år, honor under 30 år och kvinnor över 30 år.

I stratifierad slumpmässig provtagning tas ett enkelt slumpmässigt prov från varje lag och sådana delprover sammanföres för att bilda det totala provet.

Generellt bidrar stratifiering av universum med syftet med provtagning till provtagningens effektivitet om det fastställer klasser, det vill säga om den kan dela befolkningen i klasser av medlemmar eller element som är internt relativt homogena och relativt heterogena, med hänsyn till de egenskaper som studeras. Låt oss anta att ålder och kön är två potentiella baser av stratifiering.

Skulle vi nu konstatera att stratifiering på grund av kön (man / kvinna) ger två skikt som skiljer sig markant från varandra med avseende på poäng på andra relevanta egenskaper under studiet medan å andra sidan ålder som grund för stratifiering inte avkastningsskikt som är väsentligen olika från varandra med avseende på poängen på de andra signifikanta egenskaperna, så är det lämpligt att stratifiera befolkningen på grundval av kön snarare än ålder.

Kriteriet om kön är med andra ord effektivare grund för stratifiering i det här fallet. Det är ganska möjligt att processen att bryta befolkningen ner i lager som är internt homogena och relativt heterogena med avseende på vissa relevanta egenskaper är orimligt dyrt.

I en sådan situation kan forskaren välja att välja ett stort enkelt slumpmässigt prov och kompensera för den höga kostnaden genom att öka (genom ett stort stort enkelt slumpmässigt prov) provets totala storlek och undvika risker som medverkar vid stratifiering.

Det bör tydligt förstås att stratifiering knappast har något att göra med att göra provet till en replika av befolkningen.

Faktum är att de problem som är inblandade i beslutet om huruvida stratifieringen ska genomföras är i första hand relaterad till den förväntade homogeniteten hos de definierade lagren med avseende på de egenskaper som studeras och de jämförande kostnaderna för olika metoder för att uppnå precision. Stratifierad slumpmässig provtagning som den enkla slumpmässiga provtagningen innebär representativa provtagningsplaner.

Vi vänder nu till att diskutera de stora formerna eller stratifierad provtagning. Antalet fall som valts inom varje stratum kan vara proportionellt mot stratens styrka eller oproportionerligt därtill.

Antalet fall kan vara desamma från stratum till stratum eller variera från ett strat till ett annat beroende på provtagningsplanen. Vi ska nu mycket kortfattat överväga dessa två former, dvs proportionerliga och de oproportionerliga stratifierade proverna.

Typ # 4. Proportional Stratified Sampling :

I proportionerlig provtagning dras fall från varje stratum i samma proportion som de förekommer i universum. Antag att vi vet att 60% av "befolkningen" är manlig och 40% av den är kvinnlig. Proportionell stratifierad provtagning med hänvisning till denna "befolkning" skulle innebära att ett prov tas på ett sådant sätt att samma uppdelning mellan könen återspeglas, dvs 60:40 i provet.

Om det systematiska provtagningsförfarandet används i en studie, bestämmer grunden för vilken listan görs huruvida det resulterande provet är ett proportionellt stratifierat prov eller ej. Om till exempel varje sjunde namn är valt i en vanlig ordning från en lista med alfabetiskt ordnade namn, ska det resulterande provet innehålla ungefär 1/7 av namnen som börjar med varje bokstav i alfabetet.

Det resulterande provet i detta fall skulle vara ett proportionellt stratifierat alfabetiskt prov. Om det alfabetiska arrangemanget är helt orelaterat och irrelevant för det problem som studeras kan naturligtvis provet betraktas som ett slumpmässigt prov med vissa begränsningar som är typiska för de systematiska proven som diskuterats ovan.

Olika skäl kan åberopas för provtagning av de olika lagren i ojämlika eller olikartade proportioner. Ibland är det nödvändigt att öka andelen som samplas från lag som har ett litet antal fall för att få en garanti för att dessa strata kommer att bli samplade alls.

Om man till exempel planerade en studie av detaljhandelsförsäljningen av kläder i en viss stad vid en given tidpunkt, kan ett enkelt slumpmässigt urval av detaljhandelsbutiker inte ge oss en exakt uppskattning av den totala försäljningsvolymen, eftersom en liten Antalet företag med en mycket stor andel av den totala försäljningen kan råka uteslutas ur urvalet.

I det här fallet skulle man vara klok att stratifiera befolkningen i tygaffärer med tanke på några få tygaffärer som har en mycket stor volym försäljning kommer att utgöra det översta stratumet. Forskaren skulle göra det bra att inkludera dem alla i hans prov.

Det betyder att han kan göra det bra för att ta ett 100% prov från detta stratum och en mycket mindre procentandel av fallen från de andra strata som representerar ett stort antal affärer (med låg eller måttlig volym omställning). En sådan oproportionerlig provtagning ensam kommer sannolikt att ge pålitliga uppskattningar avseende befolkningen.

En annan anledning till att en större andel fall tas från ett stratum snarare än från andra är att forskaren kanske vill dela upp fall inom varje stratum för vidare analys.

Substraten som härleddes här kan inte alla innehålla tillräckligt många fall att prova från och i samma proportion som de andra delströmmarna, vilket följaktligen inte skulle ge tillräckligt med fall för att fungera som en tillräcklig grund för ytterligare analys. I så fall kan man behöva prova en större andel fall från underlaget.

Generellt sett kan det sägas att största möjliga precision och representation kan erhållas om prover från de olika lagren på ett adekvat sätt återspeglar deras relativa variationer med avseende på egenskaper som studeras snarare än att presentera deras relativa storlekar i "befolkningen".

Det är lämpligt att prova tyngre i strator där forskaren har en anledning att tro att variationen kring en given egenskap, t.ex. attityder eller deltagande, skulle vara större.

I en studie som gjorts för att förutse resultatet av de nationella valen, som använder metoden för stratifierad provtagning, med stater som grund för stratifiering, bör ett tyngre prov tas från de områden eller regioner där resultatet är kraftigt grumligt och tvivelaktigt .

Typ # 5. Disproportionell Stratified Sampling :

Vi har redan föreslagit egenskaperna hos den oproportionerliga provtagningen och också en del av den stora fördelen med detta provtagningsförfarande. Det är uppenbart att ett stratifierat prov där antalet element som dras från olika lager är oberoende av storleken på dessa lager kan kallas ett oproportionerligt stratifierat prov.

Samma effekt kan väl uppnås alternativt genom att man från varje stratum tar lika många fall oavsett hur starkt eller svagt stratumet är representerat i befolkningen.

Som en följd av det sätt som den väljs ut, är en fördel med oproportionerlig stratifierad provtagning att det faktum att samtliga strata är lika pålitliga ur ståndpunktens storlek. En ännu viktigare fördel är ekonomin.

Denna typ av prov är ekonomiskt genom att utredarna sparar problemen med att säkerställa en onödigt stor mängd information från de mest framträdande grupperna i befolkningen.

Ett sådant prov kan emellertid också förråda de kombinerade nackdelarna med ojämnt antal fall, dvs litenhet och icke-representativitet. Dessutom kräver ett oproportionerligt prov djup kunskap om relevanta egenskaper hos de olika lagren.

Typ # 6. Optimal fördelningsprov :

I detta provtagningsförfarande är storleken på provet som tagits från varje stratum proportionellt mot både storleken och spridningen av värden inom ett givet stratum. En exakt användning av detta provtagningsförfarande innefattar användning av vissa statistiska begrepp som ännu inte har införts tillräckligt eller övertygande.

Vi vet nu något om det stratifierade slumpmässiga urvalet och dess olika manifestationer. Låt oss nu se hur variablerna eller kriterierna för stratifiering ska planeras.

Följande överväganden går ideellt in i valet av kontroller för stratifiering:

(a) Uppgifterna tyst mot lagens institution bör vara aktuella, korrekta, fullständiga, tillämpliga på befolkningen och tillgänglig för forskaren.

Många egenskaper hos befolkningen kan inte användas som kontroller eftersom ingen tillfredsställande statistik om dem finns tillgänglig. I ett högdynamiskt samhälle som kännetecknas av stora omvälvningar i befolkningen, riskerar forskaren att utnyttja strategin för stratifiering risken att gå ganska fel i sina uppskattningar om storleken på de skikt han påverkar i sitt prov.

b) Forskaren bör ha skäl att tro att de faktorer eller kriterier som används för stratifiering är signifikanta mot bakgrund av det problem som studeras.

c) Om inte det aktuella stratumet är stort nog och följaktligen har provtagaren och fältarbetarna inga stora svårigheter att hitta kandidater för det, det ska inte användas.

(d) Vid val av fall för stratifiering bör forskaren försöka välja de som är homogena med avseende på de egenskaper som är viktiga för det undersökta problemet. Som tidigare sagt är stratifieringen effektiv i den utsträckning att elementen i stratum är som varandra och samtidigt olika i förhållande till elementen i andra lager.

Låt oss nu överväga meriterna och begränsningarna av stratifierad slumpmässig provtagning på ett allmänt sätt:

(1) Vid tillämpning av det stratifierade stickprovsprovet kan forskaren vara säker på att inga väsentliga grupper eller kategorier kommer att uteslutas ur urvalet. Större representativitet hos provet är således säkerställt och tillfälliga olyckor som uppträder vid enkel slumpmässig provtagning undviks sålunda.

(2) När det gäller mer homogena populationer kan högre precision uppnås med färre fall.

(3) Jämfört med de enkla slumpmässiga, är stratifierade prover mer koncentrerade geografiskt och minskar därmed kostnaderna när det gäller tid, pengar och energi i intervjuande respondenter.

(4) De prover som en intervjuare väljer kan vara mer representativ om hans kvot fördelas av det opersonliga stratifieringsförfarandet än om han ska använda sin egen bedömning (som vid kvotprovtagning).

Huvudbegränsningen för stratifierad slumpmässig provtagning är att för att säkerställa de maximala fördelarna av det under en studie, behöver forskaren veta mycket om forskningsproblemet och dess relation till andra faktorer. Sådan kunskap är inte alltid kommande och ganska så ofta väntar är lång.

Man bör komma ihåg att synen på teorin om sannolikhetsprovtagning är väsentligen irrelevant om stratifiering införs under provtagningsförfarandet eller vid analys av data, förutom i den mån den tidigare gör det möjligt att styra storleken på prov erhållet från varje stratum och således öka effektiviteten hos provtagningsdesignen.

Med andra ord är förfarandet för att rita ett enkelt slumpmässigt prov och sedan dela det i strata ekvivalent i praktiken för att rita ett stratifierat slumpmässigt prov som används som provtagningsramen inom varje stratum, populationen av det stratum som ingår i den givna enkla slumpmässigt urval.

Typ # 7. Klusterprovtagning :

Vanligtvis innebär enkel slumpmässig provtagning och stratifierad stickprovtagning enorma utgifter vid hantering av stora och rumsliga eller geografiskt spridda populationer.

I de ovanstående typerna av provtagning kan de element som valts i provet vara så spridda att de kan intervjua dem kan medföra stora kostnader, en större andel icke-produktiv tid (spenderas under resan), en större sannolikhet för bristande enhetlighet bland intervjuare " frågeställningar, inspelningar och till sist en stor utgift för att övervaka fältpersonalen.

Det finns också andra praktiska faktorer för provtagningen. Till exempel kan det anses vara mindre invändigt och följaktligen tillåtet att administrera ett frågeformulär till tre eller fyra avdelningar på en fabrik eller ett kontor i stället för att administrera det på ett urval av alla avdelningar på en enkel eller stratifierad slumpmässig basis, eftersom det senare förfarandet kan vara mycket mer störande i fabriksrutinerna.

Det är av några av dessa skäl att storskaliga undersökningsstudier sällan använder sig av enkla eller stratifierade slumpmässiga prover. istället använder de sig av metoden för gruppprovtagning.

I gruppprover samplar först provtagaren ur befolkningen, vissa stora grupper, dvs "kluster". Dessa kluster kan vara stadsavdelningar, hushåll eller flera geografiska eller sociala enheter. Provtagningen av kluster från befolkningen sker genom enkla eller stratifierade slumpmässiga provtagningsmetoder. Från dessa valda kluster samplas de beståndsdelar som ingår i förfaranden som säkerställer slumpmässighet.

Antag exempelvis att en forskare vill göra en provstudie om problemen med grundutbildade studenter på högskolor i Maharashtra.

Han kan fortsätta på följande sätt:

(a) Först förbereder han en lista över alla universitet i staten och väljer ett urval av universitet på en "slumpmässig" basis.

(b) För varje statens universitet ingår m provet, han gör en lista över högskolor inom sin jurisdiktion och tar ett urval av högskolor på "slumpmässig" basis.

(c) För varje av de högskolor som råkar komma med i provet gör han en lista över alla studenter som är inskrivna på det. Från dessa studenter väljer han ett urval av önskad storlek på en "slumpmässig" basis (enkel eller stratifierad).

På detta sätt får forskaren en sannolikhet eller slumpmässigt urval av element, mer eller mindre koncentrerad, geografiskt. På så sätt kan han undvika stora utgifter som annars skulle ha uppkommit om han hade tillgripit en enkel eller stratifierad slumpmässig provtagning, och ändå behöver han inte offra principerna och fördelarna med sannolikhetsprovtagning.

Karaktäristiskt går detta provtagningsförfarande genom en serie steg. Därför är det på ett visst sätt ett "flertrins" provtagning och ibland känt av detta namn. Detta provtagningsförfarande går gradvis från de mer inkluderande till de mindre inkluderande provtagningsenheterna, så kommer forskaren äntligen till de befolkningselement som utgör sitt önskade urval.

Det bör noteras att det med klusterprovtagning är inte längre sant att varje kombination av det önskade antalet element i befolkningen är lika sannolikt att väljas som befolkningsprovet. Följaktligen kan den typ av effekter som vi såg i vår analys av enkla slumpmässiga prover, dvs. att befolkningsvärdet är det mest sannolika provvärdet, inte ses här.

Men sådana effekter materialiseras på ett mer komplicerat sätt, men naturligtvis är provtagningseffektiviteten till viss del hindrad. Det har visat sig att klusterprovtagningen i en enskild fall är mycket mindre effektiv för att få information än jämförbart effektiv stratifierad slumpmässig provtagning.

Relativt sett är felmarginalen mycket större i gruppprovet. Denna handikapp är dock mer än balanserad av associerade ekonomier, vilket möjliggör provtagning av ett tillräckligt stort antal fall till en mindre total kostnad.

Beroende på de specifika egenskaperna hos provtagningsplanen när det gäller undersökningsobjekten kan gruppproveringen vara mer eller mindre effektiv än enkel slumpmässig provtagning. Ekonomierna i samband med gruppprovtagning lutar i allmänhet balansen till förmån för att använda klusterprovtagning i storskaliga undersökningar, men i jämförelse med enkel slumpmässig provtagning behövs fler fall för samma nivå av noggrannhet.

Typ # 8. Flerfasprovtagning:

Det är ibland bekvämt att begränsa vissa frågor om specifika aspekter av studien till en bråkdel av provet medan andra uppgifter samlas in från hela provet. Detta förfarande kallas "flerfasprovtagning".

Basinformationen från hela provet gör det möjligt att jämföra vissa delprovs egenskaper med den för hela provet.

En ytterligare punkt som förtjänar att nämna är att flerfasprovtagning underlättar stratifieringen av delprovet eftersom informationen som samlats in från förstafasprovet ibland kan samlas in innan delprovtagningsprocessen äger rum. Det kommer att komma ihåg att paneldeltagelser inbegriper flerfasprovtagning.