7 Grundläggande begrepp som gäller provtagning

De sju grundläggande begrepp som gäller provtagning är följande: 1. Universum / Befolkning 2. Provtagningsram 3. Provtagning Design 4. Statistik (er) och Parameter (ar) 5. Provtagningsfel 6. Precision 7. Förtroende Nivå och Signifikansnivå.

1. Universum / Befolkning:

Ur en statistisk synpunkt avser termen "universum" summan av föremålen eller enheterna i något undersökningsområde, medan termen "befolkning" avser den totala informationen om vilken information som önskas. De attribut som är föremål för studier kallas egenskaper och de enheter som besitter dem kallas som elementära enheter.

Aggregatet av sådana enheter beskrivs generellt som population. Således utgör alla enheter i ett eventuellt undersökningsområde universum och alla elementära enheter (på grundval av en karaktär eller mer) utgör befolkning. Oftast finner vi ingen skillnad mellan befolkning och universum, och som sådana är de två termerna utbytbara. En forskare måste dock noggrant definiera dessa termer.

Befolkningen eller universum kan vara ändamålsenlig eller oändlig. Befolkningen sägs vara ändlig om den består av ett fast antal element så att det är möjligt att räkna upp det i sin helhet. Till exempel, befolkningen i en stad, antalet hushåll i en by, antalet arbetare i en fabrik och antalet studenter i ett universitet är exemplen på en begränsad befolkning. Symbolen 'N' används i allmänhet för att ange hur många element (eller föremål) det finns i en begränsad population.

En oändlig befolkning är den population där det är teoretiskt omöjligt att observera alla element. Således, i en oändlig befolkning, är antalet saker oändliga, dvs vi kan inte ha någon aning om det totala antalet objekt.

Till exempel, antalet stjärnor i himlen, sandpartiklar vid en strand och stenar i en flodbädd. Från en praktisk övervägning används termen "oändlig population" för en befolkning som inte kan räknas upp inom rimlig tid. På detta sätt använder vi teoretiskt begreppet oändlig befolkning som en approximation av en mycket stor begränsad befolkning.

2. Provtagningsram:

De elementära enheterna eller gruppen av grupper av sådana enheter kan utgöra grunden för provtagningsprocessen, i vilket fall de kallas som provtagningsenheter. En lista som innehåller alla sådana provtagningsenheter är känd som samplingsram. Provtagningsramen består av en lista över föremål från vilka provet ska dras. Till exempel kan man använda telefonkatalogen som en ram för att genomföra opinionsundersökning i en stad. Oavsett vilken ram det är, borde det vara en bra representant för befolkningen.

3. Provtagning:

En provkonstruktion är en bestämd plan för att erhålla ett prov från provtagningsramen. Det hänvisar till tekniken eller förfarandet som forskaren skulle anta vid val av vissa provtagningsenheter från vilka slutsatser från befolkningen dras. Provtagningsdesign bestäms innan någon data samlas in.

4. Statistik (er) och parametrar:

En statistik är en egenskap för ett prov, medan en parameter är en egenskap hos en population. Således, när vi utarbetar vissa åtgärder som medelvärde, median, läge etc. från prov, kallas de statistik för att de beskriver egenskaperna hos ett prov. Men när sådana åtgärder beskriver egenskaper hos en befolkning, är de kända som parametrar. Exempelvis är populationen (μ) en parameter, medan provmedlet (X) är en statistik. För att uppskatta en parameter från en statistik utgör det främsta målet för provtagningsanalys.

5. Provtagningsfel:

Provtagningsundersökningen innebär att man studerar en liten del av befolkningen och som sådan skulle det naturligtvis vara en viss grad av oriktighet i den insamlade informationen. Denna felaktighet kan betecknas som provtagningsfel eller felavvikelse. Med andra ord är provtagningsfel de fel som uppstår på grund av provtagningen och de brukar vara slumpmässiga variationer (vid stickprovtagning) i prognosuppskattningarna runt de sanna befolkningsvärdena. Det kan beskrivas numeriskt som under:

Provtagningsfel = Ramfel + chansfel + svarfel.

6. Precision:

Precision är ett intervall inom vilket befolkningsgenomsnittet (eller andra parametrar) ligger i enlighet med tillförlitlighet som anges i konfidensnivå som en procentandel av uppskattningen ± eller som en numerisk kvantitet. Till exempel, om uppskattningen är Rs. 4000 och den önskade precisionen är ± 4 procent, då kommer det verkliga värdet inte att vara mindre än Rs. 3840 och inte mer än Rs. 4160. Detta är intervallet (rs 3840 till rs 4160) inom vilket det sanna svaret ska ligga. Men om vi önskar att uppskattningen inte ska avvika från det faktiska värdet med mer än Rs. 200 i båda riktningarna, i så fall skulle intervallet vara Rs. 3800 till Rs. 4200.

7. Förtroende Nivå och Betydelse Nivå:

Förtroendenivån eller tillförlitligheten förväntas procentvis av gånger som det verkliga värdet faller inom den angivna precisionsgränsen. Således, om vi tar en konfidensnivå på 95 procent, menar vi att det finns 95 chanser i 100 (eller .95 i 1) att provresultatet representerar det sanna tillståndet hos befolkningen inom ett specificerat precisionsintervall mot fem chanser i 100 (eller .05 i 1) som det inte gör.

Precision är det intervall inom vilket svaret kan variera och fortfarande vara acceptabelt; konfidensnivå indikerar sannolikheten för att svaret kommer att falla inom detta område och signifikansnivån indikerar sannolikheten för att svaret kommer att falla utanför detta intervall. Man kan komma ihåg att om nivån på förtroende i 95 procent kommer signifikansnivån att vara (100-95), dvs 5 procent, om konfidensnivån är 99 procent, är signifikansnivån (100-99 ), dvs 1 procent, och så vidare.