Standardfel av medelvärdet

Efter att ha läst den här artikeln kommer du att lära dig om medelvärdet för medelvärdet.

Statistisk inferens hjälper oss också att testa hypotesen att "statistiken baserad på provet inte skiljer sig avsevärt från populationparametern och att skillnaden om någon noteras bara beror på chansvariationen" .

Standardfelet för medelvärdet (SE M eller σ M )

Standardfel av medelvärdet (SE M ) är ganska viktigt för att testa representativiteten eller trovärdigheten eller betydelsen av medelvärdet.

Antag att vi har beräknat den genomsnittliga poängen på 200 pojkar i 10: e klassen i Delhi i det numeriska förmåga testet att vara 40. Således är 40 medelvärdet av endast ett prov som dras från befolkningen (alla pojkarna läser i klass X i Delhi).

Vi kan också dra olika slumpmässiga prover av 200 pojkar från befolkningen. Antag att vi slumpmässigt väljer 100 olika prov, varje prov bestående av 200 pojkar från samma population och beräknar medelvärdet av varje prov.

Även om 'n' är 200 i varje fall, är 200 pojkar som valts slumpmässigt för att utgöra de olika proverna inte identiska och så på grund av fluktuation i provtagningen skulle vi få 100 medelvärden från dessa 100 olika prover.

Dessa medelvärden tenderar att skilja sig från varandra och de skulle bilda en serie. Dessa värden utgör provtagningsfördelningen av medel. Det kan uttryckas matematiskt att dessa provmedel distribueras normalt.

De 100 medelvärdena (i vårt exempel) kommer att falla i en normal fördelning runt M pop, M- popen är medelvärdet av provtagningsfördelningen av medel. Standardavvikelsen för dessa 100 provmedel kallas SE M eller Standardfel av medelvärdet som kommer att vara lika med standardavvikelsen för befolkningen dividerad med kvadratroten av (provstorlek).

SE M visar spridningen av provmedlen runt M pop . Sålunda är SE M ett mått på variabiliteten hos provmedlen. Det är ett mått på divergens av provmedel från M pop . SE M är också skrivet som σ M.

Standardvärdet för medelvärdet (SE M eller σ M ) beräknas med hjälp av formeln (för stora prov)

(A) Beräkning av SE M i stora prov :

där σ = standardavvikelse för befolkningen och

n = antal fall som ingår i provet

(Som vi sällan kan ha SD för en population, för σ använder vi SD-värdet av provmedlet).

Konfidensintervall:

De två konfidensintervallen, dvs 95% och 99%, är i allmänhet. RA Fisher namnger gränserna för konfidensintervallet som innehåller parametern som "fiduciära gränser" och heter det förtroende som placeras i intervallet som fiduciär sannolikhet.

(a) 95% av konfidensintervallet:

Med hänvisning till tabellen över området under normal kurva finner vi att 95% av fallen ligger mellan M ± 1, 96 SE M. Att vi är 95% säkra eller korrekta att säga M pop skulle ligga i intervallet M + 1.96 SE M och M + 1.96 SE M och vi är 5% felaktiga att säga att M pop kommer att ligga utanför detta intervall.

Med andra ord sannolikheten för att M pop ligger inom intervallet M ± 1, 96 SE M är 95% (eller .95) och sannolikheten för att M pop ligger utanför intervallet är 5% (eller .05). Värdet 1, 96 är det kritiska värdet vid .05 nivå av betydelse.

(b) 99% av konfidensintervallet:

Med hänvisning till tabellen över området under normal kurva finner vi att 99% av fallen ligger mellan M ± 2, 58 SE M. Att vi är 99% säkra eller korrekta att säga M pop skulle ligga i intervallet M - 2.58 SE M och M + 2.58 SE M och vi är 1% felaktiga att säga att M pop kommer att ligga utanför detta intervall.

Med andra ord sannolikheten för att M pop ligger inom intervallet M ± 2, 58 SE M är 99% (eller .99) och sannolikheten för att M pop ligger utanför intervallet är 1% (eller .01). Värdet 2, 58 är det kritiska värdet vid .01 nivå av betydelse.

Här finner vi att nivån av betydelse är omvänt relaterad till graden av precision. I 05-nivå av betydelse skulle vi vara korrekta i 95% av fallen och i .01-nivå av betydelse skulle vi vara exakta i 99% av lättnaderna.

Tabellen nedan kommer att föregripa dig ytterligare:

Exempel 1:

Medelvärdet och SD på 225 pojkar i klass XII i Delhi i ett test av numerisk förmåga var 48 respektive 6. Hur bra betyder det här M- popen eller uppskattningen M pop . (n = 225, a = 6, medelvärde = 48]

Med hänvisning till tabellen över normalfördelning (tabell A) finner vi att alla flesta (99, 7) fall ligger i ± 3σ. I vårt exempel kommer alla provmedel att ligga mellan M pop + 3σ m och M pop-M. Så, varje medelvärde är bäst 3σm mindre än M pop på 3σ M mer än M pop .

Således om vi vet värdet av σ M kan vi döma om M- popen från vårt provmedel. Här är 4 standardavvikelsen för fördelningen av provmedel, som vårt medelvärde är en. Alla provmedel som normalt distribueras runt M pop ligger mellan M pop + 3 SE M och M pop - 3 SE M.

3 SE M = 3 x .4 = 1, 2

Även om vi inte känner till det exakta värdet av M pop kan vi åtminstone säga med tillförsikt att M pop ligger däremellan

(48-1, 2) och (48 + 1, 2) eller 46, 8 → 49, 2

Från tabell A finner vi att 95% av lättnader ligger mellan ± 1, 96 σ. I vårt exempel är 95% konfidensintervall för M popintervall från M - 1, 96 SE M till M + 1, 96 SE M.

Nu, 1, 96 SE M = 1, 96 x .4 = .78

. . . M- 1, 96 SE M = 48 - .78 = 47, 22 och M + 1, 96 SE M = 48 + .78 = 48, 78

. . . 95% konfidensintervall sträcker sig från 47, 22 till 48, 78. 99% konfidensintervallet för M- pop varierar från M - 2, 58 SE M till M + 2, 58 SE M.

Nu 2, 58 SE M = 2, 58 X, 4 = 1, 03

. . . M-2, 58 SE M = 48 -1, 03 = 46, 97 och M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . 99% konfidensintervall för M popintervall från 46, 97 till 49, 03.

Exempel 2:

Medelvärdet och SD på 400 elever i ett test visade sig vara 42 och 8. Kan du uppskatta medelvärdet för befolkningen med både 99% och 95% konfidensintervall?

Lösning:

(i) 95% konfidensintervall för M popintervall från M - 1, 96 SE M till M + 1, 96 SE M.

Nu 1, 96 SE M = 1, 96 x .4 = .784

. . . M-1, 96 SE M = 42 -784 = 41, 22

och M + 1, 96 SE M = 42 +, 784 = 42, 78 (upp till två decimaler).

Således varierar 95% konfidensintervall från 41, 22 till 42, 78. Vi är 95% korrekta att M pop ligger mellan 41, 22 och 42, 78.

(ii) 99% konfidensintervall för M popintervall från M - 2, 58 SE M till M + 2, 58 SE M

Nu är 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M-2, 58 SE M = 42-1, 03 = 40, 97

och M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Sålunda varierar 99% konfidensintervall från 40, 97 till 43, 03. Vi är 99% övertygade om att M pop ligger mellan 40, 97 och 43, 03.

Exempel 3:

Medlen och SD för ett prov på 169 pojkar i ett test av numerisk förmåga är respektive 50 respektive 6:

(i) Bestäm 95% -intervallet för populationens medelvärde och tolka det.

(ii) Bestäm det acceptabla provtagningsfelet vid .05 och .01 nivå av betydelse.

(iii) Bestäm 99% konfidensintervall för M pop .

Lösning:

M = 50

(i) 95% konfidensintervall för Mp 0p varierar från M - 1, 96 SE M till M + 1, 96 SE M.

Nu 1, 96 SE m = 1, 96 x .46 = .90

Således M-1, 96 SE M = 50 -90 = 49, 10

och M + 1, 96 SE M = 50 +90 = 50, 90

. . . 95% konfidensintervall för M popintervall från 49, 10 till 50, 90. Från provmedlet på 50 uppskattar vi M- popen som ett fast värde mellan 49, 10 och 50, 90 och med att säga så är vi 95% säkra.

Med andra ord, vårt provmedelvärde på 50 kommer inte att sakna M- popen med mer än .90 och det kommer att vara sant för 95 fall i 100. Alternativt kan endast 5 fall i 100 vårt provmedel på 50 missa M- popen genom att mer än .90.

(ii) Kritiskt värde vid .05 nivå av signifikans = 1, 96

Kritiskt värde vid .01 nivå av betydelse = 2, 58

"Provtagningsfel = kritiskt värde x SE M "

Sålunda är provtagningsfel vid .05-nivå av betydelse 1, 96 SE M och att vid .01-nivå av betydelse är 2, 58 SE M

Godtagbart provtagningsfel vid .05 nivå = 1, 96 SE M = 1, 96 x .46 = .90

Tillåtet provtagningsfel vid .01-nivå = 2, 58 SE M = 2, 58 X .46 = 1, 19

iii) 99% konfidensintervallet sträcker sig från M - 2, 58 SE M till M + 2, 58 SE M

Nu 2, 58 SE M = 2, 58 X, 46 = 1, 19

Sålunda M-2, 58 SE M = 50-1, 19 = 48, 81

och M + 2, 58 SE M = 50 + 1, 19 = 51, 19

99% konfidensintervall sträcker sig från 48, 81 till 51, 19.

Exempel 4:

För en given grupp på 500 soldater är det genomsnittliga AGCT-värdet 95, 00 och SD är 25.

(ii) Bestäm det99-konfidensintervallet för det sanna medelvärdet.

(ii) Det är osannolikt att det sanna medlet är större än vad värde?

Lösning:

(i) 99% konfidensintervallet sträcker sig från M - 2, 58 SE M till M + 2, 58 SE M.

Nu 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Sålunda M-2, 58 SE M = 95, 0-2, 89 = 92, 11

och M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . 99% konfidensintervall sträcker sig från 92, 11 till 97, 89.

Från vårt provmedel på 95, 0 uppskattar vi det sanna medelvärdet för att vara något fast värde mellan 92, 11 och 97, 89 och i så fall är vi 99% säkra.

(ii) Vårt provmedelvärde på 95, 0 kommer inte att sakna det sanna medelvärdet med mer än 2, 89 dvs den sanna är inte större än 97, 89.

(B) Beräkning av SE M i litet prov:

Det är konventionellt att ringa något prov som är större än 30 som ett stort prov. När N är stor är det inte värt att göra korrigeringen. Men när N är "liten" (mindre än 30), är det lämpligt att använda (N - 1), och det är absolut nödvändigt när N är ganska liten - säg mindre än 10.

Eleven måste komma ihåg att (i) att teoretiskt (N - 1) alltid ska användas när SD ska vara en uppskattning av befolkningen a; och att (ii) skillnaden mellan "storprovsstatistik" och "liten provstatistik" i form av en skärpunkt på N = 30 är godtycklig och delvis är en sak av bekvämlighet.

När N är mindre än cirka 30 bör formeln för a M eller SE M läsa:

Exempel 5:

Efter fem studenter har säkrade poäng i ett test:

Bestäm gränserna för 95% konfidensgräns för populationens medelvärde.

Resultatet är - 11, 13, 9, 12, 15:

Lösning:

M = 12

Här är df = n-1 = 5-1 = 4

Med hänvisning till tabell D med df = 4 är t -värdet vid .05-nivå av betydelse (dvs. 95% konfidensnivå) 2, 78.

95% konfidensintervallet definierar M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x 1, 0 = 9, 22 och

M + 2, 78 SE M = 12 + 2, 78 x1, 0 = 14, 78

. . . Gränserna för 95% konfidensintervall är 9, 22 och 14, 78.

Detta betyder att P = .95 den M pop ligger i intervallet 9.22 till 14.78.

Exempel 6:

Tio åtgärder av reaktionstid till ljus tas från en praktiserad observatör. Medelvärdet är 175, 50 ms (millisekunder) och S är 5, 82 ms. Bestäm 95-konfidensintervallet för M- popen ; .99 konfidensintervallet.

Lösning:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Df (frihetsgrader) som är tillgängliga för att bestämma t är (n - 1) eller (10 - 1) = 9

(i) Bestämning av 95% (eller 95) konfidensintervall:

Inmatning av tabell D med 9 df, vi läser att t = 2.26 vid .05 punkten.

95% konfidensintervall för M popintervall från M - 2.26 SE M till M + 2.26 SE M.

Nu 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Således M-2.26 SE M = 175.50 -4.16 = 171.34

och M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . 95% konfidensintervall för M-popintervall från 171, 34 till 179, 66. P är .95 att M- popen är inte mindre än 171, 34 eller högre än 179, 66. Om vi ​​konstaterar att M pop ligger inom detta intervall, borde vi över en lång serie av experiment vara rätt 95% av tiden och fel 5%.

(ii) Fastställande av 99% (eller .99) konfidensintervall:

Inmatning av tabell D med 9 df vi läser det t = 3, 25 vid .01 poäng. 99% konfidensintervall för M popintervall från M - 3.25 SE M till M + 3.25 SE M.

Nu 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Således M-3, 25 SE M = 175, 50 - 5, 98 = 169, 52

och M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . 99% konfidensintervall för M-popintervall från 169, 52 till 181, 48.

P är .99 att M- popen är minst 169, 52 eller högre än 181, 48. Om vi ​​konstaterar att M pop ligger inom detta intervall, borde vi över en lång serie av experiment vara rätt -99% av tiden och felet 1%.

Avledningar angående annan statistik:

Eftersom all statistik har samplingsfördelningar och standardfel kan betydelsen av median, kvartilavvikelse, standardavvikelse, procentsatser och annan statistik tolkas som medelvärdet och vi kan uppskatta parametern.

(i) Standardfel för medianen (eller SE Mdn -):

När det gäller SD och Q kan SE: s median för stora prov beräknas med följande formler:

där σ = SD av provet, n = provstorlek och Q = kvartilavvikelse för provet.

Ett exempel kommer att illustrera användningen och tolkningen av formlerna:

Exempel 7:

På Trabue Language Scale A gjorde 801 elva år gamla pojkar följande rekord:

Median = 21, 40 och Q = 4, 90. Hur väl representerar denna median medianen av befolkningen från vilken detta prov är ritat?

Lösning:

n = 801, Mdn = 21, 40, Q = 4, 90.

Genom att tillämpa den andra formeln,

Eftersom N är stor kan provtagningsfördelningen anses vara normal och konfidensintervallet som hittades från den sista raden i tabell D. 99-konfidensintervallet för Mdn- popen är 21, 40 ± 2, 58 x .32 eller 21, 40 ± .83.

Vi kan vara övertygade om att medianen av befolkningen inte är mindre än 20, 57 eller mer än 22, 23. Detta snäva område visar en hög grad av trovärdighet i provmedianen.

(ii) Standardfel av standardavvikelse (SE σ ):

Standardfelet för standardavvikelsen, som SE M, hittas genom att beräkna den sannolika divergensen av provet SD från dess parameter (population SD). Formeln för SE σ är

Exempel 8:

n = 400, a = 6

Hur väl representerar denna SD SD för befolkningen från vilken provet dras?

Lösning:

När proverna är stora och ritade slumpmässigt från deras befolkning kan ovanstående formel appliceras och tolkas på samma sätt som SE M.

Eftersom N är stor kan .99 konfidensintervallet för SD pop säkert tas vid gränserna ± 2, 58 σ σ . Att ersätta σ σ har 6 ± 2, 58 x .21 dvs gränserna mellan (6 - .54) och (6 + .54) eller 5, 46 och 6, 54.

Om vi ​​antar att SD pop ligger mellan gränserna 5, 46 och 6, 54, borde vi vara rätt 99% av tiden och fel 1%.

(iii) Standardfel av kvartilavvikelsen (eller SE Q eller a q ):

SE Q kan hittas från formlerna:

Exempel 9:

n = 801, Q = 4, 90

Hur väl representerar denna Q kvotilavvikelsen?

Lösning:

Genom att använda formeln

.99-konfidensintervallet för Q- popen är från 4, 90 ± 2, 58 x .203 dvs från 4, 38 till 5, 42. Detta intervall visar att provet Q är en mycket pålitlig statistik.

(iv) Standardfel av procentandel (eller SE% eller σ%):

Ge procentuell förekomst av beteende, frågan uppstår ofta om hur mycket förtroende vi kan placera i figuren. Hur pålitligt ett index är vår andel av förekomsten av beteendet som vi är intresserade av? För att svara på denna fråga,

Vi måste beräkna SE av en procentandel med formeln:

i vilken

p = den procentuella förekomsten av beteendet, q = (1 - p)

n = antal fall.

Exempel 10:

I en studie av fusk bland barn i grundskolan visade sig 100 eller 25% av de 400 barnen från bostäder med hög socioekonomisk status blivit lurade på olika test. Hur väl representerar det befolkningsprocenten?

Lösning:

p = 25% (procentuell förekomst)

q = 75% (100% - 25%)

99% konfidensintervall för befolkningsandelar varierar från

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

och 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Vi kan anta 99% förtroende för att barn med hög socioekonomisk status skulle fuska med minst 19, 4% och inte vara större än 30, 60%.

(v) Standardfel för korrelationskoefficienten (SE r eller σ r ):

Den klassiska formeln för SE av a-är

(SE av en koefficient för korrelation r när N är stor)

Exempel 11:

n = 120, r = .60.

Vilka gränser är 99% konfidensintervall för population r

Lösning:

99% konfidensintervall

= r ± 2, 58 SE r = .60 ± 2, 58 SE r

= .60 ± .15 eller .45 till .75

Viktiga statistiska villkor:

(i) Nivåer:

0, 05:

Sannolikheten att gå fel i 5 prover av 100 prov.

0, 01:

Sannolikheten att gå fel i 1 prov av 100 prov.

(ii) Förtroende:

I .05 nivå av betydelse har experimenteraren 95% förtroende för att uppgifterna måste representera befolkningen.

I .01-nivå av betydelse har experimenter 99% förtroende för att provstatistik måste representera befolkningen.

(iii) Betydelsenivåer:

Innan vi testar hypotesen måste vi bestämma de kriterier som vi vill acceptera eller avvisa nollhypotesen. Vi måste bestämma nivån av betydelse före testet. Två nivåer av betydelse är i allmänhet, dvs .05 nivå och .01 nivå.

(a) .05 nivå av betydelse:

Vi läser från Tabell A att 95% av fallen i normalfördelning faller inom gränserna ± 1, 96 SE M. Om vi ​​tar gränserna som anges av M ± 1, 96 SE M definierar vi ett intervall för vilket konfidensnivåen är .95. Med utgångspunkt i vår bedömning som storleken på M pop på dessa gränser, står vi för att vara rätt 95% av tiden och fel 5%.

Området mellan - 1, 96 SE M och + 1, 96 SE M är känt som acceptansområdet för H o och området utanför - 1, 96 SE M och + 1, 96 SE M är känt som avstötningsområdet. Om något prov betyder lögner inom acceptansområdet accepterar vi H o . Vid avvisning av H o erkänner vi att provmedlet kan falla utanför ± 1, 96 SE M.

Således för att avvisa H o gör vi 5% fel eftersom i 5% av 100 lättnader kan ett sådant provmedel uppstå. Vi är villiga att ta så mycket som 5% risk för att avvisa H o när det råkar vara sant. Kriteriet för att avvisa H o är således räckt för betydelsen.

(b) .01 nivå av betydelse:

Vi läser från Tabell A att 99% av lättnaderna i en normal fördelning faller inom gränserna ± 2, 58 SE M. Om vi ​​lägger till gränserna som anges av M ± 2, 58 SE M definierar vi ett intervall för vilket konfidensnivåen är .99. Basera vår bedömning om storleken på M pop på dessa gränser, vi står för att vara rätt 99% av tiden och fel 1%.

Området mellan - 2, 58 SE M och + 2, 58 SE M skulle vara acceptansområdet för H 0 och området utanför det skulle vara området för avvisning av H o . Vi är villiga att ta så mycket som 1% risk för att avvisa H o när det råkar vara sant.

.01 nivå av betydelse är mer krävande än .05 nivå eftersom i .01 nivå felet i att avvisa H o är 1% medan i .05 nivå ett sådant fel är 5%.

(iv) t-distribution:

När N är mindre än cirka 30, dvs när provet är litet kallas samplingsfördelningen " t- distribution".

T-fördelningen skiljer sig inte mycket från det normala om inte N är ganska liten. När N ökar i storlek närmar sig t- distributionen närmare den normala formen.

Egenskaper för t-distribution:

1. Det ser ut som en klockformad kurva. Men dess fördelning är mer variabel med nollskärhet och "Ku" större än 3.

2. Det är symmetriskt om linjen t = 0.

3. Det är unimodalt med maxordinatorn vid t = 0.

4. När N är liten ligger t- distributionen under den normala kurvan, men kurvans svansar eller ändar är högre än motsvarande delar av normalkurvan.

5. Enheterna längs baslinjen för t- distributionen är i själva verket σ poäng, dvs.

(v) Frihetsgrader (df):

Begreppet grader av frihet är mycket viktigt i liten provstatistik. Det är också avgörande, i analys av varians och i andra förfaranden. Frihetsgrader innebär frihet att variera.

Låt oss välja fem poäng, vars medelvärde är 15. Nu antar de fyra poängen vara 18, 10, 20, 15. För medelvärdet att vara lika med 15, måste det femte poänget vara 12. Vi har förstås frihet att välja några fyra poäng.

Men vi har ingen frihet att välja 5: e poängen eftersom 5: e poängen gör justeringar i variationen med de första fyra poängen och med antagandet att medelvärdet blir 15. Här läggs N = 5 och en restriktion, dvs medelvärdet måste vara 15. Därför är graden av frihet N-1 eller 4.

Om vi ​​har 5 poäng 5, 6, 7, 8 och 9 är medelvärdet 7; och avvikelserna i våra poäng från 7 är - 2, - 1, 0, 1 och 2. Summan av dessa avvikelser är noll. Av de 5 avvikelserna kan endast 4 (N - 1) väljas "fritt" som villkoret att summan lika med noll direkt begränsar värdet av den femte avvikelsen.

SD är givetvis baserad på kvadraterna av avvikelserna som tas runt medelvärdet. Det finns N df för att beräkna medelvärdet, men endast (N - 1) tillgängligt för "S" (SD) då en df går förlorad vid beräkning av medelvärdet.

I ett annat exempel, där N = 10, fanns det tillgängliga df för att uppskatta M- popen som 9 eller (N-1), dvs en mindre än antalet observationer, nämligen 10. En df förloras vid beräkning av M och följaktligen endast 9 lämnas för att uppskatta M- popen genom "S" och t-distributionen.

När en statistik används för att uppskatta en parameter är regeln att tillgängliga df är lika med N minus antalet parametrar som redan beräknats från provet. M är en uppskattning av M pop och i beräkningen vi förlorar 1 df .

Vid beräkning av beräkningsförmågan hos en r, till exempel (som beror på avvikelserna från två medel) är df (N - 2). Vid chi-kvadratprov och variansanalys följs separata procedurer vid bestämning av df .

(vi) Null hypotes:

Nollhypotesen är ett användbart verktyg för att testa betydelsen av skillnader. Denna hypotes åberopar att det inte finns någon sann skillnad mellan två befolkningsmedel och att skillnaden mellan provmedel är därför oavsiktlig och obetydlig.

Nollhypotesen är relaterad till den rättsliga principen att "en man är oskyldig tills han är bevisad skyldig". Det utgör en utmaning och experimentets funktion är att ge fakta en chans att motsätta sig (eller misslyckas) mot denna utmaning.

För att illustrera, anta att det hävdas att "instruktionsstandarder för singelskiftskolor är bättre än dubbelskiftskolorna". Denna hypotes är vagt uttryckt och kan inte testas exakt.

Om vi ​​hävdar att "singelskiftskolor inte ger bättre instruktionsstandarder än dubbelskiftskolor" (den verkliga skillnaden är noll). Denna nollhypotes är exakt och kan testas. Om vår nollhypotes är icke skattskyldig, måste den avvisas. Icke-skillnadsförklaringen förutsätter att de två grupperna kommer att testas och befinnas vara lika.

Nollformuläret föredras av de flesta erfarna forskare. Denna formuleringsform definierar lättare den matematiska modellen som ska utnyttjas i hypotesens statistiska test.

En nollhypotes är aldrig bevisad eller motbevisad. Det kan accepteras eller avvisas med viss grad av förtroende (eller på viss nivå av betydelse).

Innan vi testar en hypotes måste vi ta hänsyn till följande:

1. Om provet är stort eller litet

2. Vad är nivån av betydelse.

3. Om testet är ett två-tailed test eller ett-tailed test.

(vii) Fel i att göra slutsatser:

Samtidigt som man accepterar eller avvisar nollhypotesen är det möjligt att begå två typer av fel och lust att räkna med av forskare.

Vad som kallas typ I och typ II-fel kan förklaras nedan:

Typ I-fel:

Sådana fel är förbundna när vi avvisar en nollhypotes genom att markera en skillnad betydande, även om det inte finns någon sann skillnad. Antag att skillnaden mellan två befolkningsmedel (M pop- M pop = 0) är faktiskt noll. (Till exempel kan man tänka sig pojkar och flickor som utgör samma befolkning i förhållande till de flesta mentala tester). Om test av betydelse för två provmedel återspeglar ett faktum att skillnaden i populationen är signifikant, begår vi typ I-fel.

Typ II fel:

Sådan typ av fel begås när vi accepterar en nollhypotes genom att markera en skillnad som inte är signifikant, även om det finns en sann skillnad. Antag att det finns en sann skillnad mellan de två befolkningsorganen.

Om vårt test av betydelse som tillämpas på de två provmedlen leder oss till att tro att skillnaden i befolkningsmedel inte är signifikant, begår vi ett typ II-fel.

Olika försiktighetsåtgärder kan vidtas för att undvika båda typer av fel. Om vi ​​ställer in en låg nivå av betydelse (P är större än .05) ökar vi sannolikheten för typ I-fel. Om vi ​​ställer upp en hög grad av betydelse (P är mindre än .05), kommer typ I-fel att vara mindre. Möjligheten att dra felaktiga slutsatser av typ II-sort är förstärkt när vi ställer en väldigt hög grad av betydelse.

(viii) Två-tailed och One-tailed tester av betydelse:

I nollhypotesen kan skillnaderna mellan erhållna medel (dvs M 1 - M 2 ) vara antingen plus eller minus. Vid bestämning av sannolikhet tar vi båda svansarna av provtagningsfördelningen.

(ix) kritiskt förhållande (CR):

Kritiskt förhållande (CR) hittas genom att dividera skillnaden mellan provorganet med sitt standardfel (CR = D / SE D ). När N: s av proverna är stora (30 eller mer är "stora") är distributionen av CR: ar känd för att vara normal kring den sanna skillnaden mellan populationen, t är ett kritiskt förhållande där en mer exakt uppskattning av σ D är använd. Provtagningsfördelningen av t är inte normal när N är liten (mindre än 30, säger), t är en CR; men alla CR är inte t.

Tvåstansstest:

1. I två-tailed test tar vi hänsyn till både den normala kurvens svansar.

2. Vid icke-tailed alternativ hypotes gör vi ett tvåstansstest.

3. Exempel:

Ett intresseprov administreras till vissa pojkar i en yrkesutbildning. Utbildningsklass och till vissa pojkar i en latinsklass. Är den genomsnittliga skillnaden mellan de två grupperna betydande på .05-nivån?

4. Provvärdet avviker från M- pop i antingen riktning + eller -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Värdet är viktigt:

1, 96 vid .05 nivå

2, 58 vid .01 nivå

7. Avkastningsområdet delas upp i båda ändarna (svansarna) av normal kurva (dvs. 05 till .025 och .025, 01 till .005 och .005).

One-tailed test:

1. Vi måste ta en lång, dvs på vänster eller höger sida av normal kurva med hänsyn till.

2. Vid riktning alternativ hypotes gör vi ett-tailed test viz., M 1 > M 2 . I så fall är riktningen väldigt tydlig, ensidig.

3.Example:

Tio ämnen ges 5 på varandra följande spår vid ett siffra-symboltest, av vilket endast poängen för spår 1 och 5 visas. Är den genomsnittliga vinsten från början till slutprov betydande?

4. Provmedelvärdet avviker från populationens medelvärde i en riktning.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 eller M 1 <m 2

6. Värdet är viktigt:

1, 62 vid .05 nivå

2, 33 vid .01-nivå

7. Det finns ett avvisningsområde i höger sida av fördelningen eller vänstra svansen på fördelningen.