Chi-Square-test: Betydelse, tillämpningar och användningsområden

Efter att du läst den här artikeln kommer du att lära dig om: - 1. Betydelse av Chi-Square-test 2. Nivån av betydelse för Chi-Square-testet 3. Chi-Square-testet under Null-hypotesen 4. Villkor för giltigheten 5. Additivfastighet 6. Applikationer 7. Användningar.

Betydelse av Chi-Square-test:

Chi-kvadrat (χ 2 ) -testet representerar en användbar metod för att jämföra experimentellt erhållna resultat med de som förväntas teoretiskt på en viss hypotes.

Således är Chi-kvadrat ett mått på faktisk divergens av de observerade och förväntade frekvenserna. Det är mycket uppenbart att betydelsen av en sådan åtgärd skulle vara mycket stor i stickprovstudier där vi alltid måste studera skillnaden mellan teori och faktum.

Chi-kvadrat som vi har sett är ett mått på divergens mellan de förväntade och observerade frekvenserna och som sådan om det inte finns någon skillnad mellan förväntade och observerade frekvenser är värdet av Chi-kvadrat 0.

Om det finns en skillnad mellan de observerade och de förväntade frekvenserna, skulle värdet av Chi-kvadratet vara mer än 0. Det är ju ju större Chi-kvadraten, desto större är sannolikheten för en verklig divergens av experimentellt observerad från förväntade resultat.

Om det beräknade värdet på chi-kvadraten är väldigt liten jämfört med dess tabellvärde indikerar det att skillnaden mellan faktiska och förväntade frekvenser är väldigt liten och följaktligen är passformen bra. Om å andra sidan det beräknade värdet av chi-kvadrat är mycket stort jämfört med dess tabellvärde indikerar det att skillnaden mellan förväntade och observerade frekvenser är mycket stor och följaktligen är passformen dålig.

För att utvärdera Chi-kvadraten skriver vi in ​​tabell E med det beräknade värdet av kvadraten och lämpligt antal grader av frihet. Antalet df = (r - 1) (c - 1) där r är antalet rader och c antalet kolumner där data tabuleras.

Således är i 2 x 2 tabellgrader av frihet (2 - 1) (2 - 1) eller 1. På samma sätt i 3 x 3 bordet är grader av frihet (3 - 1) (3 - 1) eller 4 och i 3 x 4 bord graderna av frihet är (3 - 1) (4 - 1) eller 6.

Nivån av betydelse för Chi-Square-testet:

De beräknade värdena för x2 (Chi-kvadrat) jämförs med tabellvärdena för att avgöra huruvida skillnaden mellan förväntade och observerade frekvenser beror på provtagningsfluktuationerna och som sådan signifikant eller om skillnaden beror på någon annan anledning och som så signifikant. Divergensen av teori och fakta testas alltid med avseende på vissa sannolikheter.

Sannolikheterna indikerar omfattningen av tillit som vi kan placera på slutsatsen. Tabellvärdena för χ 2 är tillgängliga på olika sannolikhetsnivåer. Dessa nivåer kallas nivåer av betydelse. Vanligtvis ses värdet av χ 2 vid .05 och .01 nivå av betydelse för de givna graderna av frihet från tabellerna.

Om det beräknade värdet på x2 är större än det tabulerade värdet, sägs det vara signifikant. Med andra ord kan skillnaden mellan de observerade och förväntade frekvenserna inte hänföras till chansen och vi avvisar nollhypotesen.

Således drar vi slutsatsen att experimentet inte stöder teorin. Å andra sidan om beräknat värde av x är mindre än motsvarande tabulerade värde sägs det vara icke-signifikant vid den erforderliga nivåens betydelse.

Detta innebär att skillnaden mellan observerade värden (experiment) och de förväntade värdena (teorin) kan hänföras till chansen, dvs fluktuationer av provtagningen.

Chi-Square-testet under Null-hypotesen:

Antag att vi får en uppsättning observerade frekvenser erhållna under ett visst experiment och vi vill testa om de experimentella resultaten stöder en viss hypotes eller teori. Karl Pearson 1990 utvecklade ett test för att testa betydelsen av skillnaden mellan experimentella värden och de teoretiska värden som erhölls under någon teori eller hypotes.

Detta test är känt som χ 2- test och används för att testa om avvikelsen mellan observation (experiment) och teori kan hänföras till chans (fluktuationer av provtagningen) eller om det verkligen beror på teoriens otillräcklighet för att passa den observerade data.

Under Null-hypotesen säger vi att det inte finns någon signifikant skillnad mellan de observerade (experimentella) och de teoretiska eller hypotetiska värdena, dvs det finns en bra kompatibilitet mellan teori och experiment.

Ekvationen för chi-kvadrat (χ 2 ) anges som följer:

i vilken f o = frekvens av förekomst av observerade eller experimentellt bestämda fakta

f e = förväntad frekvens av förekomst på viss hypotes.

Chi-kvadrat är således summan av de värden som erhålls genom att dividera kvadraten av skillnaden mellan observerade och förväntade frekvenser med de förväntade frekvenserna i varje fall. Med andra ord är skillnaderna mellan observerade och förväntade frekvenser kvadrerade och dividerat med det förväntade numret i varje fall och summan av dessa kvotienter är x2.

Flera illustrationer av chi-square testet kommer att klargöra diskussionen ovan. Skillnaderna mellan f o och f e skrivs alltid + ve.

1. Test av divergensen av observerade resultat från de som förväntas på hypotesen om lika sannolikhet (null hypotes):

Exempel 1:

Nittiofemte personer uppmanas att uttrycka sin inställning till propositionen "Ska aidsutbildning integreras i läroplanen för högre gymnasieskola" genom att markera F (gynnsamt), I (likgiltigt) eller U (ogynnsamt).

Det observerades att 48 märkta 'F', 24 'I' och 24 'U':

(i) Testa om de observerade resultaten avviker signifikant från de resultat som kan förväntas om det inte finns några preferenser i gruppen.

(ii) Testa hypotesen att "det finns ingen skillnad mellan preferenser i gruppen".

(iii) Tolka resultaten.

Lösning:

Följande steg kan följas för beräkningen av x 2 och dra slutsatserna:

Steg 1:

Beräkna de förväntade frekvenserna (f e ) som motsvarar de observerade frekvenserna i varje fall under någon teori eller hypotes.

I vårt exempel är teorin av lika sannolikhet (null hypotes). I den andra raden väljs fördelningen av svar som förväntas på nollhypotesen lika.

Steg 2:

Beräkna avvikelserna (f o - f e ) för varje frekvens. Var och en av dessa skillnader är kvadrerad och dividerad med dess f e (256/32, 64/32 och 64/32).

Steg 3:

Lägg till dessa värden för att beräkna:

Steg 4:

Graden av frihet i bordet beräknas med formeln df = (r - 1) (c - 1) för att vara (3 - 1) (2 - 1) eller 2.

Steg 5:

Se upp de beräknade (kritiska) värdena på χ 2 för 2 df vid viss nivå, normalt 5% eller 1%.

Med df = 2 är χ 2- värdet att vara signifikant vid .01-nivån 9, 21 (tabell E). Det erhållna χ 2 -värdet av 12> 9, 21.

jag. Därför är den markerade divergensen signifikant.

ii. Nollhypotesen avvisas.

III. Vi drar slutsatsen att vår grupp verkligen gynnar propositionen.

Vi avvisar hypotesen "lika svar" och konstaterar att vår grupp gynnar propositionen.

Exempel 2:

Antalet bilolyckor per vecka i en viss gemenskap var följande:

12, 8, 20, 2, 14, 10, 15, 6, 9, 4

Är dessa frekvenser i överensstämmelse med tron ​​att olycksförhållandena var desamma under denna 10-veckorsperiod?

Lösning:

Null-hypotes - Ställ in nollhypotesen att de givna frekvenserna (antal olyckor per vecka i ett visst samhälle) överensstämmer med tron ​​att olycksförhållandena var samma under 10 veckorsperioden.

Eftersom totalt antal olyckor under de 10 veckorna är:

12 + 8 + 20 + 2 + 14 + 10 + 15 + 6 + 9 + 4 = 100.

Under nollhypotesen bör dessa olyckor fördelas jämnt över 10 veckors period och därmed är det förväntade antalet olyckor för var 10: e vecka 100/10 = 10.

Eftersom beräknat värde på χ 2 = 26, 6 är större än det tabulerade värdet, 21.666. Det är signifikant och nollhypotesen avvisas vid .01-nivå av betydelse. Därför drar vi slutsatsen att olycksförhållandena verkligen inte är likformiga (samma) under tioveckorsperioden.

2. Test av divergensen av observerade resultat från de som förväntas på hypotesen av en normal fördelning:

Hypotesen, istället för att vara lika sannolik, kan följa den normala fördelningen. Ett exempel illustrerar hur denna hypotes kan testas av chi-square.

Exempel 3:

Tvåhundra säljare har klassificerats i tre grupper mycket bra, tillfredsställande och fattiga - med konsensus av försäljningschefer.

Skillnaden i betygsfördelning skiljer sig avsevärt från vad som förväntas om försäljningsförmåga normalt distribueras i vår befolkning av säljare?

Vi fastställer hypotesen att försäljningsförmåga normalt distribueras. Den normala kurvan sträcker sig från - 3σ till + 3σ. Om försäljningsförmågan normalt fördelas kan baslinjen delas in i tre lika delar, dvs

(+ 1σ till + 3σ), (- 1σ till + 1σ) och (- 3σ till-1σ) som representerar goda, tillfredsställande och fattiga säljare. Med hänvisning till Tabell A finner vi att 16% av fallen ligger mellan + 1σ och + 3σ, 68% mellan - 1σ och + 1σ och 16% mellan - 3σ och - 1σ. Vid vårt problem 16% av 200 = 32 och 68% av 200 = 136.

df = 2. P är mindre än .01

Den beräknade x 2 = 72, 76

Den beräknade χ 2 av 72, 76> 9, 21. Därför är P mindre än .01.

.˙. Skillnaden mellan observerade frekvenser och förväntade frekvenser är ganska signifikant. På denna grund måste hypotesen om en normal fördelning av försäljningsförmåga i denna grupp avvisas. Därför drar vi slutsatsen att fördelningen av betyg skiljer sig från vad som förväntas.

3. Chi-square test när våra förväntningar är baserade på förutbestämda resultat:

Exempel 4:

I ett försök med uppfödning av ärter fick en forskare följande uppgifter:

Teorin förutsäger andelen bönor i fyra grupper A, B, C och D bör vara 9: 3: 3: 1. I ett försök bland 1600 bönor var siffrorna i fyra grupper 882, 313, 287 och 118. Går det Experimentets resultat stöder den genetiska teorin? (Test vid .05 nivå).

Lösning:

Vi satte upp nollhypotesen att det inte finns någon signifikant skillnad mellan experimentvärdena och teorin. Med andra ord finns det bra korrespondens mellan teori och experiment, dvs teorin stödjer experimentet.

Eftersom det beräknade χ 2- värdet av 4, 726 <7, 81 är det inte signifikant. Därför kan noll hypotes accepteras vid .05 nivå av betydelse och vi kan dra slutsatsen att de experimentella resultaten stöder den genetiska teorin.

4. Chi-square testet när tabellposter är små:

När tabellposter är små och när bordet är 2 x 2 gånger, dvs df = 1, χ 2 är föremål för betydande fel om inte en korrigering för kontinuitet (kallad Yates 'Correction) görs.

Exempel 5:

Fyrtio råttor erbjöds möjlighet att välja mellan två rutter. Man fann att 13 valde ljusa rutter (dvs. rutter med mer belysning) och 27 valde mörka rutter.

(i) Testa hypotesen att belysning inte spelar någon roll i råttans preferens för rutter (Test vid .05-nivå).

(ii) Testa om råttorna har en preferens mot mörka rutter.

Lösning:

Om belysningen inte skiljer sig åt i förhållande till rutter, dvs om H0 är sant, skulle proportionerlig preferens vara 1/2 för varje rutt (dvs. 20).

I vårt exempel ska vi subtrahera .5 från varje (f o - f e ) skillnad av följande anledning:

Uppgifterna kan tabelleras enligt följande:

När de förväntade inmatningarna i 2 x 2-faldiga bord är desamma som i vårt problem kan formeln för chi-kvadrat skrivas i en något kortare form enligt följande:

(i) Det kritiska värdet av x2 vid .05-nivå är 3, 841. Den erhållna χ 2 av 4, 22 är mer än 3, 841. Därför avvisas nollhypotesen på .05-nivå. Tydligen är ljus eller mörk en faktor i råttans val för rutter.

(ii) I vårt exempel måste vi göra ett one-tailed test. Inmatning av tabell E finner vi att χ 2 av 4.22 har en P = .043 (genom interpolering).

.˙. P / 2 = .0215 eller 2%. Med andra ord finns det två chanser i 100 att en sådan divergens skulle uppstå.

Därmed markerar vi divergensen för att vara signifikant vid 02 nivå.

Därför drar vi slutsatsen att råttorna föredrar mörka vägar.

5. Chi-square testet av oberoende i beredskapstabeller:

Ibland kan vi stöta på situationer som kräver att vi testar om det finns något samband (eller association) mellan två variabler eller attribut. Med andra ord kan χ 2 göras när vi vill undersöka förhållandet mellan egenskaper eller attribut som kan klassificeras i två eller flera kategorier.

Till exempel kan vi bli tvungna att testa om faderns ögonfärg är associerad med sonens ögonfärg, huruvida familjens socioekonomiska status är förenad med preferensen av olika märken av en vara, om utbildningen av par och familje storlek är relaterade, om ett visst vaccin har en kontrollerande effekt på en viss sjukdom etc.

För att göra ett test utarbetar vi en beredskapstabellände för att beräkna f e (förväntad frekvens) för varje cell i beredskapstabellen och sedan beräkna x 2 med hjälp av formel:

Nollhypotesen:

χ 2 beräknas med antagandet att de två attributen är oberoende av varandra, det vill säga det finns inget samband mellan de två attributen.

Beräkningen av förväntad frekvens av en cell är som följer:

Exempel 6:

I ett visst prov på 2000 familjer är 1400 familjer konsumenter av te där 1236 är hinduiska familjer och 164 är icke-hinduiska.

Och 600 familjer är inte konsumenter av te där 564 är hinduiska familjer och 36 är icke-hinduiska. Använd χ 2- test och ange om det finns någon signifikant skillnad mellan konsumtion av te bland hinduiska och icke-hinduiska familjer.

Lösning:

Ovanstående data kan ordnas i form av ett 2 x 2 beredskapstabell enligt nedan:

Vi ställer in nollhypotesen (H 0 ) att de två attributen, dvs "förbrukning av te" och "samhället" är oberoende. Det finns med andra ord ingen signifikant skillnad mellan konsumtionen av te bland hinduiska och icke-hinduiska familjer.

Eftersom det beräknade värdet på x2, nämligen 15, 24 är mycket större än det tabulerade värdet av x2 vid .01-nivå av betydelse; värdet på x2 är mycket signifikant och nollhypotesen avvisas.

Därför drar vi slutsatsen att de två samhällena (hinduiska och icke-hinduer) skiljer sig avsevärt när det gäller konsumtionen av te bland dem.

Exempel 7:

Tabellen nedan visar data som erhölls under en epidemi av kolera.

Testa effektiviteten av ympningen för att förhindra koleraattackan.

Lösning:

Vi ställer in nollhypotesen (H 0 ) att de två attributen, nämligen inokulering och frånvaro av kolera inte är associerade. Dessa två attribut i det angivna tabellen är oberoende.

Baserat på vår hypotes kan vi beräkna de förväntade frekvenserna enligt följande:

Beräkning av (f e ):

Femvärdet av χ 2 för 1 df är 3, 841, vilket är mycket mindre än det beräknade värdet på χ 2 . Så i ljuset av detta är slutsatsen uppenbar att hypotesen är inkorrekt och inokulering och avsaknad av attack från kolera är associerade.

Villkor för giltigheten av Chi-Square-testet:

Chi-square teststatistik kan användas om följande villkor är uppfyllda:

1. N, den totala frekvensen, ska vara relativt stor, säg större än 50.

2. Provobservationerna bör vara oberoende. Detta innebär att inga enskilda objekt ska inkluderas två gånger eller mer i provet.

3. Om det finns några begränsningar på cellfrekvenserna bör de vara linjära (dvs. de bör inte innebära kvadratfrekvens och högre frekvenser), såsom Σf o = Σf e = N.

4. Ingen teoretisk frekvens bör vara liten. Små är en relativ term. Företrädesvis bör varje teoretisk frekvens vara större än 10 men i vilket fall som helst inte mindre än 5.

Om någon teoretisk frekvens är mindre än 5 kan vi inte tillämpa χ 2- test som sådant. I så fall använder vi tekniken för "pooling" som består i att lägga till frekvenser som är mindre än 5 med föregående eller efterföljande frekvens (frekvenser) så att den resulterande summan är större än 5 och justera för frihetsgraden i enlighet därmed.

5. Den angivna fördelningen ska inte ersättas med relativa frekvenser eller proportioner, men uppgifterna ska ges i originalenheter.

6. Yates korrigering bör tillämpas under speciella omständigheter när df = 1 (dvs i 2 x 2 tabeller) och när cellposterna är små.

7. χ 2- test används oftast som ett icke-riktningstest (dvs vi gör ett tvåstansstest.). Det kan emellertid vara fall då χ 2 test kan användas för att göra ett enstans test.

I ett-tailed test dubblar vi P-värdet. Till exempel med df = 1 är det kritiska värdet på x2 vid 05-nivå 2, 706 (2, 706 är värdet skrivet under .10-nivå) och det kritiska värdet av; χ 2 vid .01-nivå är 5, 412 (värdet skrivs under .02-nivån).

Tillsatsegenskapen för Chi-Square-testet:

χ 2 har en mycket användbar egenskap för tillägg. Om ett antal provstudier har genomförts i samma fält kan resultaten sammanställas för att få en exakt uppfattning om den verkliga positionen.

Antag att tio experiment har genomförts för att testa om ett visst vaccin är effektivt mot en viss sjukdom. Nu ska vi ha tio olika värden på χ 2 och tio olika värden för df.

Vi kan lägga till tio χ 2 för att få ett värde och på samma sätt kan tio värden av df också läggas till tillsammans. Således kommer vi att ha ett värde av χ 2 och ett värde av grader av frihet. Nu kan vi testa resultaten av alla dessa tio experiment kombinerat tillsammans och ta reda på värdet av P.

Antag att fem oberoende experiment har utförts inom ett visst fält. Antag att i varje fall fanns en df och följande värden av x2 erhölls.

Nu vid 5% signifikansnivå (eller för P - .05) är värdet χ 2 för en df 3, 841. Från de beräknade värdena på χ 2 som anges ovan märker vi att i endast en enkelhet, dvs experiment nr 3 är det observerade värdet på χ 2 mindre än det tabulerade värdet på 3, 841.

Det betyder att för det här experimentet är skillnaden obetydlig, men i de återstående fyra fallen är det beräknade värdet av x 2 mer än 3, 841 och som sådan vid 5% signifikansnivå är skillnaden mellan de förväntade och de faktiska frekvenserna signifikanta .

Om vi ​​lägger till alla värden på x2 får vi (4.3 + 5.7 + 2.1 + 3.9 + 8.3) eller 24.3. Den totala graden av frihet är 5. Det betyder att det beräknade värdet på χ 2 för 5 df är 24, 3.

Om vi ​​tittar i tabellen med χ 2 kommer vi att finna att vid 5% nivå av betydelse för 5 df är värdet av x 2 11.070. Det beräknade värdet på x 2 som är 24, 3 är mycket högre än det tabulerade värdet och som sådan kan vi dra slutsatsen att skillnaden mellan observerade och förväntade frekvenser är signifikant.

Även om vi tar 1% signifikansnivå (eller P = .01) är tabellvärdet på χ 2 endast 15.086. Sannolikheten att få ett värde χ 2 lika med eller mer än 24, 3 som ett resultat av provtagningsfluktuationer är alltså mycket mindre än ens .01 eller med andra ord skillnaden är signifikant.

Tillämpningar av Chi-Test:

Ansökningarna av χ 2- teststatistik kan diskuteras enligt nedan:

1. Test av divergensen av observerade resultat från förväntade resultat när våra förväntningar bygger på hypotesen om lika sannolikhet.

2. Chi-square test när förväntningarna är baserade på normal distribution.

3. Chi-square test när våra förväntningar är baserade på förutbestämda resultat.

4. Korrigering för diskontinuitet eller Yates 'korrigering vid beräkning av x 2 .

5. Chi-square test av oberoende i beredskapstabeller.

Användning av Chi-Square-test:

1. Även om test utförs i frekvenser kan det bäst betraktas konceptuellt som ett test om proportioner.

2. x 2- test används för att testa hypotesen och är inte användbart för uppskattning.

3. Chi-square test kan tillämpas på komplexa beredskapstabeller med flera klasser.

4. Chi-kvadratprov har en mycket användbar egenskap dvs "tillsatsegenskapen". Om ett antal provstudier utförs i samma fält kan resultaten sammanställas. Det betyder att χ 2 -värden kan läggas till.