Analys av varians (ANOVA)

Denna artikel kommer att vara inriktad på tillämpningen av analys av varians på det viktiga och ofta stöta på att bestämma betydelsen av skillnaden mellan medel.

Varians, i vanligt bemärkelse, är ett mått på dispersion av en uppsättning poäng. Det beskriver i vilken utsträckning poängen skiljer sig från varandra. Det definieras som medelvärdet för den kvadrerade avvikelsen för enskilda poäng tagna från medelvärdet.

där x = X - M eller avvikelse från poängen från medelvärdet, dvs varians = kvadrat av SD

eller varians = σ 2 så σ =

En mått av variation ger oss en uppfattning om gruppens homogenitet. Variansen i uppsättningen poäng blir mindre där gruppen är homogen i prestation. Å andra sidan kommer variansen av uppsättningen av poäng att vara mer, om gruppen är heterogen i prestation.

Analysen av varians är en mycket användbar enhet för att analysera resultaten av vetenskapliga förfrågningar, forskning inom samhällsvetenskap och fysik. För att få svar på forskningsfrågor i experimentella studier eller för att testa hypoteserna analyseras variansen i olika komponenter och skillnader från olika källor jämförs. I forskning vi stöter på olika experimentella konstruktioner och vi formulerar null hypoteser.

Vi använder tekniken "variansanalys" (ANOVA eller ANOVAR) för att studera om variansförhållandet (F) är signifikant eller inte, och baseras på det. Nollhypotesen accepteras eller avvisas.

Begreppet varians och ANOVA klargörs genom ett exempel.

Exempel 1:

Beräkna variansen av följande fördelning av poäng 4, 6, 3, 7, 5.

Här kallas uttrycket Zx 2 "Summan av kvadrater av avvikelse från poäng från medelvärdet" (kortfattat SS). När SS delas med det totala antalet poäng (N) får vi "Mean square" eller MS. Således kallas varians också medelstorlek. symbol~~POS=TRUNC

V = MS eller V = SS / N

En varians i ANOVA terminologi kallas ofta en "Mean Square" (eller MS). I Analys av Varians (ANOVA) beräknas medelkvadrat eller varians genom att dividera SS av df . Således

Variansdelar:

Innan man går igenom detaljerade beräkningar av varians krävs det att man tittar på två av dess komponenter, nämligen:

(a) Systematisk varians, och

(b) Felvariation.

(a) Systematisk varians:

Systematisk varians, i en experimentell uppsättning, är den del av variansen som kan hänföras till manipulation av experimentell variabel dvs oberoende variabel.

Till exempel vill en utredare studera effekten av motivation, dvs verbal belöning och erkännande på akademisk prestation av två lika grupper. Han väljer två homogena grupper och manipulerar verbal belöning till en grupp och erkännande till en annan grupp. Sedan administrerar han ett test till båda grupperna och får sina poäng.

(Här är "Motivation" den oberoende variabeln och "erhållen poäng" är den beroende variabeln). När variansen av alla poäng av två grupper beräknas kallas den som totalvariation ( Vt ). Den del av den totala variansen som kan hänföras till "manipulering av motivation" kan bara betecknas som "systematisk varians". Detta är variansen mellan grupper (eller Vb ).

(b) Felvariation:

Förutom effekten av experimentella variabler finns det också andra källor till variation på grund av externa variabler som kan påverka beroende variabel.

Således är felvariation den del av den totala variansen som kan hänföras till andra okontrollerade variationskällor i ett experiment.

Felvariationen kommer från olika källor, t.ex.

1. Okontrollerade källor till variation som härrör från externa variabler.

2. Inherent variabilitet i försöksenheterna.

3. Slumpmässiga fluktuationer i experimentet.

4. Fel i mätning på grund av brist på

(a) Standard experimentella tekniker;

b) enhetlighet vid administrering

(c) Fysiskt utförande av experiment;

(d) Överliggande emotionella tillstånd hos ämnena, etc.

Symboliskt Felvariation uttrycks som V e . I ovanstående exempel är vi främst inblandade i två variabler, nämligen motivation som oberoende variabel och prestationspoäng som beroende variabel.

Förutom dessa två variabler möter utredaren andra variabler som påverkar den beroende variabeln. Sådana andra variabler kan vara som kön, intelligensnivå, socioekonomisk status, ålder, utbildning etc. som utredaren inte har tagit hand om.

Sådana variabler som inte kontrolleras i en experimentell uppställning och påverkar förekomsten av beroende variabel kallas "externa variabler" eller "irrelevanta variabler".

När dessa variabler styrs i ett experiment kan experimentfelet minimeras. Om dessa externa variabler inte styrs, kommer den att utgöra delen av felvariationen. "Den huvudsakliga funktionen hos experimentell design är att maximera systematisk varians, kontrollera externa varianskällor och minimera felvariationen." Således vill varje utredare minska experimentfelet.

För att minimera felvariationen kan följande sätt användas:

1. Extraneous variabler kan styras av:

en. randomisering,

b. Eliminering,

c. Matchning,

d. Genom att införa ytterligare oberoende variabler eller variabler, och

e. Genom statistisk kontroll.

2. Mätfel kan styras av :

en. Med hjälp av standardiserade experimentella tekniker,

b. Använda pålitliga mätinstrument,

c. Säkra enhetlighet vid administrering eller utförande av experiment,

d. Öka mätets tillförlitlighet genom att ge tydliga och entydiga instruktioner mm

Ovanstående diskussion bekräftar oss att dra slutsatsen att totalvariationen består i två delar,

V t = V b + V e

där V t = totalvariation

V b = mellangruppsvariant (eller systematisk varians)

V e = felavvikelse.

I ANOVA studeras den systematiska variansen mot felavvikelsen med F-test.

Det största värdet på F, desto större är sannolikheten för att den systematiska variansen är större än experimentellt fel (inom gruppvariation eller individuella variationer).

Ett numeriskt exempel kan skilja mellan systematisk varians och felavvikelse.

Exempel 2:

En utredare tilldelar tio studenter slumpmässigt till två grupper (fem i varje grupp) och manipulerar två behandlingar av motivation till dessa två grupper slumpmässigt.

Därefter administrerar utredaren ett test och noterar ner poängen av tio studenter enligt nedan:

Det observeras nu att medelvärdena för två grupper är olika. Det är att vi hittar mellangruppsvarianter. Mellangruppsvarianen ( Vb ) kan beräknas enligt följande. Låt oss anta medel 5 och 7 som två poäng och beräkna variansen av dessa två poäng.

Vi ska sedan beräkna den totala variansen (V t ) genom att ta alla tio poängen för båda grupperna i en kolumn.

V t innehåller alla variationskällor i poängen. Tidigare har vi beräknat V b (eller mellangruppsvariant) till 1, 00.

Låt oss nu beräkna ännu en annan varians genom att beräkna variansen för varje grupp separat och sedan beräkna dem.

Eftersom vi har beräknat avvikelserna separat och sedan genomsnittet, kallar vi denna variant som "inom gruppvariation" eller Vw .

I vårt exempel Vw = 3, 8

Så 4, 8 ( Vt ) = 1, 00 ( Vb ) + 3, 8 ( Vw )

eller Vf = V b + V w [Totalvariation = mellan gruppvariation + inomgruppsvariant].

Grundläggande koncept som möttes med ANOVA:

Innan vi tar upp numeriska problem för att testa nollhypotesen genom att använda ANOVA, borde vi vara bekanta med två begrepp, nämligen a) Summan av kvadrater (SS) och (b) Frihetsgrad ( df ) som vi ofta skulle möta i ANOVA.

(a) Beräkning av SS (Summa av kvadrater):

I ANOVA beräknar vi "mellangrupp varians" (V b ) och "inom gruppvariation" (V w ). Vi beräknar Vb och Vw enligt följande:

där SS b = Mellangrupp summan av kvadrater

och SS W = Inom grupperna summan av kvadrater.

Vi jämför dessa två variationer med ett förhållande som heter F där F = var

Låt oss nu lära oss hur summan av kvadrater (SS) ska beräknas genom två metoder.

Exempel 3:

Beräkna summan av kvadraterna för följande fördelning av poäng.

7, 9, 10, 6, 8

Medel = 40/5 = 8

Metod-II (kort metod):

SS kan beräknas direkt från poängen utan att beräkna medelvärdet och avvikelsen. Detta är känt som kort metod och SS beräknas med hjälp av formeln,

Här behöver vi inte beräkna medelvärdet och avvikelserna för individuella poäng från medelvärdet. Den andra metoden föredras när det finns ett stort antal poäng och medelvärdet innebär decimaler.

Således i ANOVA kan summan av kvadrater beräknas med användning av formeln.

Beräkning av gruppernas antal kvadrater (SS b ) och Inom Grupper Summan av kvadrater (SS W )

Följande två metoder kan användas för att beräkna SS t, SS b och SS w .

Exempel 4:

Två olika behandlingar manipuleras på två grupper av fem ämnen vardera.

Och de uppnådda poängen är följande:

Låt "Grand Mean" (dvs medelvärdet av alla tio poängen) betecknas som M

Nu M = 35 + 25/10 = 60/10 = 6

Beräkning av SS t, SS b och SS w (Long Method):

Beräkning av SS t :

För att beräkna SS t måste vi ta reda på summan av kvadraterna för avvikelsen för var och en av de ovan nämnda tio poängen från den stora medelvärdet (dvs 6)

Beräkning av SS b :

För att beräkna SS b antar vi att varje gruppgrupp är lika med gruppens medelvärde och sedan studerar variansen mellan olika grupper. Här ska vi beräkna summan av kvadraten av avvikelsen för medel från olika grupper från den stora medelvärdet.

Värdet på varje objekt i grupp-I anses vara 7 och värdet av varje gruppgrupp II är 5 och summan av kvadraterna för dessa värden från den stora medelvärdet (M = 6) kommer att beräknas.

Vi kan beräkna SS b i en tabellform som följer:

Beräkning av SS w :

För beräkning av SS W ska vi ta reda på summan av kvadraterna för avvikelsen för olika poäng i en grupp från respektive grupps medelvärde.

Beräkningen av SS W presenteras i tabellform:

Summan av kvadraterna eller SS W = 10 + 6 = 16

I ovanstående beräkning har vi hittat SS t, = 26, SS b, = 10 och SS W = 16

Sålunda SS t = SS b + SS w

Beräkning av SS t, SS b och SS w (Kort metod):

I kort metod kan vi enkelt beräkna SS t SS b och SS W direkt från poängen genom att använda följande tre formler.

I den här korta metoden behöver vi inte beräkna medelvärdena och avvikelserna. Vi kan beräkna olika avvikelser direkt från poängen. I ANOVA, SS t och SS b beräknas vanligen med den korta metoden.

När vi tar upp problem på ANOVA ska vi beräkna SS och SS t med den här korta metoden.

(b) Frihetsgrader (df):

Varje SS blir en varians när den delas av graden av frihet ( df ) tilldelad den. I ANOVA skulle vi komma överens med grader av frihet ( df ). Antalet frihetsgrader för varje varians är en mindre än den V som den är baserad på.

Om N = Antal poäng i alla och K = antal kategorier eller grupper har vi för det allmänna fallet att:

df för totalt SS = (N - 1)

df för mellan grupper SS = (K - 1)

df för inom grupper SS = (N - K)

Också:

(N - 1) = (N - K) + (K - 1)

Variansanalys (ett sätt):

Separat har vi diskuterat om test av betydelse av skillnad mellan medel. Vanligtvis används t-test när vi vill bestämma om de två provmedlen skiljer sig avsevärt.

När vi är oroade för experimenten med två grupper kan vi testa om de två medlen skiljer sig avsevärt genom att använda t-test.

Men t-test är inte tillräckligt när mer än två medel ska jämföras. Till exempel finns det fyra medel på fyra grupper. För att testa om dessa fyra medel skiljer sig avsevärt från varandra måste vi göra sex t-tester.

Om de fyra medlen är M 1, M 2, M 3, M 4 måste vi jämföra skillnaden mellan M 1 och M 2 dvs (M 1 - M 2 ), mellan M 1 och M 3 dvs (M 1 - M 3 ) mellan M 1 och M 4 dvs (M 1 - M 4 ), mellan M 2 och M 3 dvs (M 2 - M 3 ), mellan M 2 och M 4 dvs (M 2 - M 4 ) mellan M 3 och M 4 dvs (M 3 - M 4 ). På samma sätt för 10 innebär vi att vi ska göra 45 t-tester.

För K betyder det att vi måste göra K (K - 1) / 2 t-tester och det skulle innebära mer beräkning och arbetskraft. Men genom att använda F-test genom ANOVA kan vi utvärdera betydelsen av skillnad på tre eller mer än tre medel på en gång.

Förutsättningar som ett F-test vilar på:

Som vanligt är ett statistiskt beslut ljuvt i den utsträckning som vissa antaganden har uppfyllts i de data som används.

I ANOVA finns det vanligtvis fyra angivna krav:

1. Provtagningen inom uppsättningar ska vara slumpmässig. De olika behandlingsgrupperna väljs slumpmässigt från befolkningen.

2. Avvikelserna inom de olika uppsättningarna måste vara ungefär lika stora. Detta hänför sig till antagandet om homogenitet av varians dvs grupperna är homogena i variabilitet.

3. Observationer inom experimentellt homogena uppsättningar bör vara från normalt distribuerad population.

4. Bidrag till totalvariation måste vara additiv.

A. Vi tar upp några exempel och ser hur variansen analyseras när grupper är oberoende:

Exempel 5:

I en experimentell uppsättning tilldelas 16 ämnen slumpmässigt till två grupper av 8 individer vardera. Dessa två grupper behandlades med två olika instruktionsmetoder. Testa betydelsen av skillnaden mellan provmedlen.

Lösning:

Grand Total (dvs totalt av alla 16 poäng) = 104 eller ΣX = 104

Grand medelvärde (M) dvs Medelvärdet av alla 16 poäng = ΣX / N = 104/16 = 6, 5

För beräkning av F-förhållandet måste vi följa stegen nedan:

Steg 1:

Summan av alla 16 poäng är 44 + 60 eller 104; och korrigeringen (C) är följaktligen

Steg 2:

När varje poäng av båda grupperna är kvadrerad och summerad kommer ΣX 2 att vara (ΣX 1 2 + ΣX 2 2 = 260 + 460) 720.

Därefter subtraheras korrektionen 676 från summan genom att använda formeln:

Totalt SS eller SS 1 = ΣX 2 - C = 720 - 676 ​​= 44.

eller, SS t = 3 2 + 4 2 + 5 2 + ...... .. + 9 2 - 676 ​​= 44

Steg 3:

Summan av kvadrater mellan medel SS b finns genom att kvadrera summan av varje kolumn, dividera den första och andra med 8 separat och subtrahera C.

Mellan grupp SS eller SS b

Steg 4:

SS inom (eller SS W ) är skillnaden mellan SS t och SS b . Sålunda SS W = 44-16 = 28.

Steg 5:

Eftersom det finns 16 poäng i alla

Tolkning av F-förhållande:

Variansförhållandet eller F är 16/2 eller 8. Df för mellanorgan är 1 och df för inomgrupper är 14. Inmatning av tabell F med dessa df läser vi i kolumn 1 och rad 14 att 00-nivån är 4, 60 och .01-nivån är 8, 86. Vår beräknade F är signifikant vid .05 nivå.

Men det är inte signifikant på .01-nivå. Eller med andra ord är det observerade värdet på F större än 0, 05 nivåvärde men mindre än 0, 01 nivåvärde. Därför sluts vi att den genomsnittliga skillnaden är signifikant vid .05-nivå men inte signifikant vid .01-nivå av betydelse.

Exempel 6:

(När gruppernas storlek är ojämn) En ränteförsök administreras till 6 pojkar i en yrkesutbildningsklass och till 10 pojkar i en latinsklass.

Är den genomsnittliga skillnaden mellan de två grupperna betydande vid .05-nivån? Testa betydelsen av skillnad genom ANOVA.

Tolkning av F-förhållande:

Variansförhållandet eller F är 135/33 eller 4, 09. Df för mellanorgan är 1 och df för inomgrupper är 14. Inmatning av tabell F med dessa df läser vi i kolumn 1 och rad 14 att .05-nivån är 4, 60 och .01-nivån är 8, 86. Vår beräknade F på 4, 09 når inte riktigt .05-nivån så att vår genomsnittliga skillnad på 6 poäng måste betraktas som inte signifikant. Därför accepteras nollhypotesen.

När det bara finns två sätt att jämföra, som här; F = t 2 eller t = = √F och de två testen (F och t) ger exakt samma resultat. För ovanstående exempel √F = √4.09 = 2.02. Från bordet D fann vi att för 14 df är .05-nivån av betydelse för denna t 2, 14.

Vår t på 2, 02 når inte helt denna nivå och därmed (som F) är inte signifikant.

Exempel 7:

(Mer än två grupper)

Applicera ANOVA för att testa om medelvärdet för fyra grupper skiljer sig väsentligt:

Eftersom det finns 20 poäng i fyra grupper:

df för total SS (eller SS 1 ) = (N - 1) eller 20 - 1 = 19

df för SS b = (K - 1) eller 4-1 = 3

df för SSw = (N - K) eller 20 - 4 = 16

F = 33, 33 / 3, 5 = 9, 52

T = √F = 3, 08

Tolkning av F-förhållande:

Variansförhållandet eller F är 9, 52. Df för mellanorgan är 3 och df för inomgrupper är 16. Inmatning av tabell F med dessa df s vi läser kolumn 3 och rad 16 att .05-nivån är 3, 24 och .01-nivån är 5, 29.

Vår beräknade F på 9, 52 är mer än 5, 29. Därför är F signifikant. Nollhypotesen avvisas med en slutsats att de fyra medlen skiljer sig avsevärt från 01-nivå.

(B) Vi kommer att ta upp ett annat exempel vid analys av varians när samma grupp mäts mer än en gång dvs i fall av korrelerade grupper:

När ett test ges och sedan upprepas kan analys av varians användas för att bestämma om den genomsnittliga förändringen är signifikant, dvs skillnaden mellan medel som erhållits från korrelerade grupper.

Exempel 8:

(För korrelerade grupper)

Fem ämnen ges 4 på varandra följande försök vid ett siffersymboltest, av vilket endast poängen för försök 1 och 4 visas. Är den genomsnittliga vinsten från början till slutprov betydande.

Förfarandena för analys av varians skiljer sig för närvarande på åtminstone två sätt från de metoder som diskuterats ovan.

För det första, eftersom det finns möjlighet att korrelera de poäng som uppnåtts av de 5 personerna i den första och fjärde prövningen, bör de två uppsättningarna av poäng inte i början behandlas som oberoende (slumpmässiga) prover.

För det andra är klassificeringen nu i form av två kriterier: (a) studier och (b) ämnen.

På grund av dessa två kriterier måste den totala SS uppdelas i tre delar:

(a) SS som kan hänföras till försök

(b) SS hänförligt till ämnen; och

(c) En rest SS kallas vanligtvis "interaktion"

Steg i beräkningen av dessa tre variationer kan sammanfattas enligt följande:

Steg 1:

Korrigering (C). Som i föregående förfarande, C = (ΣX) 2 / N. I ovanstående exempel är C 90 2/10 eller 810.

Steg 2:

Summa Summan av Kvadrater. Återigen upprepar beräkningen förfarandet som användes i exempel 1, 2 och 3.

Totalt SS eller SS t = 7 2 + 8 2 + 4 2 + 6 2 + 5 2 + 10 2 + 15 2 + 5 2 + 20 2 + 10 2 - C

= 1040 - 810 eller 230.

Steg 3:

SS mellan provets medel. Det finns två försök med 5 poäng vardera.

Därför,

Steg 4:

SS bland medel för ämnen. En andra "mellan medel" SS krävs för att ta hand om det andra kriteriet för klassificering. Det finns 5 studenter / ämnen och var och en har två försök. Poängen av 1: a och 4: e försöken av varje ämne / elev läggs till för att få 17, 23, 9, 26, 15.

Därav,

Steg 5:

Samverkan SS. Den resterande variationen eller interaktionen är det som finns kvar när de systematiska effekterna av försöksskillnader och skillnader i ämnet har avlägsnats från den totala SS.

Interaktioner mäter tendensen för ämnesprestanda att variera med försök: det mäter de faktorer som inte kan tillskrivas ämnen eller prövningar som handlar ensam, utan snarare att båda agerar tillsammans.

Interaktion uppnås måste helt enkelt genom att subtrahera försök SS plus ämnen SS från total SS.

Således,

Interaktion SS = SS t - (SS- ämnen + SS- försök ) = 230 - (90 + 90) = 50.

Steg 6:

Eftersom det finns 10 poäng i allt har vi (10 - 1) eller 9 df för den totala SS. Två försök mottar 1 df och 5 personer, 4. De återstående 4 df tilldelas interaktion. Regeln är att df för interaktion är produkten av df för de två interaktiva variablerna, här 1 x 4 = 4. I allmänhet är N = totalt antal poäng, r = rader och K = kolumner.

Tolkning av F-förhållanden:

F för försök är 7, 2. Det beräknade värdet av F för försök är mindre än 7, 71 som vi läser i tabell F för .05-punkten när df 1 = 1 och df 2 = 4.

Detta innebär att nollhypotesen med avseende på försök är tålbar och måste accepteras. Beviset är starkt att ingen signifikant förbättring ägde rum från försöks 1 till försök 4.

F för ämnen är 1, 8 och är mycket mindre än .05 punkten på 6, 39 i tabell F för df 1 = 4 och df 2 = 4. Det är uppenbart att ämnen inte är konsekvent bättre än andra.

Det betyder att nollhypotesen med avseende på ämnen är hållbar och måste accepteras.

Tvåvägs ANOVA:

För att undervisa vissa geometriska begrepp om olika metoder för undervisning tillämpas på två eller fler än två grupper av studenter, kallar vi det som en experimentell variabel.

I envägs ANOVA studeras endast en faktor (dvs. en oberoende variabel). Till exempel, när vi vill testa om metoder för undervisning har någon effekt på prestation, studerar vi effekten av en oberoende variabel (dvs. metoder undervisning) på den beroende variabeln (dvs. prestation).

Dataseten differentieras på grundval av endast en experimentell variation. Det finns bara en princip för klassificering, en orsak till att segregera data i uppsättningar.

För detta låt oss välj tre grupper slumpmässigt och tilldela tre olika behandlingar, nämligen metod 1, metod 2 och metod 3 till dessa tre grupper.

I slutet kan prestationspoängen av ämnen i de tre olika grupperna erhållas genom ett lämpligt test.

Då kan vi använda ANOVA för att testa om medelvärdet för dessa tre grupper skiljer sig avsevärt.

I en tvåvägsklassificering eller tvåvägs ANOVA finns det två olika klasser av klassificering. Två experimentella förhållanden tillåts variera från grupp till grupp. I de psykologiska laboratorierna kan olika artificiella flygfält landningsremsor, var och en med ett annat mönster av markeringar, ses genom en diffusionsskärm för att stimulera syn genom dimma vid olika nivåer opaqueness.

I ett pedagogiskt problem kan fyra metoder för att undervisa ett visst geometrisk koncept tillämpas av fem olika lärare, var och en som använder var och en av de fyra metoderna. Det skulle därför finnas 20 kombinationer av lärare och metod.

Följande tabell kan föregå dig ytterligare:

I ett exempel som citeras nedan studeras effekterna av tre instruktionsmetoder på prestationspoäng. Men det förväntas att undervisningsmetoderna kommer att ha annan effekt beroende på nivån på socioekonomisk status (SES).

Så vi kan utforma en studie där effekten av två variabler, dvs effekt av undervisningsmetoder och effekt av socioekonomiska nivåer (SES) kan studeras samtidigt. I denna design kan vi också studera interaktionseffekten. För sådana konstruktioner används teknikerna för tvåvägs ANOVA.

Exempel 9:

Sex grupper av studenter (fem studenter i vardera) har valts slumpmässigt i sex behandlingsförhållanden. Undersök effekten av två faktorer, nämligen faktor A (socioekonomisk status) och faktor B (metoder för instruktion) för följande exempel.

Lösning:

I det ovanstående exemplet har vi tagit två nivåer av SES viz., Hög SES i A 1 kategori och Låg SES i A 2 kategori och tre metoder för instruktion, B 1 (föreläsning), B 2 (diskussion) och B 3 spelväg).

Det totala antalet behandlingar i experimentet kommer att vara 2 x 3 = 6. Här n = 5 och det totala antalet observationer är N = 5 x 6 = 30.

Stor summa, ΣX = 30 + 50 + 40 + 25 + 45 + 35 = 225.

Sex olika behandlingsgrupper kan presenteras i ett "Interaktionstabell", enligt nedan:

För tre instruktionsmetoder finns tre kolumner (... c = 3). Rödetallarna används för beräkning av SS för A (SES). Kolumn Totals används för beräkning av SS för B (instruktionsmetoder).

Steg i beräkningen av avvikelser kan sammanfattas enligt följande:

Steg 1:

Steg 2:

Totalt SS eller SS t = ΣX 2 - C. Här är alla trettio poängen kvadrade och tillsatta och C subtraheras.

SS t = 5 2 + 7 2 + ......... + 10 2 + 7 2 - 1687, 5 = 1919 - 1687, 5 = 231, 5

Steg 3:

Mellan grupp SS eller SS b = Totalt (ΣX) 2 / n för alla sex behandlingsförhållanden - C.

Steg 4:

Inom grupper SS eller SS W = SS t - SS b = 231, 5 - 87, 5 = 144

Steg 5:

Nu kan "Mellan grupp SS" eller SS b 87, 5 delas upp i tre delar, dvs. SS A, SS B och SS AB dvs SS b = SS A + SS B + SS AB

Där SS A = SS av faktor A (SES) som genererar från avvikelsen av A 1 och A 2 betyder från medelvärdet av de totala poängen.

SS B = SS av faktor B (metoder) genererade från avvikelserna av B 1, B 2 och B 3 betyder från medelvärdet av de totala poängen.

Steg 6:

Frihetsgrader för olika SS

I vårt problem har vi 6 grupper

.˙. K = 6

n = 5 och N = 6 xn = 6 x 5 = 30.

I interaktionstabellen finns två rader och tre kolumner

.˙. r = 2 och C = 3.

Uppdelning av df kan göras enligt följande:

df för SS t = N - 1 = 30 - 1 eller 29

df för SS b = K - 1 = 6 - 1 eller 5

df för SS W = K (n - 1) = 6 x 4 eller 24

Df Fox SS B, kan delas upp i tre delar:

(i) df för SSA = r - 1 = 2 - 1 eller 1

(ii) df för SSB = c - 1 = 3 - 1 eller 2

(iii) df för SS AB = (r - 1) (C - 1) = 1 x 2 eller 2

Nu kan vi ange ovanstående beräkning i en tvåvägs ANOVA Sammanfattningstabell:

Tolkning av F-förhållande:

(a) F för SES eller F för A

F = MS A / MS W = 7, 5 / 6, 0 = 1, 25

(.052 är mindre än en)

Som F på 1, 25 <4, 26 vid .05 nivå behåller vi nollhypotesen att de två grupperna som valts slumpmässigt inte skiljer sig från prestationspoäng på grundval av socioekonomisk status.

Som F av 6, 67> 5, 6 vid .01-nivå, avvisar vi nollhypotesen. Vi drar slutsatsen att de tre undervisningsmetoderna påverkar prestationspoängen annorlunda.

Som F på 0, 00 <1 behåller vi nollhypotesen. Vi accepterar nollhypotesen om ingen interaktion. Vi drar slutsatsen att effektiviteten av metoder inte beror på nivån på socioekonomisk status.