Bestämning av testets tillförlitlighet: 4 Metoder

Det finns fyra procedurer gemensamt för att beräkna pålitlighetskoefficienten (ibland kallad självkorrelationen) för ett test. Dessa är: 1. Test-Retest (Repetition) 2. Alternativa eller parallella former 3. Split-Half Technique 4. Rational Equivalence.

1. Test-Retest Method:

För att uppskatta tillförlitlighet med hjälp av test-retest-metoden administreras samma test två gånger till samma grupp elever med ett givet tidsintervall mellan de två administrationerna av testet.

De resulterande testresultaten bc korreleras och denna korrelationskoefficient ger ett mått på stabilitet, det vill säga det indikerar hur stabil testresultaten är över en tidsperiod. Så är det annars känt som ett mått på stabilitet.

Uppskattningen av tillförlitligheten i detta fall varierar beroende på hur länge tidsintervallet är tillåtet mellan de två administrationerna. Produktmomentmetoden för korrelation är en signifikant metod för att bedöma tillförlitligheten hos två uppsättningar av poäng.

Således indikerar en hög korrelation mellan två uppsättningar av poäng att testet är tillförlitligt. Medel, det visar att de poäng som erhölls vid första administrationen liknar de poäng som erhölls vid andra administrering av samma test.

I denna metod spelar tidsintervallet en viktig roll. Om det är för litet, säg en dag eller två, kommer konsekvensen av resultaten att påverkas av överföringseffekten, dvs eleverna kommer ihåg några av resultaten från den första administrationen till den andra.

Om tidsintervallet är långt, sägs ett år, kommer resultaten inte bara att påverkas av ojämlikhet av testprocedurer och villkor, men också av de faktiska förändringarna i eleverna under den tidsperioden.

Tidsavståndet för retest ska inte vara längre än sex månader. Tidsspridning vid retesting två veckor (2 veckor) ger ett exakt index för pålitlighet.

fördelar:

Självkorrelation eller test-retest-metod, för att bedöma tillförlitlighetskoefficient används vanligtvis. Det är värd att använda i olika situationer bekvämt. Ett test med en tillräcklig längd kan användas efter ett intervall av många dagar mellan successiv testning.

nackdelar:

1. Om testet upprepas omedelbart kommer många ämnen att återkalla sina första svar och spendera tid på nytt material, vilket tenderar att öka sina poäng, ibland med en hel del.

2. Förutom omedelbara minneseffekter kommer praktiken och det förtroende som framkallas av förtrogenhet med materialet nästan säkert att påverka resultatet när testet tas för en andra gång.

3. Säkerhetsindex som erhållits är mindre noggrant.

4. Om intervallet mellan testerna är ganska långt (mer än sex månader) påverkar tillväxtfaktorn och löptiden poängen och tenderar att sänka ner pålitlighetsindexet.

5. Om testet upprepas omedelbart eller efter ett litet tidsintervall kan det finnas möjlighet att överföra effekt / överföringseffekt / minne / övningseffekt.

6. Vid upprepning av samma test, på samma grupp andra gången, gör eleverna ointresserade och sålunda tycker de inte om att delta helhjärtat.

7. Ibland upprätthålls enhetlighet inte vilket också påverkar testresultatet.

8. Risken att diskutera några frågor efter den första administreringen, vilket kan öka poängen vid andra administrering som påverkar tillförlitligheten.

2. Alternativ eller parallellformningsmetod:

Beräkning av tillförlitlighet med hjälp av motsvarande formmetod innebär användning av två olika men likvärdiga former av testet. Parallell formens tillförlitlighet är också känd som alternativ formbarhet eller tillförlitlig formbarhet eller jämförbar formtillförlitlighet.

I denna metod används två parallella eller likvärdiga former av ett test. Med parallella former menar vi att blanketterna motsvarar innehållet, målen, formatet, svårighetsgraden och det diskriminerande värdet av objekt, testens längd etc.

Parallellprov har lika medelvärden, avvikelser och interrelationer mellan föremål. Det vill säga, två parallella former måste vara homogena eller liknande i alla avseenden, men inte en dubblering av testobjekt. Låt de två formerna vara Form A och Form B.

Tillförlitningskoefficienten kan ses som koefficientkorrelationen mellan poängen på två ekvivalenta testformer. De två likvärdiga formerna är möjligen likartade i innehåll, grad, testade mentala processer och svårighetsgrad och i andra aspekter.

En form av testet administreras på eleverna och vid omedelbar avslutning levereras en annan form av test till samma grupp. De erhållna poängen är korrelerade vilket ger uppskattningen av tillförlitlighet. Sålunda kallas tillförlitligheten som ekvivalens.

Gulliksen 1950: har definierat parallellprov då tester har lika medel, lika varians och lika interrelations.

Guilford: Alternativformmetoden anger både ekvivalens av innehåll och stabilitet i prestanda.

fördelar:

Denna procedur har vissa fördelar jämfört med test-retest-metoden:

1. Här upprepas inte samma test.

2. Minne, övning, överföringseffekter och återkallningsfaktorer minimeras och de påverkar inte poängen.

3. Tillförlitlighetskoefficienten som erhållits med denna metod är ett mått på både temporal stabilitet och konsistens av svaret på olika objektprover eller testformer. Således kombinerar denna metod två typer av tillförlitlighet.

4. Användbar för pålitligheten av prestationstester.

5. Denna metod är en av de lämpliga metoderna för att bestämma tillförlitligheten hos pedagogiska och psykologiska tester.

begränsningar:

1. Det är svårt att ha två parallella former av ett test. I vissa situationer (dvs i Rorschach) är det nästan omöjligt.

2. När testen inte är exakt lika med innehållsvanskel, längd kan jämförelsen mellan två uppsättningar av poäng som erhållits från dessa tester leda till felaktiga beslut.

3. Övnings- och överföringsfaktorer kan inte kontrolleras helt.

4. Dessutom skapar administrering av två former samtidigt tristess. Det är därför som människor föredrar sådana metoder där endast en administrering av testet är nödvändigt.

5. Testförhållandena under administrering av formuläret B kan inte vara desamma. Dessutom kan testiklarna inte ligga i samma fysiska, mentala eller emotionella tillstånd vid båda administreringstiderna.

6. Testresultat av andra form av testet är generellt höga.

Även om svåra, försiktigt och försiktigt konstruerade parallella former skulle ge oss rimligen en tillfredsställande mått på tillförlitlighet. För välgjorda standardiserade tester är parallellformmetoden vanligtvis det mest tillfredsställande sättet att bestämma tillförlitligheten.

3. Split-Half Method eller Subdivided Test Method:

Split-half-metoden är en förbättring jämfört med de tidigare två metoderna, och det innefattar både egenskaperna för stabilitet och ekvivalens. De ovan beskrivna två metoderna för uppskattning av tillförlitlighet verkar ibland svårt.

Det kan inte vara möjligt att använda samma test två gånger och att få en likvärdig testform. För att övervinna dessa svårigheter och för att minska minneseffekten såväl som att ekonomera testet är det önskvärt att uppskatta tillförlitlighet genom en enda administrering av testet.

I denna metod administreras testet en gång på provet och det är den mest lämpliga metoden för homogena test. Denna metod ger den interna konsistensen av en testresultat.

Alla provets föremål ordnas i allmänhet i ökande svårighetsgrad och administreras en gång på prov. Efter administrering av testet är det uppdelat i två jämförbara eller liknande eller lika delar eller halvor.

Poängerna är ordnade eller är gjorda i två uppsättningar erhållna från udda antal objekt och jämnt antal objekt separat. Exempelvis administreras ett test på 100 objekt.

Antalet enskilda poäng baserade på 50 stycken ojämna nummer som 1, 3, 5, .. 99 och poäng baserat på jämnt antal 2, 4, 6 ... 10 ordnas separat. Delvis är 'A' udda nummer tilldelade och del 'B' kommer att bestå av jämnt antal poster.

Efter att ha fått två poäng på udda och jämnt antal testämnen beräknas koefficienten för korrelation. Det är verkligen en korrelation mellan två ekvivalenta halvor av poäng som erhållits i ett sittande. För att uppskatta tillförlitlighet används Spearman-Brown Prophecy-formel.

Spearman-Brown formel ges av:

där r 11 = hela testets tillförlitlighet.

r 11/22 = korrelationskoefficienten mellan två halvtester.

Exempel 1:

Ett test innehåller 100 artiklar. Alla dessa saker är ordnade i svårighetsgrad som man går från den första till den hundrade. Eleverna svarar på provet och testet görs.

Poängen erhålls av eleverna i udda antal objekt och jämnt antal objekt sammanfattas separat. Korrelationskoefficienten som finns mellan dessa två uppsättningar av poäng är 0, 8.

Tillförlitligheten av hela testet (eller)

Medan man använder denna formel bör man komma ihåg att variationen av udda och jämn halvor ska vara lika, dvs.

Om det inte är möjligt kan Flanagan och Rulons formler användas. Dessa formler är enklare och innebär inte beräkning av korrelationskoefficient mellan två halvor.

fördelar:

1. Här upprepar vi inte testet eller använder den parallella formen och testen testas därför inte två gånger. Som sådan är överföringseffekten eller övningseffekten inte där.

2. I denna metod minimeras fluktuationerna hos individen, på grund av miljö- eller fysiska förhållanden.

3. På grund av en enda administrering av testet stör de dagliga funktionerna och problemen inte.

4. Svårigheten att konstruera parallella testformer elimineras.

begränsningar:

1. Ett test kan delas in i två lika halvor på ett antal sätt och korrelationskoefficienten i varje fall kan vara annorlunda.

2. Denna metod kan inte användas för att bedöma tillförlitligheten av hastighetsprov.

3. Eftersom läsningen administreras en gång kan chansfel på samma sätt påverka poängen på de två halvorna och därigenom tendera att göra tillförlitningskoefficienten för hög.

4. Denna metod kan inte användas vid strömtester och heterogena tester.

Trots alla dessa begränsningar betraktas halvdelmetoden som det bästa av alla metoder för att mäta testtillförlitligheten, eftersom data för bestämning av tillförlitlighet erhålls vid tillfället och därigenom minskar tid, arbete och svårigheter som är involverade vid sekunden eller upprepad administrering.

4. Metod för rationell ekvivalens:

Denna metod kallas även "Kuder-Richardson Reliability" eller "Inter-item Consistency". Det är en metod baserad på enstaka administrering. Det är baserat på konsistens av svar på alla artiklar.

Det vanligaste sättet att hitta inter-item konsistens är genom formeln utvecklad av Kuder och Richardson (1937). Denna metod möjliggör att beräkna interkorrelationen mellan punkterna i testet och korrelationen för varje objekt med alla provets föremål. J. Cronbach kallade den som intern koefficient.

I denna metod antas att alla föremål har samma eller lika svårighetsvärde, korrelationen mellan föremålen är lika, alla föremål mäter i huvudsak samma förmåga och testet är homogent i naturen.

Liksom split-half-metoden ger denna metod också en mått av intern konsistens.

Den mest populära formeln är Kuder-Richardson, dvs KR-21, som ges nedan:

q = - p

p = 1 - q

Ett exempel hjälper oss att beräkna p och q.

Exempel 2:

60 studenter visade ett test och av dem har 40 studenter gett ett korrekt svar på ett visst försök.

p = 40/60 = 2/3

Det betyder att en del av eleverna har gett korrekt svar på ett visst försök. I vilka 20 elever har gett felaktigt svar på det objektet.

Således är q = 20/60 eller 1 - 40/60

För varje punkt ska vi ta reda på värdet på p och q summeras pq över alla objekt för att få Σpq. Multiplicera p och q för varje objekt och summa för alla objekt. Detta ger Σpq.

fördelar:

1. Denna koefficient ger några indikationer på hur internt konsekvent eller homogent provets föremål är.

2. Rationell ekvivalens överstiger den delade halvtekniken i vissa teoretiska aspekter, men den faktiska skillnaden i pålitlighetskoefficienter som hittats av de två metoderna är ofta försumbar.

3. Split-half-metoden mäter helt enkelt ekvivalensen, men rationell ekvivalensmetod mäter både ekvivalens och homogenitet.

4. Ekonomisk metod som testet administreras en gång.

5. Det kräver inte heller administrering av två likvärdiga testformer, eller det krävs att man delar upp testen i två lika stora halvor.

begränsningar:

1. Den koefficient som erhålles med denna metod är i allmänhet något mindre än koefficienterna erhållna med andra metoder.

2. Om testresultaten inte är mycket homogena kommer denna metod att ge lägre tillförlitningskoefficient.

3. Kuder-Richardson och split-half-metoden är inte lämpliga för hastighetsprov.

4. Olika KR-formel ger olika pålitlighet index.