Konstruktion av ett standardiserat test: 4 steg

Denna artikel lyfter fram de fyra huvudsakliga stegen som är inblandade i konstruktionen av ett standardiserat test. Stegen är: 1. Planering 2. Förbereda provet 3. Försök ut ur testet 4. Utvärdera testet.

Steg # 1. Planering:

"Testplanering omfattar alla de varierade operationer som går in i att producera testen. Det innebär inte bara att man använder en skiss eller tabell som anger innehållet eller alternativen som ska täckas av testet, men det måste också vara noggrann uppmärksamhet på varuproblem, typer av föremål, riktning till examinator mm " (Lindquist )

För standardiserat test krävs en systematisk och tillfredsställande planering. Enligt Ross anser "bra test inte bara hända, inte heller de är resultatet av några ögonblick av hög inspiration och upphöjning."

Det är testkonstruktören som på alla sätt är ansvarig för att ge en korrekt form till sina testartiklar och som konstruerar testet med all vård och uppriktighet.

Det omfattar följande aktiviteter:

1. Fastställande av målen / syftet.

2. Bestämning av vikt för olika instruktionsmål.

3. Bestämning av vikten till olika innehållsområden.

4. Bestämning av objekttyper som ska ingå.

5. Förberedelse av tabellen med specifikation-Blåtryck.

6. Att fatta beslut om dess mekaniska aspekter som tidslängd, teststorlek, totala betyg, tryckning, bokstorlek etc.

7. Att ge instruktioner för testresultat och dess administreringsprocedur.

8. Vikt för olika svårighetsgrader av frågorna ska fastställas.

(De aktiviteter som anges i punkterna 1 till 5 behöver ytterligare förtydligande)

1. Fastställande av målen / syftet:

Före provets konstruktion är det nödvändigt att dess föremål formuleras. Uppmärksamhet bör riktas mot testförmågan att effektivt mäta i vilken utsträckning målen för utbildning har uppnåtts. Målen för utbildning kan klassificeras på många sätt. Men vad som än är klassificeringen, måste läroplanen medföra de förändringar i barnet som planeras för mål.

Testet ska utformas på ett sådant sätt att det kan påpeka i vilken utsträckning målen, för att få förändringar i barnets beteende, uppnåtts genom läroplanen som de lär dem.

Uppmärksamheten bör också riktas mot det syfte som testet är nödvändigt för att tjäna. Om provet är konstruerat för att klassificera eleverna ska man då i sin konstruktion uppmärksamma att man får betala för att kunna klassificera sig. Men om dess syfte är diagnostiskt bör det vara så konstruerat att det kan diagnostisera de enskilda svårigheterna hos eleverna.

2. Bestämning av vikten av olika inlärningsmål:

Det viktigaste steget i planeringen av ett test är att identifiera de pedagogiska målen. Varje ämne har en annan uppsättning instruktionsmål. Inom ämnena Vetenskap, samhällsvetenskap och matematik kategoriseras de viktigaste målen som kunskap, förståelse, tillämpning och skicklighet, medan de viktigaste målen i språk kategoriseras som kunskap, förståelse och uttryck.

Kunskapsmål anses vara den lägsta nivån av lärande medan förståelse, tillämpning av kunskaper inom vetenskap eller beteendevetenskap anses vara högre nivå av lärande.

3. Bestämning av vikt på olika innehållsområden:

Den viktigaste aktiviteten vid uppförandet av ett prestationstest är att ange en översikt över innehållsområdet. Det indikerar det område där studenterna förväntas visa sin prestation. Det bidrar till att få ett representativt urval av hela innehållsområdet.

Det förhindrar också repetition eller utelämnande av någon enhet. Nu är frågan uppenbar hur mycket vikt bör ges till vilken enhet. Vissa experter säger att det bör avgöras av den berörda läraren, som håller huvudrollen i åtanke.

Andra säger att det bör beslutas enligt det område som omfattas av ämnet i textboken. Generellt bestäms det på grundval av sidorna i ämnet, totala sidor i boken och antalet poster som ska förberedas.

4. Bestämning av artikeltyper:

Föremål som används i testkonstruktionen kan i stor utsträckning delas in i två typer som objektiv objekt och uppsatsartiklar. För vissa instruktionsändamål är objektivtyperna mest effektiva, medan för andra är frågeställningarna tillfredsställande.

Lämpliga objekttyper ska väljas enligt de lärandemål som ska mätas. Till exempel, när resultatet är skrivet, är leverans typ objekt användbara.

Om utfallet identifierar ett korrekt svar valstyper eller genomsökningstyper är användbara. Så det ska beslutas och planeras i detta skede.

LA = Långt svar

SA = Kort svar

VSA = Mycket kort svar

5. Framställning av "BLUEPRINT" eller tredimensionell diagram:

Förbereda blåtryck eller tabell med specifikation i tredimensionellt diagraminnehåll, objekt och typ av objekt, vilket anger antalet objekt i varje cell eller fack. Det är bara ett ramarbete som ger en tydlig bild av testets utformning och fungerar som en guide.

De tre dimensionerna av ritningen består av innehållsområden i horisontella rader och mål och former av frågor i vertikala kolumner. När ritningen är klar kan pappers setter skriva / välj objekten och förbereda frågeformuläret.

Ett provformat för ritningen ges nedan:

Notera:

Vänligen sätt in antalet frågor inom parentes och märkena utanför parenteserna.

E = Essay typ fråga, SA = Kort svar typ, VS A = Mycket kort svar.

Steg # 2. Förbereda testet:

Nästa steg efter slutförandet av ritningen skriver lämpliga frågor i enlighet med de breda parametrarna som anges i ritningen. Man borde ta ett litet block av ritningen åt gången och skriva ut de nödvändiga frågorna.

För varje block av ritning som fylls i måste således frågor skrivas en efter en. När det är klart, har vi alla frågor som uppfyller de nödvändiga kraven som anges i ritningen.

Standardiserat testskrivning behöver alla typer av brister och överväganden. Tillräcklig tid måste ägnas åt att ge tankar om vikt för innehållet och områden som ska täckas.

I det här steget ska vi diskutera de specifika reglerna för konstruktion av olika typer av testobjekt.

I detta skede måste vi förbereda oss:

(i) Testpunkterna.

(ii) Anvisningarna för att testa föremål.

(iii) Anvisningarna för administrering.

(iv) Anvisningarna för poäng.

(v) Ett frågeformulär för analys.

(i) Beredning av testpunkter:

Förberedelse av provämnen är den viktigaste uppgiften i förberedelsesteget. Därför måste man ta hand om att förbereda ett testobjekt. Konstruktion av provvaror är inte så lätt. Det är uppgift som testspecialister och experter. En erfaren lärare som är tillräckligt utbildad i provkonstruktion kan förbereda lämpliga testämnen.

Det finns vissa regler och riktlinjer för konstruktion av testartiklar. För detta måste man ha tillgång till alla dessa riktlinjer och också tillgång till målets taxonomi. I allmänhet måste testobjekten vara tydliga, omfattande och fria från tvetydighet.

Språket i objekten ska väljas så att innehållet och inte formuläret av objekten bestämmer svaret. De föremål som har gömda betydelser bör inte ingå. Uttalandet av artiklarna ska inte slumpmässigt ges från böckerna. Alla objekt av en viss typ ska placeras ihop.

Ordförrådet som används i objekten ska vara enkelt nog att förstås av alla. En vanlig sekvens i mönstret av korrekta svar bör undvikas. Det kan finnas mer än en typ av testämnen i testet.

Testet måste utsättas för kritisk revision med tidsintervaller. Ofta är det önskvärt att i provet ingår fler artiklar än det nummer som faktiskt behövs. I det preliminära förslaget är det bättre om det dubbla antalet poster som behövs ingår.

Vid konstruktionen av testobjekten bör endast dessa artiklar inte inkluderas som betonar minnet eller erkännandet. Objekten ska vara så utvalda att eleverna lär sig vanan att korrelera sin kunskap med sitt verkliga liv.

Efter att provet är inramat måste de ordnas ordentligt och monteras i ett test. Om olika former av testämnen används, bör de helst grupperas formformigt. Dessutom ska lätta föremål ges en plats i början, föremålen med medelhårsvärdet i mitten och svåra föremål i slutet.

Testpunkterna kan ordnas i enlighet med förväntad svårighet. Naturligtvis finns det olika sätt att sammanställa frågorna och vi kan sammanställa de frågor som passar till vårt syfte och bekvämlighet med tolkning.

(ii) Förberedelse av riktning till testpunkter:

Detta är den mest försummade aspekten av testkonstruktionen. I allmänhet uppmärksammar alla byggandet av testartiklar. Så testverktygna bifogar inte riktningar med testobjekten. Men testartikelns giltighet och tillförlitlighet beror i stor utsträckning på instruktionerna för testet.

NE Gronlund har föreslagit att provtagaren ska ge tydlig riktning om:

1. Syftet med provningen.

2. Tidsfristen för att svara.

3. Grunderna för att svara.

4. Förfarandet för inspelning av svar.

5. Metoderna att hantera gissning.

Ibland är anvisningarna för att testa föremål så tvetydiga att barnet inte kan följa dem och som sådan svarar han på föremålen på ett sätt som han anser lämpligt vid det ögonblicket eller helt enkelt går vidare till nästa sak och lämnar det obesvarat.

På grund av bristande klarhet i anvisningarna kommer barnet att reagera annorlunda vid olika tidpunkter vilket skulle sänka testets tillförlitlighet.

iii) Förberedelse av riktlinjer för administration:

En klar och detaljerad inriktning på hur testet ska administreras ska tillhandahållas. Villkoren för vilka testet ska administreras, när testet ska administreras (antingen i mitten av sessionen eller i slutet av sessionen etc.), inom vilken tidsgräns det ska administreras etc. är att anges tydligt.

Om testet har separata sektioner, anges tidsgränser för att täcka varje avsnitt. De material som krävs (om några) för provet, såsom grafpapper, Logaritmbord etc. måste nämnas.

Anvisningarna måste tydligt ange vilka försiktighetsåtgärder administratören ska vid tidpunkten för administrationen. Så, lämplig och tydlig riktning för testadministration måste framställas.

(iv) Förberedelse av riktning för scoring:

För att underlätta objektivitet i scoring ska "scoring keys" tillhandahållas. Scoringsnyckel är en förberedd lista över svar på en given uppsättning objektiv frågor. En scoringsnyckel är upprättad genom att lista seriellt nyckeln (eller rätt svar) på varje fråga mot varje objekt.

För korta svar typ frågor och uppsats typ frågor markeringssystem ska förberedas. Sådana poängnycklar och märkningssystem måste vara noggrant förberedda. De hjälper som guider när testet görs och de säkerställer objektivitet i poäng.

(v) Framställning av en frågeställande analysschema:

Ett frågeformulär kan analyseras där varje fråga analyseras. Detta diagram visar innehållsområdet som frågan täcker, målet (med specifikation) som den avser att mäta, dess typ, betygsskick tilldelas, förväntad svårighetsnivå och tid som tas för att svara på den.

Det här diagrammet analyserar inte bara objekten utan ger oss också en bild av innehållets innehåll, mål, typ av fråga och täckning av olika svårighetsgrader etc. Dessutom ger vi oss en uppfattning om den totala tid som ska tas för att ta testa. Detta diagram hjälper oss att kontrollera om testet har utarbetats enligt ritningen eller inte.

Steg # 3. Försök ut ur testet:

Eftersom testet utarbetas av en grupp personer och experter, kan det inte vara helt felfri. All standardisering kräver därför att en provningsform av testet och dess testning över en provpopulation utarbetas.

Syftet med försöket är följande:

1. Att identifiera de defekta eller tvetydiga föremålen.

2. Att upptäcka svagheten i testadministrationsmekanismen.

3. Att identifiera de icke-fungerande eller oförmögna distraktorerna vid multipelvalstester.

4. Att tillhandahålla data för att bestämma svårighetsgraden för objekt.

5. Att tillhandahålla data för att bestämma objektets diskriminerande värde.

6. För att bestämma antalet objekt som ska ingå i den slutliga formen av testet.

7. För att bestämma tidsgränsen för den slutliga blanketten.

Huvudsyftet med att försöka är att välja de bra artiklarna och avvisa de stackars föremålen.

Try-out görs i tre steg:

1. Preliminär tryout.

2. Rätt försök.

3. Slutlig försök.

1. Preliminär försök:

Preliminär tryout görs individuellt för att förbättra och modifiera språksvårigheterna och tvetydigheten hos objekten. Denna utprövning sker på 10 eller 15 personer. Objektets bearbetbarhet observeras. På grundval av observation och individs reaktioner kan föremålen förbättras och modifieras samtidigt. Således är det ursprungliga utkastet upprättat och trycks eller cyklostylerat för korrekt provning eller grupputprövning.

2. Rätt Tryout:

Den korrekta utprövningen sker på en grupp på minst 40 studenter / individer. Syftet är att välja bra artiklar för testet och att avvisa dåliga föremål.

I detta steg ingår följande aktiviteter:

(A) Artikelanalys.

(B) Förbereda slutprov av testet.

(A) Artikelanalys:

Ett test ska varken vara för lätt eller för svårt; och varje objekt ska diskriminera validitet bland de höga och låga studenterna. Förfarandet som används för att bedöma kvaliteten på ett objekt kallas objektanalys.

Artikelanalysförfarandet följer följande steg:

1. Testpappren ska ordnas från högsta till lägsta poäng.

2. Välj 27% testpapper från högsta och 27% från lägsta änden. Till exempel om test ges på 120 studenter väljer du 32 testpapper från högsta slutet och 32 testpapper från den lägsta änden.

3. Förvara de andra testpapper som de inte är nödvändiga för i analysen.

4. Tabulera antalet elever i den övre och nedre gruppen som valde varje alternativ för varje testobjekt. Detta kan göras på baksidan av testpapperet eller ett separat provkortsnummer kan användas enligt tabell (14.1).

Som vi vet beror kvaliteten eller fördelen av ett test på de enskilda objekten som utgör den. Så, bara de objekt som passar till vårt syfte ska behållas. Artikelanalys är en integrerad del av ett tests tillförlitlighet och giltighet.

Värdet av ett objekt bedöms av tre huvudvinklar, nämligen:

(i) Problemets index för produkten,

(ii) Artikelns diskriminerande kraft,

(iii) Effekt av distraktorer.

En hypotetisk illustration:

Om ett test administreras på 120 studenter är 27% testpapper från högsta slutet 32 och 27% testpapper från lägsta änden är 32.

(i) Problemets produktindex / Problem med produkten:

Objektets svårighetsindex är en viktig del av provkonstruktionen. Om en viss sak är för lätt svarar alla eleverna. Om alla elever får lika många poäng besegras själva testets syfte. Om ett föremål inte kan besvaras av någon test, är föremålet antingen för svårt eller felkonstruerat. Vad är användningen av att ha sådana saker i ett test? Så det är uppenbart att alltför lätta och alltför svåra föremål ska helt kasseras.

Det är önskvärt att objekt med medelhög nivå måste ingå i ett test. Vid analysen som gjordes vid utprövningssteget behåller testarna i allmänhet föremål i intervallet 16% till 84% svårighetsgrad.

Artikel svårighet (ID) beräknas med hjälp av formeln.

ID = R / NX 100

där R = Antal test som svarar korrekt.

N = Totalt antal tester försökte objektet.

I vårt exempel på 64 studenter från både övre och nedre grupper har 40 studenter svarat på objektet korrekt och 60 studenter har provat objektet. Då beräknas varuproblemet som

Varuproblem = 40/60 x 100 = 66, 67

Som det är vanligt att följa 16% till 84% regel för att överväga varuproblemet, ligger vårt beräknade ID inom detta intervall. Därför har föremålet lämplig svårighetsgrad. Det betyder att om ett föremål har ID mer än 84% då är det ett för enkelt föremål, om det är mindre än 16% då är föremålet ett för svårt föremål.

ii) Artikelns diskriminerande kraft:

Den diskriminerande effekten (dvs. giltighetsindex) för ett objekt hänvisar till graden till vilken ett visst objekt diskriminerar bland elever som skiljer sig kraftigt i funktionen som mäts av testet som helhet.

En uppskattning av ett objekts diskrimineringsindex kan erhållas med formeln:

var

RU = Antal korrekta svar från den övre gruppen.

RL = Antal korrekta svar från den lägre gruppen.

N = Totalt Antal elever som försökte dem.

I vårt exempel svarade 30 studenter från den övre gruppen korrekt och 10 från den lägre gruppen svarade objektet korrekt.

Således är _RU = 30, _Rl = 10 och N = 60

Diskriminerande index = (30-10) / (60/2) = 20 / 30, 67

Ett diskrimineringsindex uttrycks vanligen som ett decimaltal. Om det har ett positivt värde har föremålet positiv diskriminering. Det innebär att en större andel av de mer kunniga studenterna än fattiga studenter fick objektet korrekt. Om värdet är noll har objektet nolldiskriminering.

Detta kan inträffa:

jag. Eftersom objektet är för lätt eller för hårt; eller

ii. Eftersom det är tvetydigt.

Om mer dåliga elever än bra elever får objektet rätt skulle man få en negativ diskriminering. Med ett litet antal studenter kan detta vara ett chansresultat; men det kan indikera att föremålet är tvetydigt eller miskytat.

Objektet som har noll eller negativt diskrimineringsindex måste kasseras eller revideras. I allmänhet är ju högre diskrimineringsindex, ju bättre objektet.

(iii) Effekt av distraktorer:

En distraktor anses vara en bra distraherare när det lockar fler elever från den lägre gruppen än den övre gruppen.

Exempel:

Antag totalt 40 svarböcker (både i övre och nedre gruppen, 20 i vardera).

Nedan ges en hypotetisk illustration, där asterisk anger rätt svar:

I illustrationen är alternativ A och C effektiva i den meningen att de lockar fler elever från den lägre gruppen än från den övre gruppen. Men alternativ D är en dålig distraktor eftersom det lockar ingen och är därför värdelös. Föremålet har bara för alternativ, och chanserna för framgång med bara gissningar förbättras. Alternativ E är också dålig eftersom det lockar en högre andel av de bra än dåliga eleverna.

Artikelförfattaren måste fråga sig:

"Varför blev de ljusare studenterna till E? Var det på grund av tvetydighet? Var det för att det fanns två lika rätt svar? "Kortfattat bör det här objektet revideras genom att ändra alternativ D och E.

(B) Förbereda slutprov av testet:

Efter objektanalys behålls endast bra föremål med lämplig svårighetsgrad och med tillfredsställande diskriminering, och dessa är slutprovet. Följaktligen väljs bra artiklar ur det stora antalet varor.

Vissa av dem kan ändras och det önskade antalet objekt är valt för det slutgiltiga utkastet enligt blåtrycket. Artiklar är ordnade i svårighetsgrad i det slutliga utkastet. Den tid som krävs för testet bestäms. Nu administreras testet till ett stort representativt prov och testpappren görs.

3. Slutlig försök:

Slutlig provning utförs på ett stort urval av cirka 400 personer för att bedöma testets tillförlitlighet och giltighet. Dess syfte är att bestämma testets varaktighet också. Syftet med detta försök är att identifiera defekter och brister i testobjekten. Under objektanalysen kasseras alltför lätta och för svåra föremål. Endast objekt av genomsnittlig svårighetsgrad ingår eller behålls.

Nästan alla försiktighetsåtgärder i trycksättning ska inte tas under administrering av slutprovet. Slutfört svarblad ska poängeras med hjälp av scoringsnyckel och poängen tabuleras för att ge den statistisk behandling.

Steg # 4. Utvärdering av testet:

Standardisering och utvärdering av testet görs på följande sätt:

1. Den slutliga formen av provet skrivs ut. Svarbladet skrivs också ut.

2. Den tid som krävs för testet bestäms genom att medeltalet tre elever tar tid för att svara på provet. Eleverna valda för ändamålet representerar tre grupper - ljusa, genomsnittliga och under genomsnittliga.

3. Instruktioner till de personer som ska administrera testet är förberedda och tryckta.

4. Poängen är tabulerade och olika åtgärder av centrala tendenser betyder att median och mode och mätningar av variabilitets-standardavvikelse, kvartilavvikelse mm finns.

Poängen är plottad på ett grafblad för att jämföra distributionens normalitet och teckna och ge för att få olika percentilvärden. Avledade poäng som T-poäng och Z-poäng etc. beräknas.

Normer som åldersnormer, klassnormer, könsnormer, landsbygds-normer, etc., beräknas enligt kravet.

5. Giltigheten av testresultatet beräknas genom att korrelera testresultatet med något annat kriterium. Konstruktionsgiltigheten kan hittas genom faktoranalys. Olika metoder för att bestämma validitet har diskuterats i separat enhet.

6. Vid utvärdering av nybyggt test uppskattas också tillförlitligheten. Vid två parallella former kan vi beräkna tillförlitlighet genom att korrelera poängen på dessa två parallella former.

Om parallella former inte har förberetts kan tillförlitligheten bestämmas genom split-half-metod eller med metod för rationell ekvivalens. Testet kan läsadministreras och pålitligheten kan beräknas med test-retest-metoden.

7. Slutligen måste vi utvärdera hur långt ett test kan användas från administration, poäng, tid och ekonomisk synvinkel. Testet måste tillhandahålla percentilnormer, standardvärdesnormer, åldersnormer och betygsnormer som underlättar tolkning av poäng.