Analys av data: 4 steg

Denna artikel lyfter fram de fyra huvudstegen som är involverade i analys av data. Stegen är: 1. Etablering av kategorier eller klassificering av data 2. Kodning 3. Tabell 4. Statistisk analys av data.

Steg # 1. Etablering av kategorier eller klassificering av data :

Socialvetenskaplig forskning involverar i allmänhet ett stort antal svar på olika typer av frågor eller stimulans som presenteras för provet eller "befolkningen" av respondenterna. Dessa svar kan vara verbala eller icke-verbala.

Det är uppenbart att om ett stort antal olika typer av svar ska organiseras så att de kan användas för att svara på forskningsfrågorna eller vid ritning av generaliseringar, måste de grupperas i ett begränsat antal kategorier eller klasser. För att ta ett enkelt exempel, anta att en fråga ställs till respondenterna, "Är du för den objektiva typkontrollen för studenter?"

Svaren från respondenterna kan eventuellt grupperas under fyra stora kategorier, enligt följande:

(a) "Ja" svar.

(b) "Nej" svar.

(d) "Svarade inte."

Antag att en annan fråga som ställts till svarandena är, "Till vilken social klass skulle du säga att du tillhör?"

Svaren från respondenterna kan grupperas i följande kategorier:

(a) Övre klass.

(b) medelklass.

(d) "Kan inte säga."

(e) Andra svar (till exempel, "Jag tror inte på sociala klasser." "Det betyder knappast var jag hör hemma" etc.).

En förutsättning för att fatta beslut om vilka kategorier som ska inrättas för gruppering av data är att forskaren måste välja någon lämplig princip för klassificering. Forskningsfrågan eller hypotesen, om någon har formulerats, ger en bra logisk grund för att välja en klassificeringsprincip.

Antag att hypotesen i en studie är:

"Studenter som har haft en erfarenhet av att studera i samhällskolor kommer att ha en mer positiv inställning till systemet för medbildning."

Här är det självklart en av principerna för klassificering av svaren huruvida respondenten har tidigare erfarenhet av medbildningssystemet eller ej. En annan grund för att klassificera svar skulle vara graden av gynnsamhet eller oförmåga att uttrycka mot medbildningssystemet. Andra klassificeringsklasser kan också åberopas, beroende på vilka ytterligare sammanslutningar som ska granskas.

Den första klassificeringsgrunden skulle ge två kategorier av svar:

(a) Said, de hade tidigare erfarenhet av medbildning;

(b) Sade, de hade inte tidigare erfarenhet av medbildning.

Dessa två kategorier innehåller inom sig hela spänningsområdet (förutsatt att ingen svarare vägrade svara eller inte svarade eller gav något "annat svar". Inget svar på ovanstående antagande ligger utanför kompassen av dessa två kategorier. Dessa två kategorier bildar tillsammans det som kallas "kategorinsats".

En "kategori-uppsättning" måste uppfylla följande tre krav:

(1) Kategorin bör härledas från en enda klassificeringsprincip. Detta krav är helt förståeligt, eftersom om mer än en princip för klassificering är anställd, kan ett enda svar hävdas av mer än en kategori.

Således kommer kategorierna inte vara oberoende av varandra. Om vi till exempel har tre kategorier som utgör kategorin som t.ex. man, kvinna, barn, uppenbarligen från två klassificeringsprinciper, nämligen kön och ålder, då kan något fall (svarande) vara täckt av mer än en kategori i kategorin.

Till exempel kan ett barn också vara en man, en kvinna kan också vara ett barn och så vidare. Klassificeringsprincipen kan emellertid vara en förening, dvs bestående av två eller flera kriterier, dvs manligt barn, kvinnligt barn, etc.

(2) Det andra kravet är att kategorin bör vara uttömmande, det vill säga det ska vara möjligt att placera alla svar i en av kategorierna inom uppsättningen. "Inget svar" bör uteslutas för att ha en lämplig kategori i uppsättningen som kommer att inkludera den.

Oavsett var svaren måste det omfattas av någon kategori inom uppsättningen. Till exempel, om världens folk skulle klassificeras på grundval av deras rasbestånd, skulle kategorinsatsen bestående av tre kategorier, nämligen a) kaukasoid, b) negroid och c) mongoloid, tydligt inte vara en uttömmande kategori i enlighet med kravet ovan, eftersom det inte innehåller en enda kategori där många indiska personer (och några andra) kan hitta en plats.

(3) Det sista kravet är en följd av den första, nämligen att kategorierna inom uppsättningen utesluter varandra. det vill säga kategorierna bör inte överlappa varandra. Således skulle inget svar krävas av mer än en kategori inom uppsättningen.

Upprättande av kategorier för data som karakteriserar samhällsvetenskap är inte alltid en lätt uppgift. Klassificeringsprincipen kan ofta vara en förening (i motsats till enkel, enhetlig). Uppgiften att rita ut alla ömsesidigt exklusiva kategorier som tillsammans skulle uttömma det totala universum av svar, på grundval av en sammansatt klassificeringsprincip, är verkligen en krävande, krävande fantasi.

Det är en stor hjälp i sådana fall att reducera de attribut som utgör föreningsprincipen för klassificering till symboler eller koder och uträtta med hjälp av tekniken för Boolean expansion, hela spektret av möjliga kategorier som omfattar kategorin.

Låt oss ta ett mycket enkelt exempel. Antag forskaren att betrakta tre attribut, till exempel kön (manlig kvinna), ålder (under 21 år eller över 21 år) och civilstånd (gift eller ensam) som beståndsdelar i sin enda (men sammansatta) princip för klassificering och reducerar dessa till symboler enligt följande:

Man = S, kvinnlig = S tjock

Under 21 år = A, Över 21 år = A Tj

Gift = M, Singel = M ^

Den resulterande kategorin uppsättningen kommer att vara den uttömmande totaliteten bestående av alla möjliga kombinationer av dessa tre attribut som innefattar föreningen klassificeringsprincipen. De möjliga kombinationerna, dvs kategorier, kommer att vara 2 ³ = 2 x 2 x 2 = 8 i antal.

Dessa är som under:

(1) SAM

(2) S ^ AM

(3) S A ^ M

(4) SA M ^

(5) S ^ A ^ M

(6) S ^ A M ^

(7) S Aj Mj

(8) S ^ A ^ M ^

Avkodning, dvs ersätta de riktiga konnotationerna för symbolerna, vi får åtta ömsesidigt exklusiva kategorier som läser som under:

(1) Manspersoner under 21 år och gift.

(2) Kvinnor under 21 år och gift.

(3) Manspersoner över 21 år och gift.

(4) Manspersoner under 21 år och ogift.

(5) Kvinnor över 21 år och gift.

(6) Kvinnor under 21 år och ogift.

(7) Män över 21 år och ogift.

(8) Kvinnor över 21 år och ogifta.

På samma sätt, om klassificeringsprincipen utgörs av fyra attribut, kommer vi att ha 2 ⁴ = 2x 2 x 2 x 2, dvs. 16 ömsesidigt exklusiva kategorier. Det borde vara klart nu hur denna metod för att skapa kategorier, snarare än intuition, gör uppgiften att klassificera mycket enklare och idiotsäker.

Det är uppenbart att upprättandet av en uppsättning kategorier är relativt lätt om svaren från respondenterna under studien är ganska enkla och tydliga och så kan kategorierna enkelt definieras på ett entydigt sätt. Även om detta är hur kategorierna alltid ska definieras är uppgiften mycket svårare med vissa typer av innehåll.

Antag att i en studie frågade forskaren de manliga studenterna, "Hur skulle du säga att de kvinnliga studenterna känner att de studerar i samma högskola med manliga studenter som du?" Svaren kommer sannolikt att sträcka sig från indikationer på högt gynnsamma attityder (tillskrivna kvinnliga studenter ) till imputationer av mycket ogynnsamma attityder. Antag att det här är några av svaren från respondenterna.

(1) De tycker om idén. "

(2) "Jag tror inte att de tänker."

(3) "De tror att det sänker dem."

(4) Jag kommer inte i kontakt med dem, så jag skulle inte veta. "

(5) "De hatar det."

(6) "Några av dem gillar det, vissa gör det inte."

(7) "De vill studera här så att de kan säga att de inte är mindre än männen."

(8) "I en rent damerhögskola skulle de sakna mycket, så de verkar gilla det här."

När det gäller ovanstående svar skulle det inte vara svårt att utveckla en enkel uppsättning kategorier baserade på klassificeringsprincipen för gynnsamma mot ogynnsamma attityder som tillskrivs flickestudenter. Men vi finner att både gynnsamma och ogynnsamma svar förmedlar olika nyanser av betydelser.

Den manliga studenten som säger "De (flickestudenterna) vill studera här så att de kan säga att de inte är mindre än män" förmedlar något annat än en som säger "De tycker om idén." På samma sätt, den manliga studenten som säger, "De tror att det sänker dem" säger igen något annat än den som säger "de hatar det".

Således ser vi att två attribut, dvs:

(1) Tillskrivning av gynnsamma eller ogynnsamma attityder till tjejer, och

(2) Väsentlig hänvisning eller frånvaro av hänvisning till förmåner eller skador som stöder gynnsamma eller ogynnsamma attityder är två viktiga beståndsdelar i en sammansatt princip för klassificering.

Kategorin i kategorin som överensstämmer med de ideala kraven i en tidigare kategoriserad uppsats kan sättas ned enligt följande:

(1) Gynnsam attityd som tillskrivs flickestudenter, förklarad i form av fördelar som de härleder från att studera i samma högskola med manliga studenter (till exempel 7: e och 8: e svar).

(2) Gynnsam inställning tillskott till tjejer utan uttrycklig hänvisning till förmåner som uppnåtts genom att studera i samma högskola med män (t.ex. uttalande nr 1).

(3) Neutral eller tillmötesgående attityd som tillskrivs tjejer (t.ex. uttalande nr 1).

(4) Ogynnsam attityd som tillskrivs tjejer, förklaras när det gäller nackdelar (negativa fördelar) som de härleder från att studera i samma högskola med manliga studenter.

(5) Ogynnsam attityd som tillskrivs flickor utan att uttryckligen hänvisa till nackdelar eller förluster som följer av medbildning (t.ex. uttalande nr 5).

(6) Andra svar, kan inte säga, inget svar, vet inte (t.ex. uttalande nr 4).

Ovanstående illustration skulle ge en uppfattning om hur mycket komplex en klassificering i samhällsvetenskap kan få. Att arbeta med sådana komplexa kategorier kräver stor omsorg och ansträngning vid klassificering. Även när kategorierna har utarbetats noggrant kommer användningen att ge större problem än användningen av kategorier snävare och exakt definierade.

Om en manlig elev i ovanstående exempel säger "de tycker om det bra här, de vet varför" det är en grym fråga om detta uttalande innebär en fördel. Därför måste ytterligare regler fastställas för att hantera sådana svar.

Det måste sägas till och med på bekostnad av en viss repetition att även om det i princip är möjligt att använda många attribut av svaren på formulering av kategorinsatser, är det i praktiken ofta onödigt, oekonomiskt och obevekligt eftersom inte alla dessa klassificeringsprinciper bära på målet med studien.

Låt oss nu vända oss till problemet med att välja en klassificeringsprincip för kategorisering av ostrukturerat material (dvs. information som samlas in av ostrukturerade verktyg).

I studier som använder strukturerade instrument för att samla in data som är relevanta för tydligt formulerade forskningsfrågor eller hypoteser är den lämpliga principen för klassificering av svar ganska tydligt förskrivna av frågans art och de säkrade svaren.

I arbetet med ostrukturerat material eller data är det första problemet att komma fram till beslut om vilka aspekter av materialet som ska kategoriseras, dvs vilka klassificeringsprinciper som ska användas för att upprätta kategorier.

I förberedande studier som definieras inte med ett välformulerat problem eller en explicit hypotes är beslutet om klassificeringsprinciperna svårt att komma fram till. Vid tidpunkten för datainsamling vet utredaren inte vilka aspekter som kan visa sig vara viktigast.

Han måste därför samla in en stor mängd data av ostrukturerad typ. Under analysen står forskaren inför problemet att inte bara hantera ostrukturerat material utan också med en stor volym av dem.

Det är tillrådligt att analysera data från en undersökande studie för att utveckla arbetshypotesen som kommer att ge fungerande tillfredsställande klassificeringsprinciper. Forskaren är skyldig att läsa noggrant genom hela sitt material, att hela tiden varna för latenta ledtrådar i data. Sådana ledtrådar säkras ofta genom att studera material på ämnen eller situationer som står i kontrast till de som han studerar.

En sådan studie hjälper utredaren att se de viktiga skillnaderna mellan de två situationerna. Ett annat förfarande för att få fram sådana ledtrådar är att sammanfoga sina fall till grupper som verkar ha nära släktskap eller tycks höra ihop och sedan fråga sig vad som ledde honom att känna att de fall han placerat i en enda grupp är lika.

Ett annat tillvägagångssätt som kan stimulera ledtrådar för att formulera arbetshypotesen är att notera saker som verkade förvånande med tanke på vissa teoretiska förväntningar eller sunt förnuft och sedan söka efter eventuell förklaring av de överraskande eller oförutsedda fenomenen.

Det bör dock komma ihåg att även med tydlig hypotes kan analysen av ostrukturerat material ge speciella problem. För det första finns det alltid möjlighet att information på en given punkt saknas från några av dokumenten.

Det finns också sannolikheten för att mycket material inte har ett direkt drag på hypotesen. Dessutom finns det problem att bestämma storleken på enheter av materialet som kategorierna ska tillämpas på.

Till exempel, om en forskare använde journaler som sparats av välfärdsbyråer, måste han bestämma vilken enhet (t.ex. klienter, uttalanden, handlingar, socialarbetare, sessioner med kunden eller hela posten) är mest lämplig för att svara på hans specifika forskningsfrågor.

Steg # 2. Kodning:

Kodning består i att tilldela symboler, vanligtvis siffror till varje svar som faller i en förutbestämd klass. Med andra ord kan kodning betraktas som den klassificeringsprocess som är nödvändig för efterföljande tabulering. Genom kodning omvandlas de råa data till symboler som kan tabuleras och räknas.

Denna omvandling är emellertid inte automatisk, det innebär en stor bedömning från kodarens sida. "Coder" är den officiella titeln för en person som har till uppgift att ge särskilda koder till svar efter det att de inspelade anteckningarna har lagts till kontoret.

Man bör dock komma ihåg att dom som bestämmer vilken respons som ska tilldelas en viss kod är gjord av en annan än den som går genom den officiella beteckningen "kodare".

Kodning kan ske på tre olika punkter i en studie vid var och en, olika typer av personer kan vara ansvariga för att tilldela koder till rådata. I många studier kan svaranden själv bli ombedd att tilldela koder till sin egen reaktion eller situation.

Detta gäller för många enkäter och flera valfrågor. Till exempel, när svaranden uppmanas att ange vilken av de klasser (t.ex. inkomstgrupper) han tillhör, t ex (a) under 3000 rupier pm, (b) Rs. 3001 / - till rs. 6000 / - pm, (c) Rs. 6001 / - till rs. 9000 / - pm, (d) Rs. 9001 / - och ovan svarar svaranden sitt svar genom att helt enkelt avmarkera sin position bland de givna alternativen.

Den andra punkten vid vilken kodningen kan äga rum är när intervjuaren eller observatören i samband med datainsamlingen kategoriserar ämnets svar. Det här görs när en intervjuare eller observatör använder en betygsskala för att beskriva en persons svar eller beteende.

Den sista punkten vid vilken kodning kan äga rum är naturligtvis när de råa, okategoriserade data (uppsamlade speciellt genom ostrukturerad datainsamling) sätts in i projektkontoret och de officiella kodarna här utövar sin dom för att tilldela särskilda koder till särskilda svar eller data.

Låt oss kort och jämnt jämföra och kontrastera fördelarna och nackdelarna med kodning av de officiella kodarna på kontoret och kodning av intervjuare eller observatörer som utförts i samband med datainsamling i fältet.

Intervjuerna eller observatörerna är i stånd att märka situationen såväl som individens beteende. De har sålunda mer information om vilka de ska basera sina bedömningar i fråga om lämplig kategorisering av svar jämfört med kodarna som arbetar på grundval av skriftliga dokument som kanske inte ger en fullständig uppfattning om svarets verkliga betydelse.

En annan fördel med att koda av datasamlare själva är att både tid och arbete kan räddas.

Tvärtom, kodning på kontoret av kodare har vissa signalfördelar. Kodning av komplexa uppgifter som kräver tid för reflektion bör rådgivande göras av kontors kodare. På plats kan kodningsbedömning som gjorts av datainsamlare inte vara så kräsna som domar som görs med mer tid för överläggning.

Domen av datainsamlare kan färgas av många faktorer, nämligen respondentens framträdanden, accenter och svar på tidigare frågor, sättelser etc. För det andra finns det en risk för att datainsamlarna saknar enhetlighet vid kodningssvar.

Sålunda hämmas jämförbarheten av data som erhållits från ett stort antal respondenter. För det tredje kan intervjuarna eller observatörerna utveckla sina egna personliga referensramar avseende materialet som de kodar för. Detta skulle tendera att göra deras kategoriseringar opålitliga, efter en tid. En gemensam referensram är lättare att erhålla och underhålla i kontokodningsoperationen än i fältet.

Låt oss diskutera några av de viktiga problemen med tillförlitlighet vid kodning. Det finns många saker som kan fungera för att göra bedömningen av kodare otillförlitlig. Några av faktorerna kan uppstå av de data som ska kategoriseras, vissa av arten av de kategorier som ska tillämpas och fortfarande andra kan utgå från kodarna själva.

Vi ska nu kortfattat överväga några av dessa faktorer och hur de kan bevakas.

Många av de svårigheter som uppstår vid kodning beror på brister i data. Ofta tillhandahåller inte data tillräckligt med relevant information för en tillförlitlig kodning. Detta kan bero på bristfälliga och otillräckliga datainsamlingsförfaranden. Dessa svårigheter kan dock generellt övervinnas genom noggrann redigering av data. Processen som består i att granska data för att förbättra deras kvalitet för kodning känd som redigering.

När datainsamlaren hämtar sitt material till projektkontoret finns det fortfarande möjligheten att eliminera många potentiella kodningsproblem. En noggrann granskning av data så snart de samlas in och om det behövs, hjälper en systematisk fråga om intervjuare eller observatörer att avvärja många kodproblem.

Redigering hjälper inte bara till att undvika senare kodningsproblem, det kan också förbättra kvaliteten på datainsamling genom att påpeka var intervjuare eller observatörer kan ha missförstått instruktioner eller kanske inte har inspelat data i tillräcklig detalj.

I själva verket bör redigeringen göras under förprovning av intervjun eller observatörsplanen som utbildar intervjuarna eller observatörerna och i själva verket under perioden för datainsamling. Redigering på projektkontoret går långt i att ta bort kodproblem.

Redigering måste således ske medan intervjuare eller observatörer lätt kan ställas till förfogande. Redigering innebär en noggrann granskning av intervjun eller observationsplanen.

Dessa bör kontrolleras för:

(1) Fullständighet: Redaktörerna måste se till att alla objekt är vederbörligen ifyllda. Ett tomt utrymme bredvid en fråga i ett intervjuschema kan till exempel innebära antingen "inget svar" eller "vet inte" eller vägrar att svara på eller otillåtet fråga, eller frågan har utelämnats genom tillsyn, etc.

(2) Redaktören bör granska intervju- eller observationsplanerna för att få reda på huruvida handstilen eller de symboler eller koder som tilldelats av intervjuare eller observatör lätt kan förstås av kodaren.

Det är alltid lämpligt att kontrollera läsbarhet när materialet lämnas in och vid behov för att få intervjuaren eller observatören att skriva om det. Om detta inte är klart kan det hända att kodningen sitter fast vid ett stadium då intervjuare eller observatörer inte lätt kan återkallas för frågan.

(3) Redigering innebär också att man granskar scheman för förståelse. Det händer ofta att ett inspelat svar är helt förståeligt för intervjunaren eller observatören, men inte begriplig för kodaren eftersom kontexten för beteende eller svar inte är känt för kodaren. Systematisk ifrågasättning av datainsamlarna kommer att rensa bort förvirring och tvetydigheter och förbättra kvaliteten på kodningen avsevärt.

(4) Uppgifterna bör också granskas eller kontrolleras för att få reda på om det finns vissa inkonsekvenser med avseende på de svar som registrerats i schemat.

Till exempel kan en svarande ha sagt som svar på en av de tidigare frågorna att han aldrig hade träffat människor i en viss grupp och än, på grund av en senare fråga kunde han ha sagt någonting om att besöka vissa personer i denna grupp under sin tid rundor. Om så är fallet finns det ett uppenbart behov av att undersöka denna inkonsekvens, och få den klarad genom att ifrågasätta datainsamlarna.

(5) Det är också nödvändigt att kontrollera graden av enhetlighet som intervjuarna har följt instruktioner för insamling och registrering av data. Kodning kan hämmas om ett svar spelas in i andra enheter än de som anges i anvisningarna.

(6) Det bör noteras att något svar helt enkelt inte kan vara irrelevant för undersökningsändamålet. Detta kommer sannolikt att hända om en fråga inte är tydligt arbetad eller inte på ett intelligent sätt. Uppgifterna bör därför noggrant undersökas för att avskilja de olämpliga svaren från de lämpliga.

Värdet av kategoriseringen av data beror naturligt på ljudet av de anställda kategorierna. Det är nödvändigt att kategorierna förutom att vara relevanta för syftet med forskning också definieras ur en konceptuell synvinkel.

Kodning kommer att vara opålitligt om kategorierna inte definieras tydligt när det gäller indikatorer som gäller för data, här och nu. I praktiken definieras kategorierna med hjälp av exempel från data i hand. Det är väldigt bra om bilder från data visar inte bara vilka slags svar som typifierar kategorin utan hjälper också att skilja gränslinjen mellan till synes liknande kategorier.

Det är uppenbart att kodkvaliteten påverkas av kodarens kompetens. Utbildningen av kodare är således ett viktigt steg i någon studie.

Utbildningen av kodare kan fortsätta med följande steg:

För det första förklaras de olika koderna för tråden (kodare) och illustreras med exempel från de uppgifter som ska kategoriseras.

För det andra ökar alla trainee-kodarna på ett urval av data, problem som uppstår diskuteras av kodarna som en grupp med handledaren för att utveckla gemensamma förfaranden och definitioner.

För det tredje används ledtrådar som följer av övningskodning för att genomföra ändringar i kategorierna för att göra dem bättre tillämpliga på materialet och att skriva skriftligt de förfaranden och definitioner som har utvecklats under den preliminära kodningen.

För det fjärde, vid en viss tidpunkt i praktiken då relativt få nya problem uppstår arbetar kodarna på en identisk del av data utan att samråda med varandra eller handledaren. Konsistensen eller tillförlitligheten av kodningen beräknas därefter för att bestämma huruvida det är möjligt att börja kodning i rätt earnest.

Beroende på resultaten av tillförlitlighet eller konsekvenskontroll kan det beslutas att eliminera de kategorier som verkar för opålitliga eller att spendera mer tid på att träna kodare eller att eliminera kodare som är mest inkonsekventa och så vidare.

Slutligen görs periodiska kontroller för att säkerställa att kodare inte blir slarviga med mer erfarenhet eller att de inte utvecklar personliga idiosynkratiska metoder för hantering av nya problem i materialet. För att säkerställa enhetlighet och beslut som fattas efter det att kodningen har börjat bör utan dröjsmål meddelas alla kodare.

Den konsistens och lämplighet med vilken en given typ av svar tilldelas en viss kategori kommer givetvis att ha ett viktigt inslag på analysresultatet. Därför är det viktigt att kontrollera kodningens tillförlitlighet och att öka överenskommelsen bland kodare lika mycket som möjligt.

Det är naturligtvis svårt att ställa in någon viss tillförlitlighet som standard som ska uppnås. Olika typer av material uppvisar olika svårighetsgrader för att uppnå tillförlitlighet. Som regel är ju mer strukturerad det material som ska kodas och därmed enklare de använda kategorierna, ju högre tillförlitlighet.

Det bör noteras att de typer av koder som används i en studie kommer att skilja sig åt beroende på om uppgifterna ska tabelleras per maskin eller för hand. Om uppgifterna ska sorteras manuellt är en ordbeskrivning av klasserna tillfredsställande.

Även förkortningar eller bokstäver av alpha-bates, t.ex. "Y for Yes, " N "for No, etc. kan användas. Maskintabell kräver å andra sidan att klasser uttrycks i numeriska symboler, eftersom maskinerna endast kan matas med numeriska data.

Mekanisk tabulering kräver användning av stanskort. Antalet olika klasser som kan visas på stanskortet är dock begränsat. Under alla omständigheter kan alla koder som används för maskintabulering också användas för handmatning.

Om koder ska läggas på slagkort, av vilka två storlekar är i allmänhet, det vill säga 80 kolumnkort och 54 kolumnkort, är det önskvärt att använda tio på färre klasser / kategorier för de flesta uppgifter eller svar.

Stämpelkortet innehåller 10 nummererade mellanslag och en X och Y i varje kolumn som gör totalt 12 koder som kan användas. Det är ganska komplicerat förfarande att få mer än en typ av objekt i en kolumn. Nativitet och ålderskoder kan till exempel inte stansas i en enda kolumn om inte endast sex åldersgrupper används för varje.

Steg # 3. Tabulering:

Tabulering är en del av den tekniska processen i statistisk analys av data. Det väsentliga inslaget i tabellen är sammanfattningen av resultaten i form av statistiska tabeller.

Det är bara när rådata delas in i grupper och räkningar av antalet fall som faller i dessa olika grupper, att det är möjligt för forskaren att bestämma vad hans resultat betyder och att förmedla sina resultat till konsumenten i en form som kan lätt att förstå.

Tabulering beror naturligtvis på att skapa kategorier för rå data, redigering och kodning av svar (stansning och körning av korten genom maskiner för mekanisk tabulering och sortering och talting för handblockering).

Erfaren forskare utvecklar generellt tabuleringsplaner ungefär samtidigt som de utarbetar eller konstruerar datainsamlingsinstrument och gör provtagningsplaner. De oerfarna forskarna berör sällan sig själva med tabuleringsplaner tills uppgifterna har samlats in. Naturligtvis är det omöjligt för forskaren att förutse hela sortimentet av tabulering som efterhand önskas.

Han borde vara bekant med sitt forskningsproblem eller undersökningsämnet för att kunna skapa tabeller som ger svar på de frågor som ledde till studien. Forskaren ska kunna förbereda adekvata tabuleringsplaner om han använder resultaten från tidigare undersökningar som har gemensamma delar med den som planerna utarbetas för.

I förberedande studier är ett bättre och säkrare förfarande att föreställa datainsamlingsinstrumentet på ett urval av population av den typ som skulle omfattas av den slutliga studien. På så sätt kan vissa ledtrådar beträffande vilken typ av tabulering som helst vara meningsfulla.

Tabulering kan göras helt med manuella metoder. detta är känt som hand tabulation. Alternativt kan det ske med mekaniska metoder som utnyttjar automatiska och snabba kraftmaskiner för huvuddelen av data, varvid förfarandet är känt som mekanisk tabulering.

Forskaren måste bestämma innan han skriver detaljerade tabuleringsplaner för sin studie, vilken metod för tabulering han skulle använda. Detta beslut kommer att baseras på olika överväganden såsom kostnad, tid, personal etc.

Både hand tabulering samt mekaniska tabulering förfaranden har sina respektive meriter och begränsningar. Forskarens varning till dessa fördelar och demeriter är ett bättre sätt att bestämma vilken metod som skulle passa hans problem.

Vi ska korta granska fördelarna med dessa två metoder för tabulering:

(1) Mekanisk tabulering innebär mycket kontorarbete och specialiserad verksamhet. Det underlättar naturligtvis hastighet men hastigheten kan inte alltid vara en adekvat kompensation för extra kontorarbete.

(2) Om antal och typer av tabeller som önskas inte beslutas innan tabelleringen påbörjas, maskin-tabulering kan vara mer ändamålsenlig. Men om handtabellen anses vara effektiv kommer den ordning i vilken olika sorter och räkningar skulle göras att bestämmas före tabuleringen.

(3) En stor fördel med maskin tabulering är att det underlättar kors-klassificeringar. I storskaliga studier där många variabler ska korreleras eller klassificeras, är maskinabelleringen rimligt att föredra.

Det är av denna anledning att mekanisk tabulering används i studier som kräver många korrelationer mellan variabler. Men om det totala antalet svarande är litet, kan en manuell räkning av dem i enlighet med klassificeringsprincipen vara relativt ekonomisk.

(4) När det finns mycket kodad information och flera stanskort krävs för varje enskilt fall, kan handplattan vara att föredra.

(5) Om det är önskvärt att behålla uppgifterna i en form som är redo för ny tabulering med relativt kort varsel är bankkort vanligtvis användbara. Mekanisk tabulering är användbar för periodiska studier eller undersökningar där samma typ av information krävs för att samlas in med jämna mellanrum.

(6) Processen att sortera och räkna är mindre sannolikt att skapa fel om det görs med maskinen än om det görs för hand. Fel, naturligtvis, kan och uppstår i maskinskrivning och när de gör det, är de ofta mycket svåra att identifiera och kontrollera.

Eventuella fel som upptäcks vid kodning, redigering eller fältarbete i undersökningen kan innehålla maskinbordsarbete. Det är därför ofta önskvärt att fortsätta med handtabellen tillsammans med fältarbetet.

(7) Kostnaden för tabulering är en viktig fråga för forskaren. Maskintabell innebär ofta mycket större kostnad, eftersom det mesta av stanskort, avgifter för stansning och verifiering, maskinavgifter för sorterings- och tabuleringsmaskiner och kostnader för att hyra specialiserade tjänster av specifika typer av maskinoperatörer bidrar ofta till mycket mer än de som är inblandade i hand tabulering.

(8) En annan viktig faktor är tiden. I mekanisk tabulering görs tabelleringsarbetet som sådant på en mycket kort tid men de förberedande stadierna liksom utbildning, övervakning och eventuell otillgänglighet av vissa typer av maskiner på hyra som leder till arbetsförskjutning kan alla oundvikligen bidra till att slöseri av tid.

(9) Bekvämlighetens överväganden kan knappast ignoreras. Om mekanisk tabulering kräver leverans av rådata till något kontor långt ifrån projektkontoret, orsakas olägenheter i paket, transport etc.

(10) Slutligen kan mängden kommenterande material som spelas in och analyseras också påverka valet av tabuleringsmetoder. I vissa opinionsundersökningar är de informativa kommentarernas uttalade kommentarer viktiga. Det handkodskort som används i handenhetens bord kan ge utrymme för sådana kommentarer eller kommentarer.

Maskiner som hanterar tabuleringsarbete är av många slag. Utvecklingen inom detta område har varit extremt snabb under de senaste åren. Vissa maskiner sorterar helt enkelt och räknar kort, andra sorterar, räknar och skriver ut resultaten, men andra är utrustade för att utföra mest komplicerade statistiska operationer eller beräkningar.

Dessa sistnämnda maskiner är extremt komplexa och de måste programmeras för en given operation av en specialist i linjen. En tabell är en utställning av de numeriska data som systematiskt är anordnade i märkta kolumner (vertikala) och rader (horisontella).

En enkel eller elementär tabell anger enkla räkningar av de frekvenser som de olika kategorierna i varje uppsättning uppträder i data, till exempel antalet personer i provet som har deltagit i gymnasiet men inte passerat, antalet personer som har deltagit högskola men inte examen och så vidare. Nedanstående tabell pekar helt enkelt på frekvenserna av besök av femtio respondenter på bio.

I forskning är vi ofta intresserade av att hitta korrelationen mellan två eller flera variabler, t.ex. utbildning och inkomst och fertilitet, enkla tabeller (illustrerad ovan) som visar frekvensfördelning av respondenterna med avseende på en enda egenskap, t.ex. utbildning eller inkomst eller fertilitet, hjälp oss inte att se förhållandet mellan två eller flera variabler.

Sättet att se relationen är genom att förbereda tabeller eller tabeller. Sådana tabeller möjliggör gruppering av fall som förekommer gemensamt i två eller flera kategorier, till exempel tabulering av antalet fall som är höga i utbildning, låg inkomst och har mellan 2 och 3 barn eller antalet fall som är låg i utbildning, låg inkomst och har mellan 4 och 5 barn och så vidare. Den vanligaste formen av kors-tabulering eleverna är bekanta med är kollegietidbordet.

Antag att en forskare vill se förhållandet mellan tre variabler, dvs yrke, inkomst och fertilitet. Han måste använda ett tabuleringsschema som ger råd till alla möjliga kombinationer av de olika kategorierna av dessa tre variabler.

Korsläggning av data på ett hypotetiskt prov på 100 personer kan presenteras enligt följande:

I ovanstående tabell har vi angivit antalet barn i rader. Denna fertilitetsvariabel har uppdelats i fem kategorier, det vill säga inga problem, 1 till 2 problem, 3 till 4, 5 till 6, 7 och högre. Så i marginalen till vänster har vi dessa 5 kategorier av fertilitet. Vi har angett inkomst från 100 respondenter i kolumner.

Inkomstvariabeln har uppdelats i fem kategorier, dvs under Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Således har vi fem kolumner som motsvarar dessa kategorier.

Återigen, eftersom vi har en enda variabel, dvs ockupation för att tillgodose, har inkomstkolumnerna delats in i två delar som motsvarar de två kategorierna i vilka yrkena har delats, dvs vitkraftsjobb och sysselsättning .

Således har vi tio vertikala kolumner, motsvarande inkomst och yrke. Antalet horisontella rader vi har för kategorierna av fertilitetsvariabeln är fem. Således har vi tio kolumner korsade av fem rader som utgör bordets kropp.

Korsningen av kolumnerna och raderna har gjort 50 (femtio) celler eller lådor. Var och en av dessa lådor eller celler rymmer ett visst antal fall som skiljer sig från de i andra celler, antingen vad gäller inkomst eller yrke, fertilitet eller i någon av dessa eller i alla dessa. Låt oss läsa tabellen för att få en uppfattning om vad den representerar.

Av det totala urvalet av 100 fall finns det 25 som har mellan 3 och 4 nummer. Av dessa 25, läsning från vänster sida, har 5 personer (med mellan 3 och 4 barn) en inkomst under Rs.200 / - och är anställda i tjänstemän.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.