Studieanmärkningar om Chi-Square-testet

Denna artikel ger en studieanmälan om chi-square test.

Testet X ² (granskat brev X ² Pronounced as Ki-square) är ett sätt att utvärdera huruvida frekvenser som har observerats empiriskt skiljer sig avsevärt från de som skulle förväntas under en viss uppsättning teoretiska antaganden. Antag exempelvis att politiska preferenser och bostadsort eller nativitet har klassificerats och uppgifterna sammanfattas i följande 2 × 3 beredskapstabell.

Det framgår av tabellen att andelen medborgare är 38/48 = 0, 79, 20/46 = 0, 34 och 12/18 = 0, 67 (avrundad till två decimaler) för de tre politiska partierna i landet. Vi vill då veta om dessa skillnader är statistiskt signifikanta.

För detta ändamål kan vi föreslå en nollhypotes som förutsätter att det inte finns några skillnader mellan de tre politiska partierna avseende nativitet. Det betyder att proportionerna för stads- och landsbygdsmän bör förväntas vara samma för var och en av de tre politiska partierna.

På grundval av antagandet att nollhypotesen är korrekt kan vi beräkna en uppsättning frekvenser som skulle förväntas med tanke på dessa marginala totals. Med andra ord kan vi beräkna antalet personer som visar preferensen för kongresspartiet som vi förväntar oss på grundval av ovanstående antagande om att vara urbanites och jämföra denna siffra med den som faktiskt observerats.

Om nollhypotesen är sant kan vi beräkna en gemensam andel som:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Med denna uppskattade andel skulle vi förvänta oss att 48 x (0, 625) = 30 personer som är anslutna till kongressen, 46 _x (0, 625) = 28, 75 personer som är anknutna till Janata Party och 18 x (0, 625) = 11, 25 personer som är anslutna till Lok Dal från 70-talet urbanites. Att dra dessa siffror från respektive observerade siffror från respektive storlek på de tre proverna finner vi 48 - 30 = 18 anslutna till kongressen, 46 - 28.75 = 17.25 anslutna till Janata och 18 - 11.25 = 6, 25 personer som är anslutna till Lok Dal från 42 personer från landsbygden.

Dessa resultat visas i följande tabell, där förväntade frekvenser ar. visas inom parentes.

För att testa nollhypotesens hållbarhet jämför vi de förväntade och observerade frekvenserna. Jämförelsen baseras på följande X ^2- statistik.

X2 = Σ (O-E) ² / E

där O står för observerade frekvenser och E för de förväntade frekvenserna.

Frihetsgrader :

Antalet grader av frihet betyder antalet oberoende begränsningar som åläggs oss i ett beredskapstabell.

Följande exempel illustrerar konceptet:

Låt oss anta att de två attributen A och B är oberoende, i vilket fall

förväntad frekvens eller cellen AB skulle vara 40 × 30/60 = 20. När detta har identifierats blir frekvenserna för de återstående tre cellerna automatiskt fixerade. För cell, aB måste den förväntade frekvensen vara 40-20 = 20, på samma sätt för cellen AB måste den vara 30-20 = 10 och för aB måste den vara 10.

Det betyder att för 2 × 2 bord har vi bara ett eget val, medan vi inte har någon frihet i de återstående tre cellerna. Således kan graderna av frihet (df) beräknas med formeln:

df - (c - 1) (r - 1)

där df står för graden av frihet, c för antalet kolumner och r för antalet rader.

Således, i 2 x 3 bord (tabell 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Nivån av betydelse :

Som tidigare nämnts används chi-kvadratprovet för att undersöka huruvida skillnaden mellan observerade och förväntade frekvenser beror på provtagningsfluktuationerna och som sådan obetydlig eller motsats, huruvida skillnaden beror på någon annan orsak och som sådan betydande.

Innan dragningen av skillnaden är betydande forskare sätter upp en hypotes, ofta hänvisad till som en nollhypotes (symboliserad som H _o ) i motsats till forskningshypotesen (H ₁ ) som är inställd som ett alternativ till H _o .

Vanligtvis, men inte alltid, säger nollhypotesen att det inte finns någon skillnad mellan flera grupper eller inget samband mellan variabler, medan en forskningshypotes kan förutsäga antingen ett positivt eller negativt förhållande.

Med andra ord antar nollhypotesen att det saknas icke-provtagningsfel och skillnaden beror på enbart chans. Då bestäms sannolikheten för förekomsten av en sådan skillnad.

Sannolikheten indikerar omfattningen av tillit som vi kan placera på den dragna inferensen. Tabellvärdena för chi-kvadrat är tillgängliga vid olika sannolikhetsnivåer. Dessa nivåer kallas nivåer av betydelse. Vi kan ta reda på bordets värden från chi-kvadraten på vissa nivåer av betydelse.

Vanligtvis (i samhällsvetenskapsproblemet) ses värdet av chi-kvadrat med 0, 05 eller 0, 01 nivåer av betydelse från de givna graderna av frihet från bordet och jämförs med observerat värde av chi-kvadrat. Om det observerade värdet eller y ¹ är mer än tabellvärdet vid 0, 05 betyder det att skillnaden är signifikant.

Frihetsgrad :

För att använda chi-kvadrattestet är nästa steg att beräkna graden av frihet: Antag att vi har en 2 x 2 beredskapstabell som den i Fig 1.

Vi känner till raden och kolumntalet r _t ¹ och r _t ² - och c _t ¹ och c _t ² . Antal frihetsgrader kan definieras som antalet cellvärden som vi fritt kan specificera.

I figur 1, när vi väl anger ett värde av rad 1 (betecknat med kontroll i figuren) är det andra värdet i den raden och värdena för andra raden (betecknad med X) redan bestämda; Vi är inte fria att ange dessa eftersom vi vet radomsluten och kolumn Totals. Detta visar att i en 2 x 2 beredskapstabell är vi fria att bara ange ett värde.

Förfarande :

Beräkning för Chi-kvadrat:

Chi-kvadrat som ett test av passformens godhet:

I det föregående avsnittet använde vi chi-kvadraten som ett självständighetsprov; Det är om man ska acceptera eller avvisa en nollhypotes. X-testerna kan också användas för att bestämma om det finns en signifikant skillnad mellan en observerad frekvensfördelning och en teoretisk frekvensfördelning.

På detta sätt kan vi bestämma hur bra passformen är för de observerade och förväntade frekvenserna. Det vill säga att passformen skulle anses vara bra om det inte finns någon signifikant divergens mellan de observerade och förväntade data när kurvan för de observerade frekvenserna överförs på kurvan för förväntade frekvenser.

Vi måste dock komma ihåg att även om proportionerna i cellerna förblir oförändrade varierar chi-kvadratvärdet direkt med det totala antalet fall (N). Om vi dubblar antalet fall blir chi-kvadratvärdet dubbelt. om vi tredubblar antalet fall vi också trippel chi-square och så vidare.

Följderna av detta faktum kan illustreras med ett exempel som ges nedan:

I det föreliggande exemplet är chi-kvadratvärdet 3, 15. På grundval av detta skulle vi naturligtvis konstatera att förhållandet inte är en signifikant.

Antag nu att data hade samlats in på 500 fall med följande resultat:

Chi-kvadratvärdet som beräknat från figurerna, är nu 6, 30, vilket är dubbelt det värde som ankom i föregående exempel. Värdet 6, 30 är statistiskt signifikant. Om vi hade uttryckt resultaten i procenttal skulle det inte ha varit någon skillnad i tolkning.

Ovanstående exempel illustrerar en mycket viktig punkt, nämligen att kvarteret är direkt proportionellt mot N. Därför skulle vi behöva en åtgärd som inte påverkas enbart av en förändring av antalet fall. Åtgärden phi (ǿ) ger denna möjlighet, det vill säga den egendom vi önskar i vår åtgärd. Denna åtgärd är helt enkelt ett förhållande mellan chi-kvadratvärdet och den numeriska totalen av de studerade fallen.

Måttet phi (ø) definieras som:

Ø = √x ² / n

det vill säga kvadratroten av chi-kvadrat dividerat med antalet fall.

Genom att tillämpa denna formel på de två ovan angivna exemplen får vi i det första fallet:

Åtgärden ö, till skillnad från chi-kvadraten, ger sålunda samma resultat när proportionerna i de jämförbara cellerna är identiska.

G. Udny Yule har föreslagit ännu en annan koefficient för förening som vanligtvis betecknas som "Q" (mer känd som Yule's Q) som mäter association i? x 2 bord. Föreningskoefficienten (Q) erhålls genom att beräkna förhållandet mellan skillnaden och summan av korsprodukterna hos de diagonala cellerna, om celler i 2 × 2-tabellen betecknas som i följande tabell:

ac- cc / ad + be

där a, b, c och d refererar till cellfrekvenserna.

Föreningskoefficienten Q varierar mellan minus en och plus en (+1) som är mindre än eller större än ad. Q uppnår gränserna för +1 när någon av cellerna är noll, dvs föreningen är komplett (korrelationen är perfekt). Q är noll när variablerna är oberoende (det vill säga när det inte finns någon association), dvs när annonsen. = var och. Q = 0.

Tillämpning av ovanstående formel illustreras i följande exempel:

Låt oss beräkna Yules associeringskoefficient mellan civilstånd och prestanda i granskning utifrån de uppgifter som presenteras i följande tabell:

Att ersätta ovanstående värden i Yules formel:

Det finns således en liten negativ samband mellan civilstånd och prestation i undersökningen.

Vi kan titta på problemet från en annan synvinkel också.

Andelen giftiga studenter som misslyckades är = 60 × 100/150 = 40.

Andelen unga studenter som misslyckades är, = 100 × 100/350 = 28, 57 (Ca.

Således misslyckades 40 procent av de gifta studenterna och nästan 29 procent av de ogiftiga studenterna i undersökningen. Därför kan elakternas dåliga prestation hänföras till civilstånd.

Orsakssamfund kan mycket säkert säkras i en experimentell situation. Vi har övervägt denna fråga vid hantering av experimentella mönster. I samhällsvetenskap är det mycket svårt att skapa ett experiment, så de flesta av studierna är icke experimentella. Analytiska förfaranden har dock utformats för att dra slutsatser om orsakssamband i icke-experimentella studier.

Så mycket som de flesta samhällsforskningar innebär en undersökning av de prover som tagits från "befolkningen" och försöker göra generaliseringar till denna "befolkning" är det nödvändigt att i vetenskapens intresse veta hur mycket generaliseringar som dras här är motiverat.

Antag att i en studie på prover av manliga och kvinnliga studenter visar våra resultat signifikanta skillnader mellan de två proverna i fråga om antalet timmar som de ägnar sig åt studier.

Vi kan fråga om skillnaderna som observeras återspeglar de sanna skillnaderna mellan manliga och kvinnliga studenter eller huruvida de två "populationerna" av eleverna faktiskt är lika med avseende på timmarna de ägnar åt studier men de prover som dras från dessa "populationer" för studien kan ha avvikit i så stor utsträckning med "chans".

Ett antal statistiska förfaranden har utformats för att vi ska kunna svara på en sådan fråga när det gäller sannolikhetsförklaringar.

När vi jämför prover eller studerar skillnaden mellan experimentella och kontrollgrupper vill vi normalt testa en viss hypotes om typen av den sanna skillnaden mellan "populationerna" som ska representeras av de undersökta proven.

I samhällsvetenskapen brukar vi vara vana vid en relativt grov hypotes (till exempel brukar de kvinnliga studenterna ägna mer tid åt sina studier än de manliga studenterna).

Vi är vanligtvis inte i stånd att överväga mer specifik eller exakt hypotes (t.ex. som exakt anger skillnaden mellan de två "populationerna"). Antag att våra uppgifter visar att urvalet av kvinnliga studenter ägnar sig åt i genomsnitt fyra timmar att studera medan provet av manliga studenter, bara två timmar.

Det är klart att resultaten av våra prover stämmer överens med hypotesen, dvs kvinnliga studenter ägnar mer tid åt sina studier än sina manliga motsvarigheter. Men vi måste ständigt komma ihåg att möjligheterna att de resultat som baseras på våra prover kanske inte är exakt samma som de resultat vi kan ha erhållit om vi studerat två "populationer" i toto.

Nu vill vi uppskatta om vi fortfarande skulle ha observerat mer tid på studier bland kvinnliga studenter, om vi studerat den totala befolkningen. En sådan uppskattning är möjlig om vi testar "nollhypotesen".

Nollhypotesen säger att "populationerna" inte skiljer sig åt när det gäller egenskaper som studeras. I det här fallet skulle en "nollhypotes" ange att undergrupper av kvinnliga och manliga studenter inte skiljer sig från den tid de ägnar sig åt i studierna i den större "befolkningen" av eleverna som helhet.

Olika statistiska tekniker som kallas tester av betydelse har utformats som hjälper oss att uppskatta sannolikheten för att våra två prover kunde ha skiljat sig i den utsträckning de gör, av en slump, även om det inte finns någon skillnad mellan de två motsvarande "populationerna" av man och kvinnliga studenter med avseende på tid som ägnas åt studier.

Bland de olika metoderna för testning av betydelse beror beslutet om vilken metod som är lämplig för en viss studie av typen av mätningar som används och fördelningen av karaktärerna (t.ex. studietid, antal barn, löneförväntningar etc. ).

De flesta av dessa tester av betydelse förutsätter att mätningarna utgör intervallskala och att fördelningen av karaktäristiken approximerar en normal kurva. I social forskning motsvarar dessa antaganden sällan verkligheten. Den senaste statistiska utvecklingen har emellertid kommit ut med någon form av lösning på detta, i form av icke parametriska test som inte ligger på dessa antaganden.

Vi bör försöka förstå vid denna tidpunkt anledningen till att nollhypotesen bör testas när vårt faktiska intresse är att testa en hypotes (alternativ hypotes, som det kallas) som säger att det finns en skillnad mellan de två "populationerna" representeras av proven.

Anledningen är lätt att uppskatta. Eftersom vi inte känner till den sanna bilden i "befolkningen" är det bästa vi kan göra är att göra slutsatser om det på grundval av vårt urval.

Om vi jämför två prover finns det givetvis två möjligheter:

(1) Antingen är de populationer som representeras av provet lika eller

(2) De är olika.

Våra prover från två "populationer" är olika med avseende på vissa attribut; timmar som ägnas åt studier i vårt exempel. Det kan klart hända att detta kan ske om de två "populationer" som proverna representerar faktiskt skiljer sig åt avseende nämnda attribut.

Detta utgör emellertid inte ett slutgiltigt bevis på att dessa "populationer" skiljer sig, eftersom det alltid finns möjlighet att proverna inte exakt motsvarar de "populationer" som de menar att de representerar.

Vi måste därför tillåta utrymme för möjligheten att det chanselement som är involverat i urvalet av ett prov kan ha gett oss prover som skiljer sig från varandra, även om de två "populationer" som de dras ut skiljer sig inte i själva verket.

Frågan vi kanske vill fråga är därför:

"Skulle vi kunna få olika prover som skiljer sig från varandra i den utsträckning de gör, även om de" populationer "som de dras av skiljer sig inte?" Detta är just den fråga som en "nollhypotes" svarar på.

"Nollhypotesen" hjälper oss att uppskatta vad chansen är att de två proverna som skiljer sig åt i denna utsträckning skulle ha drogs från två "populationer" som faktiskt är lika: 5 i 100? 1 på 100? eller vad som helst.

Om det statistiska testet av betydelse tyder på att det är osannolikt att två prover som skiljer sig åt i denna utsträckning kunde ha drogs från "populationer" som i själva verket är likartade, kan vi dra slutsatsen att de två "populationerna" antagligen skiljer sig från varandra.

En punkt att komma ihåg här är att alla statistiska tester av betydelse och därmed alla generaliseringar från proverna till populationerna vilar på antagandet att proverna inte väljs på ett sätt som förspänning kunde ha gått in i processen att rita proverna.

Med andra ord antas det att det urval som vi valt har ritats på ett sådant sätt att alla fall eller föremål i "befolkningen" hade en lika eller specifik möjlighet att ingå i urvalet.

Om detta antagande inte är motiverat blir testen av betydelse meningslös och oanvändbar. Med andra ord gäller testen av betydelse endast när sannolikhetsprincipen hade använts vid valet av provet.

För att återvända till vår illustration, anta att våra resultat visar ingen skillnad mellan de två proverna: vilket innebär att både manliga och kvinnliga studenter i vårt prov befinner sig att ägna samma tid till sina studier.

Kan vi då säga att de två "populationerna" av manliga och kvinnliga studenter är lika med avseende på detta attribut? Naturligtvis kan vi inte säga detta med någon viss säkerhet eftersom det finns en möjlighet att proven kan vara lika när befolkningen faktiskt skiljer sig.

Men för att gå tillbaka till fallet där de två proven skiljer sig, kan vi bekräfta att de två populationerna de representerar förmodligen skiljer oss om vi kan avvisa "nollhypotesen". det vill säga om vi kan visa att skillnaden mellan de två proverna osannolikt kommer att uppstå om ovanstående "populationer" inte skiljer sig åt.

Men igen finns det en viss chans att vi kan ha fel när vi avvisar "nollhypotesen" eftersom det är sannolikt att även mycket osannolika händelser ibland kan äga rum.

Det finns också en annan sida. Precis som vi kan ha fel när vi avvisar "nollhypotesen" är det också troligt att vi kan ha fel när vi accepterar nollhypotesen. Det vill säga även om vårt statistiska test av betydelse tyder på att provskillnaderna lätt kan ha uppstått av en slump, även om "populationerna" är likartade, kan det ändå vara sant att "befolkningarna" faktiskt skiljer sig åt.

Med andra ord står vi alltid inför risken att göra något av de två typerna av fel:

(1) Vi kan avvisa "nollhypotesen" när det faktiskt är sant,

(2) Vi kan acceptera "nollhypotesen" när det faktiskt är felaktigt.

Den första typen av fel, vi kan kalla typ I-felet. Detta innebär att de två "populationerna" skiljer sig åt när de i själva verket är likadana.

Den andra typen av fel kan kallas typ II-felet. Detta innebär att de två "populationerna" är lika när de i själva verket skiljer sig åt.

Risken att göra typ I-felet bestäms av den nivå av betydelse vi är beredda att acceptera i vår statistiska provning, t.ex. 0, 05, 0, 01, 0, 001, etc. (det vill säga 5 på 100, 1 på 100 och 1 i 1000 Således, om vi exempelvis bestämmer att populationerna verkligen skiljer sig åt när ett test av betydelse visar att skillnaden mellan de två proverna förväntas inträffa av en slump inte mer än 5 gånger i 100.

Detta betyder att om de två "populationerna" som representeras av urvalet faktiskt liknar (med avseende på ett visst attribut), accepterar vi 5 chanser i 100 att vi kommer att ha fel när vi avvisar nollhypotesen. Vi kan naturligtvis minimera risken för att göra typ I-fel genom att göra vårt kriterium för att avvisa nollhypotesen, strängare och stramare.

Vi kan till exempel bestämma nivån på 0, 01, det vill säga vi skulle bara avvisa nollhypotesen om testet visar att skillnaden i de två "proverna" kanske kan ha uppträtt av en slump en gång i hundra.

I själva verket är det som vi säger att vi kommer att avvisa nollhypotesen om testet visar att av ett hundratal prover av en bestämd storlek valda från respektive populationer genom att använda sannolikhetsprincipen, kommer endast ett prov att visa skillnad när det gäller attributen i den utsträckning detta ses i de två prover som studeras.

Kriteriet för att avvisa "nollhypotesen" kan göras ännu strängare genom att ytterligare höja nivån av betydelse. Men svårigheten här är att fel i typ I och typ II råkar vara så relaterade till varandra att ju mer vi skyddar oss mot att göra ett typ I-fel, desto mer sårbara är vi att göra ett typ II-fel.

Efter att ha bestämt omfattningen av risken för typ I-fel som vi är villiga att springa är det enda sättet att minska risken för typ II-fel att ta större prover och använda statistiska tester som maximerar användningen av tillgänglig relevant information.

Situationen med avseende på typ II-felet kan illustreras på ett mycket exakt sätt med hjälp av en "öppnande karakteristisk kurva." Denna kurvs beteende beror på hur stor provet är. Ju större provet är desto mindre sannolikt är det att vi kommer att acceptera en hypotes som föreslår en situation som är extremt långt ifrån verklighetens tillstånd.

I den mån förhållandet mellan typ I och typ II-fel är omvändt, är det nödvändigt att hitta en rimlig balans mellan de två typerna av risker.

I samhällsvetenskap har det nästan blivit en etablerad praxis eller konvention för att avvisa "nollhypotesen" när testet indikerar att skillnaden mellan proverna inte skulle ske av en slump mer än 5 gånger av 100. Men konventionerna är användbara när det finns är ingen annan rimlig guide.

Beslutet om hur balansen mellan de två typerna av fel ska slås måste göras av forskaren. I vissa fall är det viktigare att vara säker på att avvisa en hypotes när det är falskt än att inte acceptera det när det är sant. I andra fall kan det motsatta vara sant.

Till exempel i vissa länder anses det vara viktigare att avvisa en skuldsätt när det är falskt än att inte acceptera den här hypotesen när det är sant, det vill säga en person anses vara oskyldig så länge det finns ett rimligt tvivel om hans skuld. I vissa andra länder anses en person som är skyldig till ett brott skyldigt till en sådan tid som han har visat sin brist på skuld.

I mycket forskning är det givetvis ingen klar grund för att avgöra om ett typ I eller typ II-fel skulle vara dyrare och så använder utredaren den konventionella nivån vid bestämning av statistisk signifikans. Men det kan finnas några studier där en typ av fel klart skulle vara dyrare och skadligare än den andra.

Antag att i en organisation har det föreslagits att en ny arbetsfördelningsmetod skulle vara effektivare och anta att denna metod skulle kräva mycket kostnad.

Om ett experiment består av två grupper av personal - en som fungerar som experimentgrupp och den andra som kontrollgrupp - är inrättad för att testa om den nya metoden verkligen är fördelaktig för organisationsmålen och om det förväntas att den nya metoden skulle innebära en hel del utgifter skulle organisationen inte önska att anta den om det inte fanns stor säkerhet för sin överlägsenhet.

Med andra ord skulle det vara dyrt att göra ett typ 1-fel, dvs dra slutsatsen att den nya metoden är bättre när den inte är så faktiskt.

Om den nya metoden medförde kostnader som var ungefär samma som den gamla metoden skulle typ II-fel vara oönskat och mer skadligt eftersom det kan leda till att ledningens misslyckande antar den nya metoden när den faktiskt är överlägsen och som sådan har långsiktiga fördelar i butik för organisationen.

Alla generaliseringar från provet till "befolkningen" är helt enkelt ett uttalande om statistisk sannolikhet. Låt oss säga, vi har bestämt oss för att arbeta med en 0, 05 nivå av betydelse. Detta innebär att vi endast ska avvisa nollhypotesen om skillnad i sammansättning av den storlek vi har observerat kan förväntas inträffa av en slump inte mer än 5 gånger i 100.

Självklart kommer vi att acceptera "nollhypotesen" om en sådan skillnad kan förväntas utgöra en chans mer än 5 gånger av 100. Nu är frågan: Finns vårt resultat en av dem 5 gånger när en sådan skillnad kan ha Visad av en slump?

Denna fråga kan inte slutgiltigt besvaras på grundval av ett isolerat resultat. Det kan dock vara möjligt för oss att säga något om detta när vi undersöker mönstren inom våra resultat.

Antag att vi är intresserade av att testa effekterna av en film om attityder mot ett visst regeringsprogram, säg familjeplanering. Vi har låt oss säga att vi är noga med att behålla de önskade villkoren för experiment i högsta grad.

Antag nu att vi använder som en åtgärd för attityderna mot programmet, bara ett objekt, nämligen attityden mot avståndsbarn och att de som såg filmen är mer gynnsamma mot denna fråga än de som inte såg filmen.

Antag nu att det statistiska testet visar att skillnaden inte skulle ha uppstått av en slump på grund av slumpmässiga provtagningsfluktuationer mer än en gång i tjugo. Logiskt betyder det också att det kanske har uppträtt av en slump en gång i tjugo (eller 5 gånger i 100). Som vi har påpekat har vi inget bestämt sätt att veta om vårt prov är en av de fem i 100. Nu, vad bäst kan vi göra?

Låt oss säga att vi har ställt 40 olika frågor till respondenterna, vilka är rimliga indikatorer på attityden gentemot familjevårdsregeringen. Om vi använder en konfidensnivå på 5% och om vi ställde 100 frågor kan vi förvänta sig att hitta statistiskt signifikanta skillnader hänförliga till chansen på 5 av dem.

På grund av våra 40 frågor om olika saker kan vi förvänta oss att hitta statistiskt signifikanta skillnader på 2 av dem. Men anta att vi faktiskt finner att på 25 av 40 frågor på de som såg filmen hade mer gynnsamma attityder jämfört med dem som inte såg filmen.

Vi kan i så fall känna oss mycket säkrare när vi konstaterar att det finns en sann skillnad i attityder (även om det statistiska testet indikerar att skillnaden kan ha uppstått av en slump på varje fråga 5 gånger i 100).

Låt oss nu anta att av de 40 frågorna visade svar på endast en, dvs om avståndet mellan barn, en statistiskt signifikant skillnad mellan de två grupperna som utsattes för film och de som inte var). Denna skillnad kan lika väl ha inträffat av en slump.

Å andra sidan kan det hända att filmens innehåll faktiskt påverkat åsikterna på denna punkt men inte på någon annan (såsom den som rör sterilitetsoperationer). Men om inte vår hypotes speciellt har förutspått i förväg att filmen skulle vara mer benägen att påverka attityderna mot avstånd mellan barn än attityderna mot något av de andra 39 frågorna, är vi inte berättigade att göra denna tolkning.

En sådan tolkning, det vill säga en åberopad att förklara fynden efter att de har överskridits, kallas "efter faktum" tolkning, för det handlar om förklaringar som lämnas för att motivera resultaten, oberoende av vad de är. Det beror på forskarens uppfinningsförmåga, vilken förklaring han kan uppfinna för att motivera dessa resultat. Han kan därför motivera till och med de motsatta resultaten.

Merton har mycket tydligt påpekat att post-factum tolkningarna är utformade för att "förklara" observationer. Metoden för förklaring efter faktum är helt flexibel. Om forskaren finner att de arbetslösa brukar läsa färre böcker än tidigare, kan det här förklaras av att hypotesen om att ångest som uppstår genom arbetslöshet påverkar koncentrationen och att behandlingen blir svår.

Om det observeras att de arbetslösa läser fler böcker än tidigare (när de är anställda), kan en ny efterfaktumförklaring åberopas. Förklaringen är att de arbetslösa har mer fritid och därför läser de fler böcker.

Det kritiska testet på "ett erhållet förhållande (bland variabler) är inte efterföljande rationaliseringar och förklaring till det; Det är snarare förmågan att förutsäga det eller att förutsäga andra relationer utifrån det. Således kan vår tidigare oförutsedda upptäckt av en skillnad i attityder mot avstånd mellan barn, även om det är statistiskt signifikant, inte anses som fastställd av den undersökning som vi har utfört.

Eftersom statistiska uttalanden är sannolikhetssannolikheter kan vi aldrig helt förlita oss på de statistiska bevisen ensam för att avgöra huruvida vi kommer att acceptera en hypotes som sann.

Förtroende för tolkningen av ett forskningsresultat kräver inte bara statistiskt förtroende för funktionalitetens tillförlitlighet (det vill säga att skillnaderna inte sannolikt kommer att ha inträffat av en slump), men dessutom några bevis på giltigheten av förutsättningar för forskningen.

Detta bevis är nödvändigtvis indirekt. Det kommer från kongruensen av de givna forskningsresultaten med annan kunskap som har motstått tidstestet och därmed som det finns stor säkerhet.

Även i den mest noggrant kontrollerade undersökningen kräver upprättandet av förtroende för tolkningen av sina resultat eller i påförandet av kausalförhållanden replikering av forskning och relateringen av resultaten till andra studier.

Det är nödvändigt att notera att även om statistiska test och resultaten från ett antal studier tyder på att det faktiskt finns en konsekvent skillnad mellan två grupper eller konsekvent relation mellan två variabler, utgör detta fortfarande inte bevis på orsaken till förhållandet.

Om vi vill teckna orsakssamband (t.ex. X producerar Y) måste vi uppfylla antaganden utöver de som krävs för att fastställa existensen av ett förhållande. Det är också värt att notera att ett resultat inte är socialt eller psykologiskt viktigt bara för att det är statistiskt signifikant. Många statistiskt signifikanta skillnader kan vara triviala i praktiska sociala parlamenter.

Till exempel kan en genomsnittlig skillnad på mindre än en IQ-punkt mellan stads- och landsbygden vara betydande statistiskt, men inte så i det praktiska vardagliga livet. Kontrarivis finns det fall där en liten men pålitlig skillnad har stor praktisk betydelse.

I en storskalig undersökning kan exempelvis en skillnad på hälften eller en procent representera hundratusentals människor och medvetenheten om skillnaden kan vara viktig för betydande politiska beslut. Därför ska forskaren förutom att vara oroad över den statistiska betydelsen av hans fynd också vara oroade över deras sociala och psykiska betydelser.

Inferrerande orsakssamband:

På grund av uppenbara svårigheter kan sådana styva experimentella mönster sällan utarbetas i sociala vetenskapliga undersökningar. De flesta av förfrågningarna inom samhällsvetenskapen är icke-experimentella i karaktär.

I sådana studier finns det vissa empiriska hinder i sättet att bestämma huruvida förhållandet mellan variabler är kausal. Det har upprepats nämnts att en av de svåraste uppgifterna i analysen av data om socialt beteende är upprättandet av orsak och effektrelationer.

En problematisk situation beror på sitt ursprung och processen att bli, inte bara för en faktor utan för ett komplex av olika faktorer och sekvenser.

Processen med att urskilja dessa element utgör en stor utmaning för den sociologiska fantasin och sätter för att testa forskarnas skicklighet. Det är farligt att följa en "enspårig" förklaring som leder till orsaken. Det är absolut nödvändigt att leta efter ett helt batteri orsakssamband som generellt spelar en viktig roll för att skapa komplexa sociala situationer.

Som Karl Pearson påpekar, "inget fenomen eller steg i följd har bara en orsak; alla antecedenta steg är successiva orsaker; när vi vetenskapliga stater orsakar beskriver vi verkligen de successiva stadierna i en rutin av erfarenhet. "

Yule och Kendall har erkänt det faktum att statistik "måste acceptera för analys, uppgifter som påverkas av en mängd orsaker och måste försöka upptäcka från de data själva vilka orsaker är de viktigaste och hur mycket av den observerade effekten beror på driften av varje. "

Paul Lazarsfeld har spårat faserna i den teknik som han kallar "kräsna". Han förespråkar sin användning vid bestämning av orsakssamband mellan variabler. Lazarsfeld lägger ned följande procedur:

(a) Verifiera en påstådd händelse enligt följande:

För att verifiera denna händelse är det nödvändigt att kontrollera om personen faktiskt har upplevt de påstådda situationerna. Om så är fallet, hur manifesterar sig förekomsten och under vilka förhållanden i sitt omedelbara liv?

Vilka skäl är det för att tro att det finns en specifik sammankoppling mellan två variabler, t.ex. förlust av anställning och förlust av myndighet? Hur korrekt är personens resonemang i det här fallet?

(b) Försök att upptäcka om det påstådda villkoret överensstämmer med objektiva fakta om den här personens tidigare liv.

(d) Rulla ut de förklaringar som inte överensstämmer med mönstret av händelser.

Det är ganska förståeligt att de flesta svårigheter eller hinder för att etablera kausal relationer stör de flesta experimentella studier mest kraftigt. I icke-experimentella studier där intresset är att upprätta orsakssamband mellan två variabler, måste utredaren hitta ersättare för skyddsåtgärder som är patenterade inbyggda i experimentstudierna.

Många av dessa skyddsåtgärder ingår vid planering av datainsamling, i form av att samla in information om ett antal variabler som kanske skulle vara de alternativa förutsättningarna för att producera den hypoteserade effekten.

Genom att införa sådana ytterligare variabler i analysen approximerar forskaren några av de kontroller som är inneboende i experimenten. Trots detta är tecknandet av orsak av orsakssamband alltid förblev något farligt i icke-experimentella studier.

Vi ska nu diskutera några av problemen och strategierna för att övervinna dem, relaterade till att dra slutsatser om orsakssamband i icke-experimentella studier. Om en icke-experimentell studie pekar på ett förhållande eller samband mellan två variabler, säg X och Y, och om forskningsintresset ligger i orsakssamband istället för i det enkla faktumet av association mellan variabler, har analysen endast tagit sitt första steg.

Forskaren måste vidare överväga (förutom föreningen mellan X och Y) huruvida Y (effekt) kan ha inträffat före X (den hypotetiska orsaken), i vilket fall Y inte kan vara effekten av X.

Förutom denna övervägning måste forskaren överväga frågan huruvida andra faktorer än X (den hypoteserade orsaken) kan ha producerat Y (den hypotetiska effekten). Detta är allmänt omhändertagen genom att införa ytterligare variabler i analysen och undersöker hur förhållandet mellan X och Y påverkas av dessa ytterligare variabler.

Om förhållandet mellan X och Y fortsätter även när andra antagligen effektiva och möjligen alternativa variabler införs, är hypotesen att X är orsaken till Y kvarhållbar.

Till exempel, om förhållandet mellan att äta en viss säsongsbetonad frukt (X) och kallt (Y) inte förändras även när andra variabler som ålder, temperatur, matsmältningsgrad etc. introduceras i analysen, kan vi acceptera hypotesen att X leder till Y som hållbar.

Men det är inte möjligt i några få fall att införandet av andra ytterligare variabler kan ändra förhållandet mellan X och Y. Det kan minska för att helt eliminera förhållandet mellan X och Y eller det kan förbättra förhållandet i en grupp och minska det i en annan.

Om förhållandet mellan X (ätning av säsongsbetonad frukt) och Y (kall) förbättras i en undergrupp som karaktäriseras av Z (dåligt tillstånd i matsmältningen) och reduceras i undergruppen som inte kännetecknas av Z (normalt tillstånd av matsmältningen) kan konstatera att Z är det villkorliga villkoret för förhållandet mellan X och Y.

Det betyder med andra ord att vi har kunnat ange villkoret (Z) enligt vilket förhållandet mellan X och Y rymmer. Nu om införandet av Z i analysen minskar eller helt eliminerar förhållandet mellan X och Y, kommer vi att vara säkra på att antingen sluta att X inte är en Y-tillverkare, det vill säga förhållandet mellan X och Y är "falskt" eller det Vi har spårat processen genom vilken X leder till Y (dvs genom Z).

Låt oss vända oss till den situation där vi med rätta kan dra slutsatsen att förhållandet mellan X och Y är falskt.

Ett uppenbart förhållande mellan två variabler X och Y sägs vara falskt om deras samtidiga variation inte beror på en koppling mellan dem utan av det faktum att var och en av dem (X och Y) är relaterad till någon tredje variabel (Z) eller en kombination av variabler som inte tjänar som en länk i processen med vilken X leder till Y.

Situationen som karakteriserar falskt förhållande kan vara schematiskt enligt följande:

Målet är att bestämma orsaken till Y, den beroende variabeln (låt oss säga, den penningpolitiska förväntningen av högskoleexamen). Förhållandet (bruten linje) mellan X den oberoende variabeln (låt oss säga de betyg som erhållits av studenterna) och den monetära förväntningen av akademiker (Y) har observerats i samband med analysen av data.

En annan variabel (Z) introduceras för att se hur förhållandet mellan X och Y beter sig med inmatningen av den tredje faktorn. Z är den tredje faktorn (låt oss säga inkomstnivå för föräldrar till studenter). Vi finner att introduktionen av denna faktor minskar förhållandet mellan X och Y.

Det är sålunda konstaterat att förhållandet mellan högre betyg i undersökningen och högre penningmässiga förväntningar inte håller fast, men minskas väsentligt när vi introducerar den tredje variabeln, det vill säga nivån på föräldrarnas inkomst.

En sådan introduktion av Z visar att faktum att inte X men Z antagligen kan vara en avgörande faktor för Y. Så förhållandet mellan X och Y (visat i diagrammet med en streckad linje) är en falsk, medan förhållandet mellan Z och Y är en riktig. Låt oss illustrera detta med hjälp av hypotetiska data.

Antag att det i samband med analysen av data i en studie sågs att det finns en signifikant samband mellan de betyg eller avdelningar (I, II, III) som studenterna säkrade i undersökningen och den lön som de förväntar sig för ett jobb som de kan utses till.

Man såg till exempel att de första divisionerna bland studenterna i allmänhet förväntade sig en högre ersättning jämfört med andra divisioner och de andra divisionerna väntas mer jämfört med tredje divisioner.

Följande tabell illustrerar det hypotetiska tillståndet:

Det framgår klart av tabellen att det finns grund för att hypotesen är att eleverna bestämmer sina förväntningar om lönerna. Låt oss nu anta att forskaren på något sätt slår på tanken att föräldrarnas inkomstnivå (X) kan vara en av de viktiga variabler som bestämmer eller påverkar elevernas förväntningar på lönerna (Y). Således införs Z i analysen.

Antag att följande tabell representerar förhållandet mellan variablerna:

Notera:

HML i den horisontella raden, som delar varje kategori av elevernas betyg, står respektive för hög föräldra inkomstnivå, moderat föräldra inkomstnivå och låg föräldra inkomstnivå. Tabellen ovan visar tydligt att förhållandet mellan X och Y har blivit mindre signifikant jämfört med förhållandet mellan Z och Y. '

För att få en tydligare bild, låt oss se följande tabell (en version av tabell B uteslutande kategorierna X) som visar förhållandet mellan Z och det vill säga föräldrainkomstnivån och elevernas penningförväntningar:

Vi kan mycket tydligt se från tabellen att, oavsett deras betyg, elevernas penningförväntningar påverkas mycket starkt av föräldrarnas inkomstnivåer (Z).

Vi ser att ett överväldigande antal studenter (dvs. 91, 5%) med höga monetära förväntningar är från den höga föräldrainkomsten, 92% med måttliga monetära förväntningar är från måttlig föräldrainkomstgrupp och till sist har 97% låga monetära förväntningar från låg föräldrainkomstgrupp.

Om man jämför den här bilden med bilden som anges i tabell A kan vi säga att relationen mellan X och Y är falsk, det vill säga att eleverna inte bestämde primärt nivån på studenternas penningförväntningar.

Det framgår av tabell A att eleverna får en högre betygsvisning en signifikant tendens mot högre monetära förväntningar, medan de lägre klasserna har en mycket stark koncentration i den lägre penningpolitiska förväntningsfästet.

Men när vi introducerar den tredje variabeln av föräldrainkomsten blir den framväxande bilden tillräckligt för att motivera slutsatsen att den faktiska faktorns ansvariga skillnadsnivåer av penningmässiga förväntningar är nivån på föräldrainkomster.

I tabell C ser vi en mycket stark och formidabel koncentration av fall av studenter motsvarande de tre nedan nämnda kombinationerna, nämligen högre monetära förväntningar och högre föräldrainkomst, måttliga penningmässiga förväntningar och måttlig föräldrainkomst och lägre penningmässiga förväntningar och lägre föräldrainkomst, dvs 5%, 92, 1% respektive 1%.

Spårning av processen involverad och ett förhållande mellan variabler: Som tidigare nämnts kan en tredje faktor Z reducera eller eliminera förhållandet mellan den oberoende variabeln X och den beroende variabeln Y, och vi kan sluta antingen att förhållandet mellan X och Y är falskt, eller att vi har kunnat spåra processen genom vilken X leder till Y.

Vi ska nu överväga de omständigheter som skulle motivera slutsatsen att processen med förhållandet mellan X och Y har spåras genom en tredje faktor Z.

Antag att i en studie fann utredarna att mindre samhällen hade ett högre genomsnittligt intimitetspoäng, intimitetspoängen som ett mått på intimiteten för associering mellan medlemmar i ett samhälle anlände till med hjälp av en intimitetsskala.

Antag att de också fann att de medelstora samhällena hade ett mindre intimitetspoäng jämfört med småskaliga samhällen och stora samhällen hade minst genomsnittliga intimitetspoäng. Ett sådant resultat tyder på att samhällets storlek bestämmer föreningsintressen bland medlemmar i samhället.

Med andra ord motiverar observationerna slutsatsen att de medlemmar som bor i ett litet samhälle har en större intresse för associering, medan de stora samhällena kännetecknas av en mindre intressen av associering bland medlemmarna.

Följande tabell visar hypotetiska data:

I tabellens andra kolumn har prover som motsvarar var och en av samhällena visats.

I tabellens andra kolumn har prover som motsvarar var och en av samhällena visats. I kolumn 3 har de genomsnittliga intimitetspoäng som motsvarar de typer av samhällen som beräknats på grundval av svaren på vissa poster i en skala relaterad till de dagliga föreningarna bland medlemmar har visats.

Det framgår av tabellen att de genomsnittliga intimitetspoängen varierar omvänt med storleken på samhället, dvs mindre storlek, desto större intimitetspoäng och omvänt, större storlek desto lägre intimitetspoäng.

Antag nu att utredarna fick tanken på att de tre typerna av samhällen skulle skilja sig åt när det gäller möjligheter som de erbjuder för interaktion mellan medlemmar, i så stor utsträckning som de levande arrangemangen, bostadsmönstret, gemensamt utnyttjande etc. skulle främja en sådan förening.

Undersökarna skulle således introducera den tredje faktorn i analys av interaktionspotentialen, det vill säga i vilken utsträckning de omständigheter som personerna bor i sannolikt kommer att ge möjlighet till interaktion mellan sig.

För att kontrollera hypotesen att det var till stor del genom skillnader i bostadsmönster, levande arrangemang, gemensamt gemensamma bekvämligheter etc., att de tre typerna av samhällen gav upphov till skillnader i interaktion mellan medlemmar i ett samhälle, skulle utredarna betrakta storleken på samhället och interaktion-potential gemensamt i förhållande till det genomsnittliga intimitetsresultatet.

Infraktionspotentialen är således den tredje variabla Z som introduceras i analysen. Interaktionspotentialen klassificeras, låt oss säga, till en interaktionspotential med låg interaktionspotential (b), och (c) hög interaktionspotential.

Följande tabell representerar hypotetiska data:

Läser över raderna i tabellen ser vi att interaktionspotentialen är starkt relaterad till medlemmarnas medlemmars intimitetspoäng, oavsett storlek på samhället.

Det är, om vi betraktar raden för småskaliga samhällen, för de medelstora samhällena, eller för de stora samhällena, finns det i varje fall en ökning av det genomsnittliga intimitetsresultatet med ökad interaktionspotential. Dessutom blir det klart att storleken på samhället och interaktionspotentialen har en signifikant korrelation med att läsa in rubrikerna över raderna.

Till exempel lever ungefär två tredjedelar av de som svarar i ett litet samhälle under förhållanden med hög interaktionspotential. Vi finner också att en mycket mindre andel av de medelstora samhällsinvånarna lever under höga interaktionspotentiella förhållanden och en mycket liten andel av de stora medborgarnas invånare under höga interaktionspotentialbetingelser.

Nu läser vi intimitetspoängen bara i kolumnerna för att finna att förhållandet mellan typ av samhälle och föreningsintimitet har minskat avsevärt. Faktum är att för personer som lever under potentiella förhållanden med hög interaktion, uppnås inget bestämt förhållande mellan samhällets storlek och intimitetsresultatet.

Utifrån denna uppsättning relationer kan utredarna dra slutsatsen att det omvända förhållandet mellan samhällets storlek och intimitetsresultatet håller bra, men att ett av de stora sätten på vilka en viss typ av gemenskap uppmuntrar intimitet bland medlemmarna är att erbjuda möjligheter som ökar interaktionshastigheten bland dem.

Med andra ord kännetecknas de småskaliga samhällena av ett högre genomsnittligt intimitetsresultat eftersom deras lilla storlek ger en inställning för många möjligheter till hög grad av interaktion mellan medlemmarna. Storstora samhällen kännetecknas däremot av ett relativt lägre intimitetsresultat.

Men det lägre intimitetspoänget kan inte hänföras till samhällets storlek i sig, utan till det faktum att en storstor grupp inte kan erbjuda möjligheter till högre samverkan mellan medlemmarna som de småstora samhällena gör.

Utredarna snarare än att dra slutsatsen att förhållandet mellan samhällets storlek och det genomsnittliga intimitetsresultatet mellan medlemmarna är falskt, kan dra slutsatsen att de har kunnat spåra processen genom vilken X (dvs. typen av gemenskap) påverkar Y (intimitetsresultatet).

Den förstnämnda berättigade slutsatsen att förhållandet mellan variablerna X och Y var falskt och det senare slutsatsen att processen från X till Y kan spåras genom Z (X till Z till Y). I båda fallen minskade eller eliminerade introduktionen av en tredje variabel Z förhållandet mellan dem (X och Y).

En skillnad kan dock noteras. I det första exemplet var variabeln Z (dvs. föräldrarnas inkomstnivå) tydligt tidigare i tid till de andra två variablerna (studerandekvaliteten i studerandes examen och penningmässiga förväntningar).

I det andra exemplet uppträdde den tredje variabeln Z (interaktionspotential som samhällen gav) inte före den antagna orsakssvariabeln (samhällets storlek). Det var samtidigt med det och kanske tänkt på att börja efter det.

Tidssekvensen för variablerna är således en viktig faktor vid bestämning av huruvida ett uppenbart orsakssamband är falskt. Det vill säga om den tredje variabeln Z, vilken avlägsnar eller eliminerar förhållandet mellan de ursprungligen relaterade variablerna X och Y, sluter vi vanligtvis att det uppenbara orsakssambandet mellan variablerna X och Y är falskt.

Men om den tredje variabla Z är känd eller antagen ha inträffat vid samma tidpunkter som X eller efter X, kan det vara för att dra slutsatsen att processen med vilken X leder till Y har spåras. För att ha viss mått på Förtroende för orsakssamband som härrör från studier som inte är experimentella karaktär, är det nödvändigt att underkasta dem det kritiska testet för att eliminera de andra eventuellt relevanta variablerna.

Av denna anledning är det viktigt att i studien samla in data om sådana eventuellt inflytelserika variabler andra än de som hypotesen av studien är centralt berörda.

Det anfördes tidigare att införandet av en tredje variabel i analysen kan få en effekt att intensifiera förhållandet inom en undergrupp och att minska detsamma i en annan undergrupp. Om så är fallet säger vi att vi har angett ett villkor (Z) enligt vilket förhållandet mellan X och Y rymmer.

Låt oss nu illustrera specifikationsprocessen. Antag att vi i en samhällsstudie råkar identifiera en relation mellan inkomst och utbildningsnivå.

Detta visas i tabellen nedan:

Vi ser i tabellen att förhållandet mellan utbildning och inkomst är ganska markant. Högre utbildningen ökar i allmänhet andelen fall som ger en årlig inkomst på Rs.5.000 / - och däröver. Vi kan dock bestämma att förhållandet kräver ytterligare specifikation.

Det vill säga, vi kanske vill veta mer om villkoren för detta förhållande. Antag att tanken slår oss fast att faktorn hos de som bor i stadsindustriella samhällen faktiskt kan påverka fördelarna med utbildningen för ersättning och därmed dess reflektion i inkomst.

Med detta antagande introducerar vi den tredje faktorn Z, det vill säga de respondenter som bor i industriområdet i städerna och de som bor i landsbygdens icke-industriella samhälle, in i analysen och ser hur det påverkar det ursprungliga förhållandet mellan X och Y ( dvs utbildning och inkomst).

Antag att vi får en bild som visas i följande tabell:

Vi kan tydligt se att tabell B återspeglar ett mycket annat förhållande mellan inkomst och utbildning för de människor som bor i landsbygdens icke-industriella samhälle jämfört med dem som bor i stadsindustrin. Vi ser att för dem som bor i industriländerna är förhållandet mellan utbildning och inkomst något högre än det ursprungliga förhållandet.

Men för dem som bor i landsbygdens icke-industriella samhällen är förhållandet i tabellen ovan betydligt lägre än det ursprungliga förhållandet.

Således har introduktionen av den tredje faktorn och nedbrytningen av det ursprungliga förhållandet på grundval av den tredje faktorn (Z) hjälpt till att specificera ett tillstånd under vilket förhållandet mellan X och Y är mer uttalat, liksom även villkoret enligt vilket Relationen är mindre uttalad.

På samma sätt antar vi att en studie som visar att personer som hör till kategorin högre inkomst har i allmänhet mindre antal barn jämfört med dem i låginkomstkategorin. Antag att vi (med utgångspunkt i en teoretisk orientering) känner att stadsboendet kan vara viktigt för att påverka förhållandet.

Förmodligen finner vi att det ursprungliga förhållandet mellan inkomstnivå och antal barn blir mer uttalat i staden och att det blir mindre uttalat bland landsbygden än vi har identifierat ett villkor Z (dvs. stadsboende ) där relationen blir avgörande förstärkt eller uttalad.

Tolka resultaten av en studie

Hittills har vi oroat oss huvudsakligen med de procedurer som tillsammans består av, vad vi brukar kalla, analys av data. Forskarens uppgift är emellertid ofullständig om han slutar genom att presentera sina fynd i form av empiriska generaliseringar som han kan komma fram till genom analys av data.

En forskare som till exempel slår upp sin forskningsövning bara genom att hävda att "det ogiftade folket har en högre förekomst av självmord jämfört med det gifta folket", uppfyller knappast sin övergripande skyldighet för vetenskapen, även om den empiriska generalisering han har lagt fram har något värde av sig själv.

Forskaren i vetenskapens större intresse måste också försöka visa att hans observation pekar på vissa underliggande relationer och processer som ursprungligen är gömda för ögat. Forskaren måste med andra ord visa att hans observation har betydelse, mycket bredare och djupare än den som den verkar ha på ytanivå.

För att återvända till vårt exempel på självmord bör forskaren kunna visa att hans observation att "de ogiftade människorna kännetecknas av självmord" i själva verket återspeglar det djupare förhållandet mellan social sammanhållning och självmordshastighet (Durkheims teori).

När forskaren har kunnat avslöja de relationer och processer som ligger till grund för sina konkreta resultat kan han skapa abstrakta relationer mellan hans fynd och olika andra.

I huvudsak går forskarens arbete långt utöver insamling och analys av data. Hans uppgift omfattar att tolka resultaten av hans studie. It is through interpretation that the researcher can understand the real significance of his findings, ie, he can appreciate why the findings are what they are.

As was stated earlier, interpretation is the search for broader and more abstract meanings of the research findings. This search involves viewing the research findings in the light of other established knowledge, a theory or a principle. This search has two major aspects.

The first aspect involves the effort to establish continuity in research through linking the results of a given study with those of another. It is through interpretation that the researcher can unravel or comprehend the abstract principle beneath the concrete empirical observations.

This abstract common denominator having been discerned, the researcher can easily proceed to link his findings up with those of other studies conducted in diverse settings, diverse in matters of detail but reflecting the same abstract principle at the level of findings.

Needless to say that the researcher can on the basis of the recognition of the abstract theoretic principle underlying his finding, make various predictions about the concrete world of events quite unrelated seemingly to the area of his findings. Thus, fresh inquiries may be triggered off to test predictions and understandably, such studies would have a relationship with the researcher's initial study.

In a somewhat different sense, interpretation is necessarily involved in the transition from exploratory to experimental research. The interpretation of the findings of the former category of researches often leads to hypotheses for the latter.

Since, an exploratory study does not have a hypothesis to start with, the findings or conclusions of such a study have to be interpreted on a 'post-factum' interpretation is often a hazardous game fraught with dangerous implications. Such an interpretation involves a search for a godfather in the nature of some theory or principle that would adopt (ie, explain) the findings of the study.

This quest often turns out to be an exercise on the part of the researcher to justify his findings by locating some suitable theory to fit his findings. As a result quite so often contradictory conclusions may find their 'godfathers' in diverse theories.

This aspect of post-factum interpretation, comprising attempts at rationalizing the research findings, should be clearly borne in mind when proceeding with it. On occasions there is, however, no other alternative to it.

Secondly, interpretation leads to the establishment of explanatory concepts. As has been pointed out, interpretation of findings involves efforts to explain why the observations or findings are, what they are. In accomplishing this task, theory assumes central importance.

It is a sensitizer and a guide to the underlying factors and processes (explanatory bases) beneath the findings. Underneath the researcher's observations in the course of a study, lies a set of factors and processes which might explain his observations of the empirical world. Theoretical interpretation uncovers these factors.

The researcher's task is to explain the relations he has observed in the course of his study, by exposing the underlying processes which afford him a deeper understanding of these relations and point to the role of certain basic factors operating in the problem area of his study.

Thus, interpretation serves a twofold purpose. First, it gives an understanding of the general factors that seem to explain what has been observed in the course of a study and secondly, it provides a theoretical conception which can serve in turn as a guide for further research.

It is in this manner that science comes to cumulatively disengage more successfully the basic, processes which shape the portion of the empirical world with which a researcher is concerned.

Interpretation is so inextricably intertwined with analysis that it should more properly be conceived of as a special aspect of analysis rather than a separate or distinct operation. In closing, we are tempted to quote Prof. C. Wright Mills who has stated the very essence of what all is involved in the analysis (involving interpretation) of data.

Says Mills, “So you will discover and describe, setting up types for the ordering what you have found out, focusing and organizing experience by distinguishing items by name. This search for order will cause you to seek patterns and trends and find relations that may be typical and causal. You will search in short, for the meaning of what you have come upon or what may be interpreted as a visible token of something that seems involved in whatever you are trying to understand; you will pare it down to essentials; then carefully and systematically you will relate these to one another in order to form a sort of working model….”

“But always among all details, you will be searching for indicators that might point to the main drift, to the underlying forms and tendencies of the range of society in its particular period of time.” After a piece of research is terminated, the statement that raises an array of new questions and problems may be made.

Some of the new questions constitute the groundwork for new research undertakings and formulation of new theories which will either modify or replace old ones. This is indeed, what research means. It serves to open new and more wider avenues of intellectual adventure and simulates the quest for more knowledge as well as greater wisdom in its use.