Korrelation: Åtgärder, beräkning och metod

Efter att ha läst den här artikeln kommer du att lära dig om: - 1. Korrelationsåtgärder 2. Beräkning av korrelation 3. Metoder.

Korrelationsåtgärder:

Karl Pearsons korrelationskoefficient (enskilda observationer) :

För att beräkna graden eller omfattningen av korrelation och korrelationsriktning är Karl Pearsons metod det mest tillfredsställande.

Symboliskt sett är formuleringen enligt följande:

där dx är avvikelsen för olika objekt i den första variabeln från ett antaget medelvärde och dy, motsvarar motsvarande avvikelser för den andra variabeln från det antagna genomsnittet och N antalet par av objekt.

Tillämpningen av formeln förklaras med hänvisning till följande hypotetiska data:

Beräkning av koefficient i korrelation i en kontinuerlig serie:

Vid en kontinuerlig serie klassificeras data i en tvåvägs frekvens tabell. Beräkning av korrelationskoefficienten med avseende på grupperade data baseras på antagandet att varje objekt som faller inom ett givet klassintervall antas falla exakt vid medelvärdet av den klassen.

Som en illustration ska vi beräkna koefficienten eller korrelationen med avseende på följande data:

Formeln för beräkning av korrelationskoefficienten i detta fall kommer att ta följande formulär:

Den enda förändringen i ovanstående formel i jämförelse med den tidigare är införandet av f som står för frekvens.

Med hjälp av formeln till tabell 18.50 får vi:

Rankskillnad Metod för korrelation:

Om det inte är möjligt med direkt mätning av fenomenet som studeras, till exempel av egenskaper som effektivitet, ärlighet, intelligens, etc. används skillnadsmetoden för att få reda på omfattningen av korrelationen.

Formeln för beräkning av rangkorrelation är:

där R betecknar koefficient för rangkorrelation mellan parade led, anger D skillnaderna mellan de parade raderna och N står för antalet par.

Vi ska med hjälp av följande exempel illustrera tillämpningen av ovanstående formel:

Beräkning av korrelationskoefficienten med hjälp av skillnadsmetod :

(När det finns två eller flera föremål som har samma värde) :

Om det finns mer än ett objekt med samma värde, ges en gemensam rang till sådana objekt. Denna rang är medelvärdet av de led som dessa objekt skulle ha fått, om det hade varit en liten skillnad i deras värden. Antag att betygen från fem studenter är 70, 66, 66, 65, 63.

Om dessa märken är ordnade i fallande ordning, skulle figuren 70 få den första rankningen, 66 den andra rankningen, 65 den tredje och 63, den fjärde rangen. Sedan har de två eleverna i exemplet en lika poäng deras rang är 2. Nu kommer de att få den genomsnittliga rangordningen för de led som dessa elever skulle ha säkrat om de skilde sig något från varandra.

På detta antagande skulle rankningen av båda objekten vara 2 + 3/2. dvs 2, 5 och rangordningen för nästa punkt (65) skulle vara 4. Således skulle koefficienten för rangkorrelation behöva en korrigering eftersom ovanstående formel [R = 1 6ΣD ² / N (N ² -1] är baserad på antagandet att rangerna av olika föremål är olika.

Om det finns mer än ett objekt med samma värde, läggs en korrektionsfaktor 1/12 (t ³ -t) till värdet av zd ², där t. står för antal objekt vars rang är vanliga. Denna korrigeringsfaktor läggs till så många gånger som antalet objekt med gemensamma rader förekommer.

Detta förklaras i följande exempel:

Analys av data och tolkning

Exempel:

Beräkna koefficienten för rangkorrelation från följande data:

I ovanstående dataset av X-serien uppträder talet 60 tre gånger. Rangordningen för alla tre objekten är 5, vilket är medeltalet 4, 5 och 6, de led som dessa objekt skulle ha säkrat om de skilde sig något från varandra. Andra nummer 68 i X-serien och 70 i Y-serien har skett två gånger. Deras rang är respektive 2, 5 och 1, 5.

Således:

Den modifierade formeln för koefficienten för rangkorrelation skulle således vara:

där n står för antalet repeterade föremål. Med avseende på ovanstående exempel kommer formeln att vara:

En försiktighet som hänför sig till betydelsen och implikationen av korrelationskoefficienten är ganska motiverad. Korrelationskoefficienten är i sig en väldigt användbar uppskattning av förhållandet, inte som ett absolut bevis på associering mellan relevanta variabler, så mycket som dess tolkning beror i stor utsträckning på storleken på det urval som valts för studien, som också om arten av de insamlade uppgifterna.

En till synes hög korrelationskoefficient, exempelvis 0, 80 (+), kan verkligen vara ganska vilseledande om standardfelet som indikerar provfluktuationer är relativt stort, eller för att ta ett motsatt exempel kan en till synes låg koefficient på 0, 45 (+) tyder på att förhållandet mellan variablerna väl kan ignoreras men på verklighetens plan, kan denna indikation igen vara felaktig, eftersom korrelationskoefficienten för vissa variabler typiskt kan vara så låg att ovannämnda korrelationskoefficient, dvs 0, 45 i jämförelse skulle behöva betraktas som relativt ganska hög för den aktuella klassen av data.

Men statistisk konvention bestämmer att korrelationskoefficienten varierar från 1 till 0, 7 (+) som en indikation på "hög" eller signifikant korrelation, som sträcker sig från 0, 7 till 0, 4 (+) som väsentligt, att mellan 0, 4 och 0, 2 (+ ) så lågt och att under 0, 2 (+) så försumbar.

Det måste också betonas att en hög korrelation mellan två variabler inte i sig utgör ett bevis på att de är tillfälligt relaterade. En väsentlig korrelation mellan variabler - till exempel mellan inkomst och storlek på familjen eller storleken på en utbildningsinstitution och studenternas prestation - ger knappast någon indikation på ett ledigt förhållande mellan dem.

Antag att vi skulle finna att högre inkomst är inbördes korrelerad med antalet problem (barn), dvs högre föräldrarnas inkomst, desto mindre är deras antal problem (korrelationskoefficienten är 0, 8 som är statistiskt ganska hög), Vi kommer att vara felaktiga och obehöriga att säga att högre inkomst är orsaken till lägre fertilitet.

Det påpekades tidigare att orsakssambandet endast är motiverat om tre typer av bevis, samtidig variation, tidsordning och eliminering av någon annan variabel som det bestämda tillståndet för den hypoteserade effekten kan säkras.

I det aktuella fallet kan följande följder eventuellt dras i full hänsyn till den uttalade korrelationen som framgår av variablerna av inkomst och antal barn:

(a) Man kan orsaka den andra,

b) Både variablerna kan vara effekterna av någon annan orsak eller orsaker, och

(c) Föreningen kan vara en enda chans förekomst. Kausala slutsatser kan uppenbarligen uppenbarligen fastställas i en experimentell situation.

Vi har övervägt detta när det gäller experimentella mönster. I samhällsvetenskapen är det mycket svårt att skapa experiment, så målsättningen för studierna är icke-experimentella. Analytiska förfaranden har dock utformats för att dra slutsatser om orsakssamband i icke-experimentella studier.

Socialforskaren är ganska så ofta intresserad av att uppskatta graden av koppling mellan attribut, dvs mellan variabler som definieras kvalitativt; till exempel kan han bestämma graden av samband mellan den sexuella attributet och politiska preferensen eller mellan nativity och attityd mot en viss social fråga.

I grund och botten är föreningsproblemet en av korrelation men associeringen mellan attribut kan inte lätt bli mottaglig för matematisk behandling som vid kvantitativa mått av variabler. Ett mått på en sådan förening bland attribut är koefficienten för relativ förutsägbarhet (RP) som faktiskt är en kvalitativ korrelationskoefficient.