Prediction of Job Success (med diagram och statistik)

Förutsägandet av arbetssucces innebär att man bestämmer i vilken utsträckning prediktorn är relaterad till kriteriet. Anta att man var intresserad av att sätta upp ett urvalsprogram för att anställa nya filbyråer. Antag vidare att det hade blivit bestämt att använda ett pappers-och-penna-test av administrativ förmåga som en potentiell förutsägare för effektiviseringen av filarbetare, och att effektiviteten skulle bestämmas av övervakarens betyg. Tabell 2.3 visar några hypotetiska data för denna antagna situation, vilket ger poäng för tolv filkonsulter på både det skrivande testet och effektivitetskriteriemåttet. Figur 2.5 visar ett diagram över data i tabell 2.3.

Observera att det verkar finnas en systematisk trend. I allmänhet, desto högre gjorde en person på det presterande testet, ju högre hon gjorde på måttet av yrkeskunnande. Vi kan därför dra slutsatsen att det finns ett bestämt förhållande mellan testprestanda (prediktorn) och arbetsförmåga (kriteriet). Vi kan också härleda att om vi väljer de personer som presterar högre på provet, är vi mer benägna att anställa människor som kommer att vara mer skickliga än om vi anställer människor oberoende av testresultat.

Upprättande av relationen:

Graden av förhållandet mellan två variabler kan definieras som i vilken utsträckning dessa två variabler varierar ihop på ett systematiskt sätt. Den mer tekniska termen för detta är graden av kovarians som finns mellan variablerna. En formell mätning av graden av kovarians mellan två uppsättningar av poäng ges av en statistik som kallas korrelationskoefficienten. När två uppsättningar av poäng är mycket relaterade, säger vi att de är mycket korrelerade. Det vanligaste korrelationsmåttet är Pearson Product Moment Correlation Coefficient som betecknas med symbolen r.

Som ett mått på förhållandet varierar r mellan + 1, 00 och -1, 00. När r är + 1, 00 är de två uppsatserna positiva och perfekt relaterade till varandra. När r är -1, 00 är de två uppsatserna negativa och perfekt relaterade till varandra. När r = 0, 00 har de två uppsättningarna poäng inte något förhållande till varandra alls. Figur 2.6 visar grafer med olika storlekar av r.

Vid förutsägelse av arbetssucces är inte tecknet på korrelationskoefficienten viktigt, men storleken är. Ju större absoluta storleken på r är desto bättre är förutsägelsen av kriteriet poäng på grundval av information erhållen från prediktorn.

För att förstå sammanhanget av korrelation kan det vara till hjälp att överväga en bildrepresentation av kovarians och dess relation till r. Varje uppsättning poäng kommer att ha en viss variation - i själva verket, som vi redan har sett, följer antalet personer på många egenskaper en normal fördelning med ett litet antal mycket höga poäng, ett litet antal mycket låga poäng och de flesta av poängen som förekommer i mitten av distributionen.

Antag att vi representerar denna varians i en uppsättning kriterionspoäng som visas ovan, där det totala området definieras som 1, 00. Vi kan göra detta eftersom det är möjligt att omvandla en uppsättning råa poäng så att deras varians blir lika med 1, 00 med det som kallas az-poängtransformation.

På samma sätt antar vi att vi har en uppsättning prediktionspoäng som också varierar och fördelas normalt, och igen är området definierat som lika med kvantiteten 1, 00. Vi kan nu representera r geometriskt som relaterad till mängden överlappning (kovarians) för de två uppsättningarna av poäng.

En mer exakt definition av r som en statistik är att det är förhållandet mellan mängden kovarians mellan två variabler i kvadratroten av produkten av respektive variationer (ibland kallad geometrisk medelvärde) som kan diagrammatas enligt nedan:

Återgå till data som ges i tabell 2.3 är det möjligt att beräkna korrelationen mellan dessa två uppsättningar av poäng genom att använda formeln

Läsaren rekommenderas att r inte kan tolkas som en procentandel. Om r = 0, 50 betyder det inte att 50 procent av variansen i kriteriet är förutsägbar från valvariabeln. Kvadraten av r kan emellertid tolkas så. En korrelation av 0, 50, när den är kvadratisk, ger r ² = 0, 25, som kan tolkas som procenten av variansen i kriteriet som förutses av selektionsvariabeln.

Statistiken r ² kallas ibland bestämningskoefficienten eftersom den representerar mängden varians i en variabel som kan "bestämmas" genom att känna till poängen på en andra variabel. Figur 2.7 visar förhållandet mellan r (måttet på förhållandet) och r2. Observera att det är möjligt att erhålla r som är ganska stor storlek och fortfarande står för endast en liten del av kriterievarianansen.

regression:

Som vi har sett, mäter korrelationskoefficienten r graden av förhållandet mellan två variabler. I sig ger det emellertid inte oss ett förfarande där vi kan förutsäga en uppsättning poäng från en annan uppsättning. Tekniken genom vilken detta görs kallas regressionsanalys. Regression kan anses vara relaterad till korrelation enligt följande: Korrelation mäter storleken eller graden av förhållandet mellan två variabler, medan regression ger en beskrivning av typen av relation mellan variabler som i sin tur kan användas för att göra förutsägelser.

För att illustrera regression, överväg de poäng som skisseras i Figur 2.8a. Självklart finns det ett väsentligt positivt förhållande som finns mellan prediktorn och kriteriet i det här fallet. Olyckligtvis ger Figur 2.8a oss ingen information om det exakta förhållandet annat än det faktum att det är linjärt (r mäter alltid endast graden av linjär, i motsats till krökt förhållande mellan två variabler). Om vi vill förutsäga kriteriescore från någon urvalsenhet är det tydligt att vi måste beskriva det observerade förhållandet mellan prediktor och kriterium mer specifikt.

Detta uppnås genom att hitta den linje eller funktion som bäst beskriver datapunkterna. Detta kallas att passa en "linje med bästa passform" till data. Eftersom vi antar att relationen är linjär (vi använde r för att mäta dess storlek), måste den typ av linje vi använder vara rak, det vill säga inga krökta linjer är tillåtna. Denna bäst anpassade raka linje kallas regressionslinjen och kan användas för att förutsäga kriteriet från prediktorn.

Figur 2.8b visar två olika linjer av bästa passform som kan erhållas om vi frågade två olika personer att undersöka data och sedan rita en linje genom de punkter som enligt deras mening tyvärr bäst beskriver trenden eller förhållandet mellan variablerna. Medan den allmänna trenden är likartad, finner vi att de två personerna inte helt håller med om deras uppskattning av förhållandet.

Denna motsättning skulle i sin tur leda till meningsskiljaktighet i det förutsagda kriteriescore beroende på vilken uppskattad regressionslinje användes. Med tanke på en arbetssökande med en poäng x på urvalsinstrumentet, skulle vi förutse ett kriteriesultat av y ₁ för den här sökanden om vi skulle använda den första persons regressionslinje; om vi använde den andra personens regressionslinje skulle vi förutse y ₂ som det mest sannolika kriteriescore. Vilken regression är korrekt?

Det här är en svår fråga att svara om det inte finns någon grund för att bestämma vad en "bästa passform" verkligen är. Lyckligtvis har statistiker allmänt kommit överens om att en bäst passande linje är en som går igenom punkterna så att den minimerar summan av de kvadrerade avstånden (i y-dimensionen) av punkterna från linjen som visas i figur 2.9.

En linje som uppnår minimering av Σd ² kallas en "minsta kvadrat" -regressionslinje. Sådana regressionslinjer är matematiskt direkt relaterade till r. Genom att använda minsta kvadreringsmetoden för att erhålla vår prediktionslinje kommer vi att försäkra oss att olika personer kommer att sluta med samma linje (förutsatt att de inte gör några fel i beräkningen). På liknande sätt varierar det förutspådda kriteriescore för ett visst x-värde inte beroende på vem som passar prediktionslinjen (se figur 2.8c).

Vid denna tidpunkt kan läsaren fråga, "Varför behöver vi förutsäga kriteriescores när vi redan har dem?" Svaret är ganska enkelt. Den initiala mätningen av omfattningen av förhållandet mellan prediktorn och kriteriet kräver uppenbarligen båda uppsättningar av poäng eller annars kan förhållandet inte ha fastställts. Om urvalet skulle visa sig användbart kan det användas med alla nya sökande för vilka det kan finnas en prediktionspoäng men för vilken ett kriteriescore inte existerar.

Vårt mål är att förutsäga kriteriet prestanda för framtida sökande. Om en ny sökande får ett högt betyg på ett test som visat sig ha ett högt positivt förhållande till kriteriet, borde vi förvänta oss att han har stor sannolikhet att visa sig vara en framgångsrik hyra.