Tekniker som används i statistik

I denna artikel kommer vi att diskutera om några av statistikkens tekniker. Några av teknikerna är: 1. Åtgärderna för central tendens 2. Variabilitet 3. Sannolikhet 4. Frekvensfördelning 5. Tidsserie.

Åtgärderna för central tendens:

medelvärden:

En eventuell statistisk åtgärd som ger en uppfattning om positionen för punkten kring vilken andra observationer kluster kallas ett mått på central tendens. Det vanligaste mätvärdet är "medelvärdet" eller det aritmetiska medelvärdet.

Dagliga intäkter för två arbetare i en vecka är enligt följande:

1: a arbetaren Rs 70, 50, 100, 90, 50 Medelinkomst = Rs 76

2: a arbetare Rs 200, 250, 50, 300, 150 Medelinkomst = Rs 190

Således från ovanstående exempel kan vi dra slutsatsen att den andra arbetaren i genomsnitt tjänar mer än den första. Syftet med att beräkna ett medelvärde - som man lätt kan se - är att ersätta serien av observationer med ett enda värde, vilket anses vara representativt för alla observationer. Från ovanstående exempel kan det observeras att det aritmetiska medelvärdet är ett värde nära mitten och några av observationerna är större än det medan vissa är mindre.

Således kan man säga att det aritmetiska medelvärdet av observationerna på en variabel definieras som summan av observationerna dividerat med antalet observationer.

För den första arbetaren har det aritmetiska medelvärdet beräknats som under:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = Rs 76

Geometrisk Medel (GM) Geometrisk Medel av en grupp observationer definieras som den n: a rot av produkten av alla observationer. Låt oss anta att observationerna är x 1, x 2, x 3, ..., x n .

GM kan beräknas som under:

Detta kan beräknas med hjälp av en loggbord.

Läge:

Läget definieras som värdet av variablerna eller observationer som förekommer oftast. Till exempel, om observationerna är -2, 9, 6, 2, 8, 2, 2, 7, 2 och 3, så är läget 2 att det har uppstått för det maximala antalet gånger, dvs 5 gånger.

Median:

Median är värdet av den medelstora variabeln, när observationerna ordnas i en stigande eller en nedstigande ordning. Det är uppenbart att hälften av värdena kommer att vara mindre än medianen och hälften av värdena blir större. Om observationerna är 3, 9, 6, 4, 5, 7 och 10, så är medianvärdet sålunda att det är värdet i en stigande ordning 3, 4, 5, 6, 7, 9 och 10 så att 4: e observationen och är lika med 6.

Men om antalet observationer är jämn, så finns det två mellansta värden och det är vanligt att ta det aritmetiska medelvärdet av dessa två värden. Om exempelvis observationen 10 utelämnas från ovanstående variabler finns det två medelvärden 5 och 6 och medianvärdet är 5 + 6 ÷ 2 = 5, 5.

De andra viktiga statistiska verktygen för att mäta och analysera data och variabelns variabel däri innefattar beräkning av (i) intervall, (ii) halvintervartilintervall, (iii) genomsnittlig avvikelse, (iv) standardavvikelse ) Frekvensfördelning (både symmetrisk och asymmetrisk).

Symmetrisk fördelning kännetecknas av förekomsten av en symmetrilinje som delar histogrammet i två delar och en del är spegelbilden av den andra. Emellertid är de flesta distributionerna inom handel och ekonomi inte av denna typ. Asymmetriska fördelningar är också kända som skevfördelningar. Skewness betyder brist på symmetri och skevade fördelningar kännetecknas av en längre svans på ena sidan av histogrammet.

Mätvariationer:

Aritmetiska och geometriska medel eller medianer utgör grunden för att jämföra två eller flera populationer eller observationer. Men andra åtgärder med variabilitet eller avvikelse är också viktiga för att uttrycka i vilken utsträckning observationerna skiljer sig från varandra. I statistiken är dispersionen synonym med variabilitet eller avvikelse.

Följande är de viktiga måtten av variation:

Räckvidd:

Skillnaden mellan de största och minsta värdena för en uppsättning observationer kallas "intervallet".

Halvintervartil Range :

Skillnaden mellan värdet av observationerna i 2: a och 3: e kvartilen kallas halvintervallet. Detta avlägsnar påverkan av mycket låga och mycket höga värden av observationerna, som är få i antal.

Medel Absolut avvikelse:

Medel absolut avvikelse betyder variationen av observationerna från det aritmetiska medelvärdet av observationerna.

Exempel: Observationer är x 1, x 2 ... x n och det aritmetiska medelvärdet är x.

Formeln är:

och därmed är medelvärdet

Men Σ (x 1 - x̅) = 0, vad som helst värdet av x 1, x 2, ... .x n

Därför kan formeln Σ (x i - x beteken) inte användas som ett mått på variabilitet. Denna svårighet kan undvikas om tecknen (+ eller -) ignoreras. Detta är logiskt, eftersom tecknet på en viss avvikelse x i - x betyder bara om observationen x i, är till vänster om x eller till höger och det har ingen relevans vid beräkningen av avvikelser från centralpunkten (x), av någon observation.

Standardavvikelse:

Avvikelser från observationerna från deras aritmetiska medelvärde (x) kan vara positiva (+) eller negativa (-). I statistiken indikerar tecknen på avvikelser från det aritmetiska medelvärdet endast observationens riktning från den centrala tendensen (xiod) och följaktligen ignoreras. De negativa (-) tecknen bland avvikelsen från x kan också undvikas om istället för att ta de absoluta värdena avvikelsernas kvadrater tas som under:

Eftersom variationsmåttet ska ligga i samma enhet som de ursprungliga observationerna beräknas standardavvikelsen med följande formel:

För en frekvensfördelning, med x 1 x 2, ..., x n som medelvärdena för klasserna och f 1 f 2, ..., f n som frekvenserna, beräknas standardavvikelsen (SD) genom följande förbättring av ovan formel:

Standardavvikelsen är överlägset den mest använda måtten på variabilitet i statistiken. Den har många egenskaper som gör det till den mest föredragna åtgärden i statistiska problem.

Exempel:

IQ nivåer av fem Business Management studenter är som under:

Standardavvikelsen är därför: 13, 22

13.22 är standardavvikelsen uttryckt i samma enheter som observationerna själva. Värdet 13.22 är en punkt i samma numeriska skala.

Ovannämnda standardavvikelse har utarbetats av skillnaderna mellan en befolkning på 5 studenter. I praktiken kan dock standardavvikelse ofta inte beräknas från befolkningen, eftersom det för det mesta är populationen så stor att vanligtvis provet tas för att beräkna avvikelsen.

För provdata mäts variationen genom provvariation och standardavvikelsen beräknas med hjälp av följande formel:

Det skall noteras att, eftersom provdata har använts, "n" betecknar provstorleken i stället för "N" som betecknar befolkningsobservationen.

Begreppet sannolikhet:

Ofta, i vårt dagliga liv, förutsäger vi vissa framtida händelser med sådana ord som - det kommer troligen att hända ", " sannolikheten för detta är väldigt hög "eller" det här kommer sannolikt att inträffa ", med viss våglighet i sådana uttalanden. Dessa uttalanden är i stor utsträckning subjektiva och beror främst på vår förmåga att analysera liknande situationer i det förflutna. Betydelsen av begreppet sannolikhet för ett evenemang och några sätt att mäta det med statistiska verktyg är enormt för affärsbankerna.

Medan man lånar till en kund vill banken känna till sannolikheten för att den nämnda kunden har förfallit, vilket mäts utifrån sannolikhetsstudien med hjälp av de statistiska beräkningarna. Även om det är ganska svårt att definiera sannolikhet exakt på en elementär nivå, kan man sträva efter att förutse detsamma med hjälp av teknikerna för slumpmässigt experiment och frekvensdefinition.

Slumpmässigt experiment innebär ett experiment vars alla möjliga resultat är kända och som kan upprepas under identiska förhållanden, men exakt förutsägelse av resultatet är omöjligt. Priset på en vara på olika dagar kan betraktas som resultat av ett slumpmässigt experiment. Utfallet brukar betecknas av E 1, E 2, E 3 ..., E n och det antas att de är ändliga i antal.

Frekvensfördelning:

Om utfallet E 1 inträffar r gånger när slumpmässigt experiment upprepas n gånger, bestäms sannolikheten för E 1 av förhållandet 'r / n', eftersom antalet repetitioner ökar i obestämd tid. Sålunda definieras sannolikheten som en gräns för relativ frekvens när experimentet upprepas ett oändligt antal gånger.

Tidsföljder:

En serie observationer på olika tidspunkter på en variabel - som är beroende av tiden - utgör en tidsserie. Sålunda ger sådana serier av observationer förändringar eller variationer av en kvantitet över en tidsperiod, och kallas ofta historiska eller kronologiska data. För denna typ av data är en av variablerna tiden som representeras av 't' och den andra, som är beroende av tiden representeras av 'Yt'.

Till exempel utbyte av grödor under olika årstider, produktion av stål i olika månader, kvartalsvis export av te, försäljning av glass under olika månader av året etc. Alla exemplen ovan hänvisar till någon ekonomisk eller affärsverksamhet, och en serie observationer om sådana variabler kallas vanligtvis ekonomiska tidsseriedata. Ett annat exempel på tidsseriedata är regnskuret i inches på olika dagar på året.

Således är det klart att varje variabel, vilken beror på tiden, bildar tidsseriedata. Värderbara slutsatser som berörs av berörda parter som näringslivet, bankirer, industrin etc. från tidsserierna leder till trendmätning från data, vilket påverkar deras beslut väsentligt.