5 Metoder för att avbilda frekvensfördelning

Följande metoder används vanligtvis för att avbilda frekvensfördelningar i grafisk form: 1. Histogram eller kolumndiagram 2. Bardiagram eller streckdiagram 3. Frekvenspolygon 4. Slät frekvensfrekvens 5. Piediagram.

Metod # 1. Histogram eller kolumndiagram:

Det är en av de mest populära och mest använda met hade haft att presentera en frekvensfördelning. Ett histogram är en uppsättning rektanglar vars områden står i proportion till klassfrekvenserna. Det är ett diagram där frekvenserna representeras av staplar. Histogrammet visas som en serie stapeldiagram placerade en bredvid varandra på ett vertikalt sätt.

Observera följande egenskaper i histogrammet:

(i) Frekvenserna ligger längs den vertikala axeln och poängen (CI) ligger längs den horisontella axeln.

(ii) Man antar att poängen är jämnt fördelade inom klassintervallet, vilket ger oss rektangulära staplar.

iii) Frekvenserna inom varje intervall av ett histogram representeras av en rektangel, intervallets storlek är basen och frekvensen av det intervallet höjden.

(iv) Området för varje rektangel i ett histogram motsvarar frekvensen inom ett givet intervall medan den totala ytan av ett histogram motsvarar distributionens totala frekvens (N).

(v) Ett histogram kan bäst konstrueras på ett grafpapper, som styrs med lika åtskilda horisontella och vertikala linjer.

Låt oss se hur histogrammet för frekvensfördelningen kan konstrueras i två situationer, dvs när klassintervall är lika och när klassintervall är ojämlika.

Histogram (lika klassintervall):

Steg 1:

I tabell 2.12 ingår alla klasser och som ett första steg bör dessa omvandlas till klasser med verkliga eller faktiska klassgränser som anges i andra kolumnen i samma tabell.

Steg 2:

I allmänhet är en ledig klass också tillåten i vardera slutet av klasserna och reflekteras vid två extrema ändar av horisontell skala, dvs 9, 5 och 99, 5 (se figur 2.1). Detta förbättrar läsbarheten av grafen och är också användbar vid konstruktionen av en frekvenspolygon.

Steg 3:

Därefter ritas dessa sanna klassgränser tillsammans med den horisontella axeln (X-axeln) med hjälp av en lämplig måttmått. För att ge symmetri och balansera till histogram eller någon grafisk representation, måste man vara försiktig vid valet av enhetsavstånd för att representera klassgränsen på X-axeln och frekvenserna på Y-axeln.

För att representera dessa avstånd är mållägena på två axlar så valda att höjden på histogrammet eller någon annan grafisk presentation är ungefär 75 procent av dess bredd.

Steg-4:

När den nedre gränsen råkar vara en avlägsen poäng från ursprunget, ger en paus i X-axeln (∫∫) för att indikera att den vertikala axeln har förflyttats för bekvämlighet. Starta sedan X-axeln med den nedre gränsen för det lägsta klassintervallet.

Ett histogram som representerar frekvensfördelningen av poäng i tabell 2.12 visas i figur 2.1. I denna figur är höjden av rektangeln bildad över klass 19.5-29.5 4 enheter längs vertikal skala och sålunda blir dess yta 4 x 1 = 4 kvadratiska enheter, vilket är lika med klassens frekvens. På samma sätt tas höjder av andra rektanglar bildade över varandra i följdklasser som 6, 8, 12, 9, 7 respektive 4.

Histogram (ojämnt klassintervall):

För att ta ett exempel, låt oss godtyckligt gruppera klasserna 150 - 154 och 155-159 i en klass som 150 - 159 * och 185 - 189 och 190 - 194 i en klass som 185 - 194 ** i tabell 2.13.

Klassintervallet för fjärde och tionde klassen är dubbelt så stor som för resten av klasserna. Således är frekvenserna i dessa två klasser inte jämförbara med andra klasser. För att fastställa denna jämförbarhet, bör frekvenserna i de större klasserna halveras eller divideras med två.

Således bör alla större klasser uttryckas som multiplar av mindre klasser innan de bildar histogram för frekvensfördelning med ojämna klassintervall. och sedan delade motsvarande klassfrekvenser av dessa multiplar.

Denna delning ger då höjden av rektanglar som visas i tabell 2.14. Höjder av andra rektanglar som bildas över klasser av enhetslängder förbli emellertid lika med motsvarande klassfrekvenser. Frekvensfördelningen av poäng i tabell 2.14 återspeglas i figur 2.3.

fördelar:

1. Det är enkelt och enkelt gjort.

2. Alla fördelar med den grafiska representationen som visats tidigare är tillämpliga här.

begränsningar:

1. Det är svårt att överlagra mer än ett histogram på samma graf.

2. Jämförelser av flera frekvensfördelningar kan inte lätt göras via histogram. Frekvenspolygoner är mycket bättre lämpade för detta ändamål.

3. Antagandet att poängen är jämnt fördelade inom CI ger ett större fel när N är liten än när N är stor.

4. Det kan inte slätas.

Metod # 2. Bardiagram eller streckdiagram:

Bardiagram är en av de enklaste och mest använda enheterna för att presentera diskreta seriedata. Dessa är särskilt tillfredsställande för kategoriska data eller serier. De består av en grupp av likvärdiga rektanglar, en för varje grupp eller kategori av de data där värdena eller storheterna representeras av längden eller höjden av rektanglarna, rektanglarnas bredd är godtycklig och oumbärlig.

Dessa diagram kallas endimensionell eftersom i sådana diagram endast hänsyn tas till en dimension, höjden (eller längden) av rektanglarna för att presentera de givna värdena.

Följande punkter kan komma ihåg att dra streckdiagram:

(i) Samtliga staplar som ritats i en enda studie bör vara av likformig (men godtycklig) bredd beroende på antalet staplar som ska dras och utrymmet tillgängligt.

ii) Korrekt men likformigt avstånd bör ges mellan olika staplar för att göra diagrammet mer attraktivt och elegant.

iii) Rektanglarna eller staplarnas längd (längd) tas i proportion till observationernas storlek, varvid skalan väljs med hänsyn till storleken på den största observationen.

(iv) Alla staplarna ska byggas på samma baslinje.

(v) Det är önskvärt att skriva siffrorna (magnituder) representerade av staplarna på toppen av staplarna för att göra det möjligt för läsaren att ha en exakt bild av värdet utan att titta på skalan.

(vi) Stångar kan dras vertikalt eller horisontellt. I praktiken används dock vertikala stänger vanligen eftersom de ger en attraktiv och tilltalande uppkomst.

(vii) Barerna bör så långt som möjligt vara ordnade från vänster till höger (från topp till botten vid horisontella stänger) i storleksordning för att ge en tilltalande effekt.

I en viss stad är totalt antal skolor 24 och förvaltningsvis distribution av skolor enligt tabell 2.15.

För en diskret variabel är måttenheten på den horisontella axeln inte viktig. Inte heller klasserna är relaterade till varandra. Så stängerna är lika stora och har samma bredd på den horisontella axeln.

Stångens höjd är emellertid proportionell mot respektive frekvenser. Streckdiagram används ofta för bildpresentation av diskreta data. Om två variabler används samtidigt, kan även bardiagrammen vara ganska effektiva.

Om till exempel, tillsammans med det totala antalet skolor (ledningsvis), antalet pojkors skolor, tjejskolor och medarbetade skolor också ska anges så kan detta göras på samma grafpapper genom att använda olika färger, var och en indikerar den könsbestämda kategorin. För varje ledning kommer det att finnas 4 staplar som har olika färger som indikerar olika kategorier.

Metod # 3. Frekvenspolygon:

En polygon är en mångavinklad närbild. Frekvenspolygonen är en grafisk representation av frekvensfördelningen, där CI: s mittpunkter markeras mot frekvenserna.

Låt oss diskutera hur man ritar en frekvenspolygon:

Steg 1:

Rita två raka linjer vinkelrätt mot varandra, den vertikala linjen nära pappers vänstra sida, den horisontella linjen nära botten. Märk den vertikala linjen (Y-axeln) OY och den horisontella linjen (X-axeln) OX. Sätt O där de två linjerna skärs. Denna punkt är ursprunget.

För att ge symmetri och balans till polygonen måste man ta hand om valet av enhetsavstånd på båda axlarna. En bra allmän regel är att välja X- och Y-enheter som gör att höjden i figuren är ungefär 75% av dess bredd.

Steg 2:

Nästa måste ange mittpunkten för CI på den horisontella axeln, istället för att indikera gränserna för integralet. Här ska mellannivåerna för intervallen precis före det lägsta intervallet och strax efter det högsta intervallet också anges (mellanpoängen 137 respektive 202 i tabell 2.16). Längs den vertikala linjen markerar enheterna för att representera frekvenserna för klassintervallen.

Steg 3:

I mitten av varje intervall på X-axeln går upp i Y-riktningen ett avstånd som är lika med antalet poäng i intervallet. Placera poäng på dessa platser.

Steg-4:

Efter plottning av alla punkter på graffogen markerar dessa genom en rad korta raka linjer för att bilda frekvenspolygonen.

Metod # 4. Smoothed Frequency Polygon:

En frekvenspolygon bör smidas:

jag. Att stryka ut oegentligheter

ii. För att få bättre uppfattning om hur figuren kan se om data var mer talrika;

III. Att veta hur en polygon skulle se ut om gruppering av fel och provtagningsfel tas bort från det, och

iv. För att fastställa vilken form det skulle ta om det representerar villkor som befrias från mindre oavsiktliga fluktuationer.

Vid utjämning av en frekvenspolygon tas en serie rörliga eller löpande medelvärden, från vilka nya eller justerade frekvenser bestäms. För att hitta en justerad eller jämn " f, lägg till f i det angivna intervallet och f s på de två intilliggande intervallen (intervallet nedanför och intervallet precis ovanför) och dela dem med 3.

Till exempel är den släta f för intervallet 170-174 i 2, 17 Tabellen (8 + 10 + 6) / 3 eller 8, 00. För att hitta den släta fs för de två intervallen vid fördelarnas ytterligheter, nämligen 140-144 och 195-199, krävs en något annorlunda procedur. Först lägger vi till 0, f på stegintervallet under eller över, till f i det givna intervallet och till f i det intilliggande intervallet, och dividerar med 3. Den jämnade f för 140-144 är (0 + 1 + 3) / 3 är eller 1, 33; och den jämnade f för 195-199 är (2 + 1 + 0) / 3 eller 1, 00.

Vi måste ta ytterligare två CI på 135-139 och de andra 200-204, för vilka f är taget som 0. De har en jämn f, i varje fall, (0 + 0 + 1) / 3 eller .33 och (0 + 0 + 1) / 3 eller .33. Inkluderingen av dessa två sista intervaller gör N = 50, 00 för den släta fördelningen.

Om N är stor kan utjämning inte i stor utsträckning ändra formen på ett diagram, och är därför ofta onödigt.

fördelar:

(i) Det är enkelt och enkelt gjort.

(Ii) Det är möjligt att överlappa mer än en frekvenspolygon på samma graf genom att använda färgade linjer, streckade linjer, streckade linjer etc.

(iii) Jämförelser av flera frekvensfördelningar kan lätt göras via frekvenspolygoner.

(iv) Alla fördelar med den grafiska representationen som diskuterats tidigare är tillämpliga här.

(v) Det kan smutsas. Begränsningar.

Begränsning:

(ii) Den del av området som ligger över ett givet intervall kan inte betraktas som proportionellt mot frekvensen för det CI på grund av oegentligheter i frekvensytan.

(Ii) Antagandet att alla poäng inom ett CI faller vid mittpunkten för det intervallet ger ett större fel när N är större än när N är liten.

(Iii) Det är mindre precist än histogrammet genom att det inte representerar exakt, dvs i termer av område, frekvensen vid varje intervall.

Den kumulativa frekvensgrafen:

Den kumulativa frekvensgrafen är ett annat sätt att representera en frekvensfördelning med hjälp av ett diagram. Innan vi kan plotta en kumulativ frekvensdiagram, måste fördelningen av fördelningen läggas till seriellt eller kumulerat, vilket visas i tabell 2.18.

För att bestämma Cum.f för varje rad måste vi fortsätta lägga fs progressivt från botten. För att illustrera, vid fördelningen av poäng är den första kumulativa frekvensen 1; 1 + 3, från den nedre delen av fördelningen, ger 4 som nästa post; 4 + 2 = 6; 6 + 4 = 10, etc. Den sista kumulativa / är lika med, naturligtvis, till 50 eller N, den totala frekvensen.

Vid plottning av frekvenspolygonen tas frekvensen på varje intervall vid mitten av klassintervallet. Men vid konstruktion av en kumulativ frekvenskurva planeras varje kumulativ frekvens vid den exakta övre gränsen för det intervall som det faller på.

Detta beror på att man successivt lägger nedifrån varje kumulativ frekvensbärare till den exakta övre gränsen för klassintervallet. Med en vald skala, om vi tar de övre gränserna för ci längs X-axeln och tar Cumf s längs Y-axeln kan vi rita en graf för den kumulativa frekvensfördelningen.

I en kumulativ frekvenskurva ritas varje kumulativ frekvens i intervallets övre gräns. För att kurvan ska börja på X-axeln startas den vid 139, 5 (exakt övre gräns på 134, 5-139, 5), vars kumulativa frekvens är 0.

Den kumulativa procentsatskurvan eller Ogive:

Vid ritning av en "Ogiv" måste vi beräkna de kumulativa procentuella frekvenserna vid den övre gränsen för varje ci 'Kumulativ procentuell frekvens' vilken procent av N är Cum- f . Den kumulativa procentuella kurvan eller ogiven skiljer sig från den kumulativa frekvensgrafen i dessa frekvenser uttrycks som kumulativa procent av N på Y-axeln istället för som kumulativa frekvenser. Tabell 2.19 visar hur kumulativa frekvenser kan omvandlas till procent av N.

I kolumnerna (1), (2) och (3) klassintervall anges övre gränser för ci och frekvenser; och i kolumn (4) har fs kumulerats från den nedre delen av fördelningen uppåt. Dessa Cumf s uttrycks som procentandelar av N i kolumn (5). Omvandlingen av Cumf s till kumulativa procent kan utföras genom att dividera varje kumulativ / med N; t.ex. 2 + 40 = .05, 6 + 40 = .15, och så vidare.

En bättre metod - speciellt när en beräkningsmaskin är tillgänglig - för att bestämma först den ömsesidiga. 1 / N, kallad frekvensen, och multiplicera varje kumulativ f i ordning med denna fraktion. Som visas i tabell 2.19 är kursen 1/40 eller .025. Därigenom multipliceras 2 med .025 får vi .05 eller 5%; 6 X. 025 =. 15 eller 15% etc.

Kurvan i figur 2.8 representerar en ogiv plottad från data i kolumn (5), tabell 2.19. De exakta intervallgränserna har lagts av på X-axeln, och en skala bestående av 10 lika avstånd, som representerar 10% av fördelningen, har markerats på Y-axeln. Den första punkten på ogiven placeras 5 Y-enheter strax över 35, 5. Den sista punkten är 100 Y enheter över 56, 5 exakt övre gräns för högsta klassintervallet.

Från ogiv kan vi läsa PR. av olika poäng och även percentilerna:

(a) Läsa percentiler från ogiven:

Antag att vi vill ta reda på P 2 5- Som vi vet är P 25 en punkt under vilken 25 procent av fallen ligger. Låt oss hitta 25 på Y-axeln och dra sedan en horisontell linje från den här punkten. Det kommer att uppfylla ogiven vid någon tidpunkt.

Dra sedan vinkelrätt på X-axeln från den punkten. Från X-axeln kan vi läsa poängen. Från ogiven kan vi läsa att P 2 5 = 41.5. På samma sätt kan vi läsa P 50 = 46.7 och P 75 = 49. Vi kan läsa andra procentiler på samma sätt från ogiven.

(b) Läser procentuella rankning av poäng:

Antag att vi vill veta det PR på ett poäng på 53, 5. Vi måste hitta denna poäng på X-axeln och rita en vertikal linje från denna punkt. Linjen kommer att möta ogivan vid någon tidpunkt från vilken vi kan dra en horisontell linje till vänster och denna linje skulle möta Y-axeln vid en punkt. Vi kan läsa cum% f vid denna punkt. Detta cum% / värde är PR. av poängen.

Således kan vi läsa det:

PR av en poäng, 40 = 20

PR av en poäng, 53 = 90.

Vi kan läsa PR: s andra poäng på samma sätt.

Metod nr 5. Pie diagram:

Piediagram är mycket vanligt förekommande för att beteckna procentuell uppdelning. Det är så kallat eftersom hela grafen ser ut som en paj, och pajens komponenter liknar skivor som skärs från pajen. Den presenterar procentsatserna och inte absoluta siffror.

Pie diagram är mycket användbara för att visa utgifterna för en regering eller ett företag etc. fördelat på olika huvuden. Det används också i undervisning i geografi, vetenskap etc.

Följande steg kan följas vid konstruktion av ett cirkeldiagram:

1. Rita en cirkel av lämplig storlek med en kompass. Radiets storlek beror på tillgängligt utrymme och andra faktorer.

2. Förbered data i form av% under olika huvuden. Dessa% för olika sektorer bör överföras till motsvarande grader i cirkeln.

För detta ändamål måste vinkelvärdet för varje underdel hittas. Vi vet att värdet av alla vinklar vid vilken punkt som helst är lika med 360 °, dvs hela cirkeln är 360 ° vilket motsvarar 100%. Således betyder en% 360 ° / 100 = 3, 6 °.

Följande formel gäller därför för att hitta vinkelvärdet för varje undergrupp:

3. Antag att det finns 3 komponenter med värdet 60% som högpresterande, 25% som medelvärde och 15% som lågpresterande. Därför bör de representera 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) respektive 54 ° (15 x 3, 6 °).

4. När värdena för alla vinklar har bestämts så kan deras totala kanske inte exakt 360 ° på grund av approximation. Om så är fallet kan en del av vinkelvärdet behöva justeras något för att göra summan lika med 360 °.

5. Mät punkterna på cirkeln för att representera storleken på varje sektor med hjälp av en grader. Det är vanligt att arrangera sektorerna enligt storlek, med den största sektorn i topp och andra i

sekvensen körs medurs. Sektorerna kan märkas. Märkena kan placeras inom sektorn eller utanför cirkeln.