3 steg med normalisering av data

Några av de viktiga stegen som är involverade i processen med normalisering av data är följande:

Det finns flera sätt att gruppera dataelement i tabeller. Databasdesignern skulle vara intresserad av att välja det sätt som säkerställer inga avvikelser vid datagruppering. Dessa anomalier inkluderar data redundans, förlust av data och falska relationer i data.

Bildrättighet: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalisering syftar till att eliminera anomalierna i data. Normaliseringsprocessen omfattar tre steg, varje steg genererar ett bord i normal form.

1. Första normala formen:

Det första steget i normalisering är att sätta alla upprepade fält i separata filer och tilldela lämpliga nycklar till dem.

Med ett exempel på beställningsbehandling kan följande dataelement identifieras i en inköpsorder:

Leverantörs-ID

Leverantörens namn

Adress

Beställningsnummer

Datum

Betalningsvillkor

Leveransvillkor

S. nr

Produktkod

Beskrivning

Måttenhet

Pris

Antal beställda

Belopp

Som detaljerad ovan upprepas "fraktvillkoren" för varje S. nr. Och det kommer att finnas flera poster för det i varje inköpsorder. I det första stadiet av normalisering placeras de upprepade dataelementen i separata tabeller. Således delar vi upp dataelementen i två tabeller enligt nedan:

De viktigaste dataelementen visas i stora bokstäver. Tabellen är nu i den första normala formen (INF) eftersom alla upprepade dataelement (fält) finns i ett separat bord (tabell 1.2) och hämtningsnycklarna har tilldelats varje tabell. Eftersom det finns två nyckelelement i båda tabellerna kan man säga att varje tabell har sammansatta / sammansatta nycklar. Denna process av normalisering har förenklat data.

2. Andra normala form:

I detta stadium av normalisering placeras alla icke-nyckelelement som är helt specificerade av något annat än den fullständiga nyckeln i ett separat bord. Normalt är dessa icke-nyckelelement beroende av endast en del av en sammansatt nyckel.

Med tanke på tabell 1.1, en sammansatt nyckel bestående av Leverantörs ID och Beställningsnummer. används. De icke-nyckelelementen som leverantörens namn och adress är dock endast beroende av leverantörs-id och inte på beställningsnummer. Sålunda placeras dessa icke-nyckeldataelement i separata tabeller tillsammans med nyckeldataelementet-leverantörs-id.

På samma sätt är de icke-viktiga dataelementen som datum, betalningsvillkor och fraktvillkor endast beroende av beställningsnummer. och placeras sålunda i ett separat bord tillsammans med beställningsnummer. som nyckelelement. Nu har vi tre tabeller i stället för tabell 1.1:

På samma sätt kan vi dela upp tabell 1.2 genom att skilja icke-nyckelelement såsom beskrivning, måttenhet och pris, som endast är beroende av en produktkod i en tabell. På samma sätt placeras produktkoden, kvantitet och mängd som är beroende av beställningsnummer och S. nr placeras i ett separat bord.

Den andra normala formen (2NF) är klar nu och det finns fem tabeller.

3. Tredje normal form:

Detta stadium av normalisering möjliggör eliminering av redundanta dataelement och tabeller som är delmängder av andra tabeller. De överflödiga elementen är de icke-viktiga dataelementen som placeras i mer än en tabell av de virtuella dataelementen.

De virtuella dataelementen är de element vars värde kan beräknas med andra element när och när värdet krävs. Värdet av datamängden i tabell 1.2.2 kan beräknas genom att multiplicera kvantiteten med priset och därigenom eliminera sådana överflödiga dataelement.

Om en annan tabell som heter leverantörens huvudtabell också upprätthålls i databasen är det troligt att tabell 1.1.2 skulle vara en delmängd av leverantörens mastertabell. Således kan denna tabell också elimineras.

Den tredje normala formen (3NF) erbjuder gruppering av data som är enkel, lätt underhållbar och med minsta redundans.

Således kan normalisering bidra till att minska redundans samt eliminera andra anomalier i data. Den trestegs normaliseringsprocessen som diskuteras ovan är endast suggestiv. Ytterligare försök kan göras vid utformning av databaser, om nödvändigt baserat på dataens natur.