Video: Integritetsvillkor. Säkerhet. Del 1 av 2. 2024
En mängd problem - kallad modifieringsanomalier - kan plåga en databas om du inte strukturerar SQL-databasen korrekt. För att förhindra dessa problem kan du normalisera databasstrukturen. Normalisering innebär i allmänhet att man delar upp en databastabell i två enklare tabeller.
Modifieringsavvikelser är så kallade eftersom de genereras genom att lägga till, byta till eller radera data från en databas tabell.
Antag exempelvis att ditt företag säljer hushållsrengöringsprodukter, och du debiterar alla kunder samma pris för varje produkt. Försäljningsbordet håller reda på allt för dig. Antag att kund 1001 flyttar bort och inte längre är kund. Du bryr dig inte vad han köpt tidigare, för att han inte kommer att köpa någonting från dig igen. Du vill radera sin rad från bordet.
Om du gör det, förlorar du inte bara det faktum att kund 1001 har köpt tvättmedel. du förlorar också det faktum att tvättmedel kostar $ 12. Denna situation kallas en borttagningsanomali. Vid radering av ett faktum (den kunden 1001 köpte tvättmedel) raderar du ett annat faktum (det tvättmedel kostar $ 12).
Du kan använda samma tabell för att illustrera en infallande anomali. Antag att du vill lägga till stick deodorant till din produktlinje till ett pris av $ 2. Du kan inte lägga till dessa uppgifter i försäljningsbordet tills en kund köper stick deodorant.
Problemet med försäljningsbordet är att den här tabellen behandlar mer än en sak: Det täcker inte bara vilka produkter kunderna köper, utan också vad produkterna kostar. För att eliminera anomalierna måste du dela försäljningsbordet i två tabeller, var och en handlar bara om ett tema eller en idé.
-
CUST_PURCH, som handlar om den enda idén om kundköp.
-
PROD_PRICE, som handlar om den enda idén om produktprissättning.
Du kan nu radera raden för kund 1001 från CUST_PURCH utan att förlora det faktum att tvättmedel kostar $ 12. (Kostnaden för tvättmedel är nu lagrad i PROD_PRICE.) Du kan också lägga till stick deodorant till PROD_PRICE om någon har köpt produkten. Köpinformation lagras någon annanstans i CUST_PURCH-tabellen.
Processen att bryta upp ett bord i flera tabeller, som alla har ett enda tema, kallas normalisering. En normaliseringsoperation som löser ett problem kan inte påverka andra problem.Det kan hända att du måste utföra flera på varandra följande normaliseringsoperationer för att minska varje resulterande tabell till ett enda tema.
Varje databastabell ska behandla ett och ett huvudtema. Ibland (som du nog gissade) bestämmer att ett bord verkligen behandlar två eller flera teman kan vara svårt.
Du kan klassificera tabeller enligt de typer av modifieringsavvikelser som de är föremål för. I ett 1970-papper identifierade E. F. Codd tre källor till modifieringsanomalier och definierade första, andra och tredje normala former (1NF, 2NF, 3NF) som korrigerande medel för dessa typer av anomalier. Under de följande åren upptäckte Codd och andra ytterligare typer av anomalier och specificerade nya normala former för att hantera dem.
Den normala formen Boyce-Codd (BCNF), den fjärde normala formen (4NF) och den femte normala formen (5NF) gav vardera en högre grad av skydd mot modifieringsanomalier. Inte förrän 1981 beskriver emellertid ett papper, skrivet av Ronald Fagin, domännyckelform eller DK / NF. Med hjälp av denna senaste normala formulär kan du garantera att ett bord är fritt för modifieringsavvikelser.
De normala formulären är kapslade i den meningen att ett bord som är i 2NF automatiskt också i 1NF. På samma sätt är en tabell i 3NF automatiskt i 2NF, och så vidare. För de flesta praktiska tillämpningar är en databas i 3NF tillräcklig för att säkerställa en hög grad av integritet. För att vara helt säker på dess integritet måste du sätta databasen i DK / NF.
När du normaliserar en databas så mycket som möjligt kanske du vill göra valda denormaliseringar för att förbättra prestanda. Om du gör det, var medveten om de typer av avvikelser som kan bli möjliga.