uni
Una forma normale è una proprietà di un Database relazionale (Modello Logico Relazionale) che ne garantisce la qualità, ovvero l’assenza di determinati difetti, tra cui le anomalie.

Una relazione non normalizzata:

presenta ridondanze
durante gli aggiornamenti incontra errori
Le forme normali sono di solito definite sul Modello Logico Relazionale ma hanno senso anche in altri contesti, per esempio nel Modello Entity-Relationship.

La normalizzazione è una procedura che permette di trasformare schemi non normalizzati in schemi che soddisfano una determinata forma normale.
Questa procedura viene utilizzata come tecnica di verifica dei risultati della progettazione di una base di dati, non è una metodologia di progettazione.

Decomposizione di Schemi

Teorema:
Dato uno schema $R (T)$ , l’insieme di schemi $ρ = {R_{1} (T_{1}), ..., R_{k} (T_{k})}$ è una decomposizione di $R$ se e solo se $\cup_{i} T_{i} = T$

Nota bene: la precedente definizione non richiede che gli schemi $R_{i}$ siano disgiunti.

Affinché uno schema e la sua decomposizione siano equivalenti quest’ultima deve preservare i dati e preservare le dipendenze.

Teorema della perdita dei dati
Se $ρ = {R_{1} (T_{1}), ..., R_{k} (T_{k})}$ è una decomposizione di $R (T, F)$ , allora per ogni istanza di $r$ di $R (T)$ si ha:

r \in π_{T_{1}} (r) ⋈ ... ⋈ π_{T_{k}} (r)

Questo teorema ci dice che perdiamo informazione quando, ricostruendo una relazione, otteniamo più tuple che nella relazione originaria.

Decomposizione che preserva dati

Se $ρ = {R_{1} (T_{1}), ..., R_{k} (T_{k})}$ è una decomposizione di $R (T, F)$ , $ρ$ è una decomposizione che preserva i dati se e solo se, per ogni relazione $r$ che soddisfa $R (T, F)$ , si ha:

r = π_{T_{1}} (r) ⋈ ... ⋈ π_{T_{k}} (r)

Questa definizione ci dice che in una decomposizione che preserva dati, ogni istanza valida $r$ della relazione di partenza deve essere uguale al join naturale delle sue proiezioni sui vari $T_{i}$ .

Teorema di preservazione dei dati:
Sia $ρ = {R_{1} (T_{1}), R_{2} (T_{2})}$ una decomposizione di $R (T, F)$ , essa preserva i dati se e solo se $T_{1} \cap T_{2} \to T_{1} \in F^{+}$ oppure $T_{1} \cap T_{2} \to T_{2} \in F^{+}$ .

In altre parole gli attributi comuni alle due relazioni devono essere chiave in una delle due tabelle.

Proiezione di un insieme di dipendenze

Dato $R (T, F)$ e $T_{i} \in T$ , la proiezione dell’insieme di FD $F$ sull’insieme di attributi $T_{i}$ è:

π_{T_{i}} (F) = {X \to Y \in F^{+} ∣ X, Y \in T_{i}}

Significa selezionare solo le dipendenze nella chiusura di $F$ che coinvolgono solo gli attributi in $T_{i}$ .

Algoritmo per il calcolo di $π_{T_{i}} (F)$

Input: $R (T, F)$ e $T_{i} \in T$
Output: $π_{T_{I}} (F)$
$Z \leftarrow {}$
for each $Y \in T_{i}$ do
$W \leftarrow Y^{+} - Y$
$Z \leftarrow Z \cup {Y \to (W \cap T_{i})}$
return $Z$
Complessità Esponenziale rispetto al numero di attributi e di dipendenze funzionali, nel caso peggiore.

Decomposizione che preserva le dipendenze

Dato uno schema $R (T, F)$ e una decomposizione $ρ = {R_{1} (T_{1}), ..., R_{k} (T_{k})}$ , $ρ$ è una decomposizione di $R (T, F)$ che preserva le FD se e solo se: $\cup_{i} π_{T_{i}} (F) \equiv F$ , cioè se $(\cup_{i} π_{T_{i}} (F))^{+} = F^{+}$

Verificare una decomposizione che preserva le FD

Per verificare se una decomposizione di $R (T, F)$ in due relazioni con attributi $X, Y$ preserva le dipendenze bisogna verificare che $(π_{X} (F) \cup π_{Y} (F))^{+} = F^{+}$
Per fare ciò è necessario:

saper calcolare la proiezione di un insieme di FD su un insieme di attributi: algoritmo con complessità esponenziale
saper determinare l’equivalenza di due insiemi di FD: algoritmo con complessità polinomiale:
- per ogni $X \to Y \in F$ calcoliamo $X_{G}^{+}$ e verifichiamo se $Y \in X_{F}^{+}$
- di nuovo invertendo $F$ e $G$ .

Forma Normale di Boyce-Codd (BCNF)

Teorema:
Uno schema $R (T, F)$ è in forma normale Boyce-Codd (BCNF) se e solo se per ogni dipendenza funzionale non banale $X \to Y \in F^{+}$ , $X$ è una superchiave di $R$ .

Corollario:
Uno schema $R (T, F)$ con $F$ copertura minimale è in BCNF se e solo se per ogni FD elementare $X \to A \in F$ , $X$ è una superchiave.

Questa forma normale si basa sull’idea che una dipendenza funzionale $X \to A$ , in cui $X$ non contiene attributi estranei (Ridondanza), indica che nella realtà che modella esiste una collezione di entità omogenee univocamente identificate da $X$ .

Da questa definizione, il fatto che uno schema sia in BCNF dipende dalla chiusura $F^{+}$ e non dalla copertura $F$ , purtroppo per calcolare $F^{+}$ abbiamo solo algoritmi esponenziali. Possiamo però facilmente stabilire se uno schema è in BCNF con un algoritmo di complessità polinomiale.

Algoritmo di verifica BCNF

Input: schema $R (T, F)$
Output: true se $R$ è in BCNF, false altrimenti
for each $X \to Y \in F$ do
if $Y \in / X$ and $T \in / X^{+}$ then
return false
return true

Normalizzazione in BCNF in casi semplici

Per ogni dipendenza $X \to Y$ che viola la BCNF, definiamo una nuova relazione su $X Y$ ed eliminiamo $Y$ dalla relazione originaria.

Algoritmo per decomposizione in BNCF che preserva i dati

Input: $R (T, F)$ (per semplicità gli elementi di $F$ sono nella forma $X \to A$ )
Output: $ρ$ in BNCF che preserva i dati
$ρ \leftarrow {R (T, F)}$
while esiste $R_{i} (T_{i}, F_{i}) \in ρ$ che non è in BCNF do
for each $X \to A \in F_{i}$ do
if $A \in / X$ and $T_{i} \neq \subseteq X^{+}$ then
$R_{1} \leftarrow R_{i} (T_{i} - A, π_{T_{i} - A} (F_{i}))$
$R_{2} \leftarrow R_{i} (X + A, π_{X + A} (F_{i}))$
$ρ \leftarrow ρ - {R_{i}} \cup {R_{1}, R_{2}}$
break
return $ρ$
Non è garantita la preservazione delle dipendenze.

Terza Forma Normale (3NF)

Teorema:
Una relazione è in 3NF se e solo se per ogni FD non banale $X \to A \in F^{+}$ , è verificata almeno una delle seguenti condizioni:
- $X$ è una superchiave di $R$
- $A$ è contenuto in almeno una chiave di $R$ (in questo caso si dice che $A$ è un attributo primo)
Quindi se $R$ è in BCNF allora è anche in 3NF: $BCNF ⟹ 3 NF$
La verifica di 3NF è un problema NP-completo e il miglior algoritmo deterministico noto ha complessità esponenziale nel caso peggiore. Occorre conoscere gli attributi primi (ovvero le chiavi) e l’algoritmo per farlo ha complessità esponenziale.
Si può però sempre ottenere una decomposizione in 3NF che preserva dati e FD.
La Forma Normale Boyce-Codd implica la terza forma normale: $BCNF ⟹ 3 NF$ .

Algoritmo per decomposizione in 3NF

Dividiamo una copertura minimale $G$ in gruppi $G_{i}$ tale che tutte le le FD in un gruppo abbiano la stessa parte sinistra. Da ogni gruppo $G_{i}$ si definisce uno schema di relazione composto da tutti gli attributi che appaiono in $G_{i}$ , la cui chiave, detta chiave sintetizzata, è la parte sinistra comune.

Input: $R (T, F)$
Output: $ρ$ che preserva i dati e le dipendenze e con ogni elemento in 3NF

Trovare una copertura minimale $G$ di $F$ e porre $ρ \leftarrow {}$
Sostituire in $G$ ogni insieme di dipendenze ${X \to A_{1}, \dots, X \to A_{h}}$ con la dipendenza $X \to A_{1} \dots A_{h}$
Per ogni dipendenza $X \to Y \in G$ creare uno schema con attributi $X Y$ in $ρ$
Eliminare da $ρ$ ogni schema che sia contenuto in un altro schema di $ρ$
Se $ρ$ non contiene nessuno schema i cui attributi costituiscono una superchiave di $R$ , aggiungere a $ρ$ uno schema con attributi $W$ , dove $W$ è una chiave di $R$
Complessità polinomiale, sempre possibile e conserva dati e FD.

🪴 Quartz 4.0

Explorer

Normalizzazione

Decomposizione di Schemi

Decomposizione che preserva dati

Proiezione di un insieme di dipendenze

Algoritmo per il calcolo di $π_{T_{i}} (F)$

Decomposizione che preserva le dipendenze

Verificare una decomposizione che preserva le FD

Forma Normale di Boyce-Codd (BCNF)

Algoritmo di verifica BCNF

Normalizzazione in BCNF in casi semplici

Algoritmo per decomposizione in BNCF che preserva i dati

Terza Forma Normale (3NF)

Algoritmo per decomposizione in 3NF

Graph View

Table of Contents

Backlinks

🪴 Quartz 4.0

Explorer

Normalizzazione

Decomposizione di Schemi

Decomposizione che preserva dati

Proiezione di un insieme di dipendenze

Algoritmo per il calcolo di πTi​​(F)

Decomposizione che preserva le dipendenze

Verificare una decomposizione che preserva le FD

Forma Normale di Boyce-Codd (BCNF)

Algoritmo di verifica BCNF

Normalizzazione in BCNF in casi semplici

Algoritmo per decomposizione in BNCF che preserva i dati

Terza Forma Normale (3NF)

Algoritmo per decomposizione in 3NF

Graph View

Table of Contents

Backlinks

Algoritmo per il calcolo di $π_{T_{i}} (F)$