Normalization je dobro uporabiti, če veste, da distribucija vaših podatkov ne sledi Gaussovi porazdelitvi. … Standardizacija je po drugi strani lahko koristna v primerih, ko podatki sledijo Gaussovi porazdelitvi.
Naj uporabim normalizacijo ali standardizacijo?
Normalizacija je uporabna, če imajo vaši podatki različne lestvice in algoritem, ki ga uporabljate, ne predvideva distribucije vaših podatkov, kot so k-najbližji sosedje in umetne nevronske mreže. Standardizacija predpostavlja, da imajo vaši podatki Gaussovo porazdelitev (zvonasta krivulja).
Ali je standardizacija enaka normalizaciji?
V poslovnem svetu "normalizacija" običajno pomeni, da je obseg vrednosti " normaliziran od 0.0 do 1,0". "Standardizacija" običajno pomeni, da je obseg vrednosti "standardiziran" za merjenje, koliko standardnih odstopanj je vrednost od njene srednje vrednosti.
Ali je vedno dobro normalizirati podatke?
Z normalizacijo dejansko zavržete nekaj informacij o podatkih, kot sta absolutna največja in najmanjša vrednost. Torej, ne obstaja pravilo. Kot so rekli drugi, normalizacija ni vedno uporabna; npr. s praktičnega vidika.
Kdaj ne bi smeli normalizirati podatkov?
Nekaj dobrih razlogov, da se ne normalizira
- Pridružitve so drage. Normalizacija vaše baze podatkov pogosto vključuje ustvarjanje veliko tabel. …
- Normalizirana zasnova je težavna. …
- Hitro in umazano mora biti hitro in umazano. …
- Če uporabljate bazo podatkov NoSQL, tradicionalna normalizacija ni zaželena.