Normalization լավ է օգտագործել, երբ գիտեք, որ ձեր տվյալների բաշխումը չի հետևում Գաուսի բաշխմանը: … Ստանդարտացումը, մյուս կողմից, կարող է օգտակար լինել այն դեպքերում, երբ տվյալները հետևում են Գաուսի բաշխմանը:
Պե՞տք է օգտագործեմ նորմալացում կամ ստանդարտացում:
Նորմալացումը օգտակար է, երբ ձեր տվյալները ունեն տարբեր մասշտաբներ, և ձեր օգտագործած ալգորիթմը ենթադրություններ չի անում ձեր տվյալների բաշխման վերաբերյալ, ինչպիսիք են k-մոտակա հարևանները և արհեստական նեյրոնային ցանցերը: Ստանդարտացում ենթադրում է, որ ձեր տվյալները ունեն Գաուսի (զանգի կոր) բաշխում:
Ստանդարտացումը նույնն է, ինչ նորմալացումը:
Բիզնեսի աշխարհում «նորմալացում»-ը սովորաբար նշանակում է, որ արժեքների միջակայքը «նորմալացված է 0-ից:0-ից մինչև 1.0։ «Ստանդարտացում» սովորաբար նշանակում է, որ արժեքների տիրույթը «ստանդարտացված է»՝ չափելու համար, թե որքան ստանդարտ շեղումներ է այդ արժեքը միջինից։
Մի՞շտ է լավ նորմալացնել տվյալները:
Նորմալացնելով՝ դուք իրականում դեն եք նետում տվյալների մասին որոշ տեղեկություններ, ինչպիսիք են բացարձակ առավելագույն և նվազագույն արժեքները: Այսպիսով, չկա հիմնական կանոն: Ինչպես ասացին մյուսները, նորմալացումը միշտ չէ, որ կիրառելի է. օր. գործնական տեսանկյունից.
Ե՞րբ չպետք է նորմալացնել տվյալները:
Որոշ լավ պատճառներ չնորմալացնելու համար
- Միացումները թանկ են։ Ձեր տվյալների բազայի նորմալացումը հաճախ ներառում է բազմաթիվ աղյուսակների ստեղծում: …
- Նորմալացված դիզայնը դժվար է: …
- Արագ և կեղտոտ պետք է լինի արագ և կեղտոտ: …
- Եթե դուք օգտագործում եք NoSQL տվյալների բազա, ավանդական նորմալացումը ցանկալի չէ: