Logo hy.boatexistence.com

Որո՞նք են բացակայող արժեքները միջինով վերագրելու թերությունները:

Բովանդակություն:

Որո՞նք են բացակայող արժեքները միջինով վերագրելու թերությունները:
Որո՞նք են բացակայող արժեքները միջինով վերագրելու թերությունները:

Video: Որո՞նք են բացակայող արժեքները միջինով վերագրելու թերությունները:

Video: Որո՞նք են բացակայող արժեքները միջինով վերագրելու թերությունները:
Video: Data Science with Python! Joining Tables Without a Common Column 2024, Մայիս
Anonim

Միջին մուտքագրումը խեղաթյուրում է փոխհարաբերությունները փոփոխականների միջև Բայց միջին հաշվարկը նաև աղավաղում է բազմաչափ հարաբերությունները և ազդում վիճակագրության վրա, ինչպիսին է հարաբերակցությունը: Օրինակ՝ PROC CORR-ին ուղղված հետևյալ զանգը հաշվարկում է Orig_Height փոփոխականի և Weight and Age փոփոխականների հարաբերակցությունը:

Ինչո՞ւ է բացակայող տվյալների համար միջոց օգտագործելը վատ գաղափար:

Միջինը նվազեցնում է տվյալների շեղումը Մաթեմատիկայում ավելի խորանալով, ավելի փոքր շեղումը հանգեցնում է հավանականությունների բաշխման ավելի նեղ վստահության միջակայքի[3]: Սա ոչ այլ ինչի չի հանգեցնում, քան մեր մոդելին կողմնակալություն ներկայացնելը:

Ինչու են բաց թողնված արժեքները խնդիր:

Տվյալների բացակայությունը տարբեր խնդիրներ է առաջացնում: Նախ, տվյալների բացակայությունը նվազեցնում է վիճակագրական հզորությունը, որը վերաբերում է հավանականությանը, որ թեստը կմերժի զրոյական վարկածը, երբ այն կեղծ է: Երկրորդ, կորցրած տվյալները կարող են առաջացնել կողմնակալություն պարամետրերի գնահատման մեջ: Երրորդ, այն կարող է նվազեցնել նմուշների ներկայացուցչականությունը։

Ինչու է միջին վերագրումը վատ:

Խնդիր 1. Միջին իմպուտացիան չի պահպանում փոխհարաբերությունները փոփոխականների միջև: Ճիշտ է, միջինը վերագրելը պահպանում է դիտարկված տվյալների միջինը։ Այսպիսով, եթե տվյալները պատահականորեն բացակայում են, միջինի գնահատումը մնում է անաչառ:

Պե՞տք է փոխարինել բացակայող տվյալները միջինով:

Outliers տվյալների կետերը զգալի ազդեցություն կունենան միջինի վրա, և հետևաբար, նման դեպքերում խորհուրդ չի տրվում օգտագործել միջինը բաց թողնված արժեքները փոխարինելու համար: Բաց թողնված արժեքները փոխարինելու համար միջին արժեքների օգտագործումը չի կարող հիանալի մոդել ստեղծել և, հետևաբար, բացառվել:

Խորհուրդ ենք տալիս: