Միջին մուտքագրումը խեղաթյուրում է փոխհարաբերությունները փոփոխականների միջև Բայց միջին հաշվարկը նաև աղավաղում է բազմաչափ հարաբերությունները և ազդում վիճակագրության վրա, ինչպիսին է հարաբերակցությունը: Օրինակ՝ PROC CORR-ին ուղղված հետևյալ զանգը հաշվարկում է Orig_Height փոփոխականի և Weight and Age փոփոխականների հարաբերակցությունը:
Ինչո՞ւ է բացակայող տվյալների համար միջոց օգտագործելը վատ գաղափար:
Միջինը նվազեցնում է տվյալների շեղումը Մաթեմատիկայում ավելի խորանալով, ավելի փոքր շեղումը հանգեցնում է հավանականությունների բաշխման ավելի նեղ վստահության միջակայքի[3]: Սա ոչ այլ ինչի չի հանգեցնում, քան մեր մոդելին կողմնակալություն ներկայացնելը:
Ինչու են բաց թողնված արժեքները խնդիր:
Տվյալների բացակայությունը տարբեր խնդիրներ է առաջացնում: Նախ, տվյալների բացակայությունը նվազեցնում է վիճակագրական հզորությունը, որը վերաբերում է հավանականությանը, որ թեստը կմերժի զրոյական վարկածը, երբ այն կեղծ է: Երկրորդ, կորցրած տվյալները կարող են առաջացնել կողմնակալություն պարամետրերի գնահատման մեջ: Երրորդ, այն կարող է նվազեցնել նմուշների ներկայացուցչականությունը։
Ինչու է միջին վերագրումը վատ:
Խնդիր 1. Միջին իմպուտացիան չի պահպանում փոխհարաբերությունները փոփոխականների միջև: Ճիշտ է, միջինը վերագրելը պահպանում է դիտարկված տվյալների միջինը։ Այսպիսով, եթե տվյալները պատահականորեն բացակայում են, միջինի գնահատումը մնում է անաչառ:
Պե՞տք է փոխարինել բացակայող տվյալները միջինով:
Outliers տվյալների կետերը զգալի ազդեցություն կունենան միջինի վրա, և հետևաբար, նման դեպքերում խորհուրդ չի տրվում օգտագործել միջինը բաց թողնված արժեքները փոխարինելու համար: Բաց թողնված արժեքները փոխարինելու համար միջին արժեքների օգտագործումը չի կարող հիանալի մոդել ստեղծել և, հետևաբար, բացառվել: