Մեքենայական ուսուցման մոդելները պահանջում են, որ բոլոր մուտքային և ելքային փոփոխականները լինեն թվային: Սա նշանակում է, որ եթե ձեր տվյալները պարունակում են կատեգորիկ տվյալներ, դուք պետք է դրանք կոդավորեք թվերով՝ նախքան մոդելը տեղավորելը և գնահատելը… Կոդավորումը նախնական մշակման պարտադիր քայլ է մեքենայի համար դասակարգային տվյալների հետ աշխատելիս: ուսուցման ալգորիթմներ։
Ինչու ենք մենք կոդավորում դասակարգային փոփոխականներ:
Կատեգորիկ փոփոխականը փոփոխական է, որի արժեքները վերցնում են պիտակների արժեքը: … Մեքենայի ուսուցման ալգորիթմները և խորը ուսուցման նեյրոնային ցանցերը պահանջում են, որ մուտքային և ելքային փոփոխականները թվեր են: Սա նշանակում է, որ կատեգորիայի տվյալները պետք է կոդավորված լինեն թվերով, նախքան մենք կարողանանք օգտագործել դրանք մոդելը հարմարեցնելու և գնահատելու համար:
Ինչու են կատեգորիայի տվյալները օգտակար:
Կատեգորիաները և թվային տվյալները տվյալների հիմնական տեսակներն են: Տվյալների այս տեսակները կարող են ունենալ նույն թվով ենթակատեգորիաներ՝ յուրաքանչյուրը երկուսով, բայց դրանք շատ տարբերություններ ունեն: Այս տարբերությունները տալիս են նրանց եզակի հատկանիշներ, որոնք հավասարապես օգտակար են վիճակագրական վերլուծության մեջ: … Համեմատության համար, կատեգորիկ տվյալները որակական տվյալների տեսակներ են:
Ինչու է անհրաժեշտ տվյալների կոդավորումը:
Կոդավորումը պահպանում է ձեր տվյալները, քանի որ ֆայլերը ընթեռնելի չեն, քանի դեռ դուք մուտք չեք գործել այն ալգորիթմներին, որոնք օգտագործվել են դրանք կոդավորելու համար: … Քանի որ կոդավորված տվյալները չափերով ավելի փոքր են, դուք պետք է կարողանաք տարածք խնայել ձեր պահեստավորման սարքերում: Սա իդեալական է, եթե ունեք մեծ քանակությամբ տվյալներ, որոնք պետք է արխիվացվեն:
Ի՞նչ է կոդավորման օրինակը:
Կոդավորումը մտքերը հաղորդակցության վերածելու գործընթացն է Կոդավորիչը օգտագործում է «միջոց»՝ հաղորդագրություն ուղարկելու համար՝ հեռախոսազանգ, էլ. փոստ, տեքստային հաղորդագրություն, դեմ առ դեմ: հանդիպում կամ հաղորդակցման այլ գործիք:… Օրինակ, դուք կարող եք հասկանալ, որ քաղցած եք և կոդավորեք հետևյալ հաղորդագրությունը, որպեսզի ուղարկեք ձեր սենյակակցին. «Ես սոված եմ: