Կատեգորիայի տվյալները պարզապես խմբավորված տեղեկություններ են, այլ ոչ թե թվային ձևաչափերով, ինչպիսիք են սեռը, սեռը կամ կրթության մակարդակը: Դրանք առկա են իրական կյանքի տվյալների գրեթե բոլոր հավաքածուներում, սակայն ներկայիս ալգորիթմները դեռևս պայքարում են դրանց դեմ պայքարելու համար: Վերցրեք, օրինակ, XGBoost կամ SKlearn մոդելների մեծ մասը:
Ի՞նչն է սահմանում կատեգորիկ տվյալները:
Կատեգորիայի տվյալները վիճակագրական տվյալների տեսակն է, որը բաղկացած է դասակարգային փոփոխականներից կամ տվյալներից, որոնք փոխարկվել են այդ ձևի, օրինակ՝ որպես խմբավորված տվյալներ։։
Ի՞նչ են դասակարգային և թվային տվյալները:
Թվային տվյալներն օգտագործվում են թվերով (լողացող կետ կամ ամբողջ թիվ) ներկայացված ցանկացած բան նշանակելու համար: Ընդհանուր առմամբ, դասակարգային տվյալները նշանակում են մնացած ամեն ինչ և, մասնավորապես, դիսկրետպիտակավորված խմբերը հաճախ կանչվում են:
Ի՞նչ են դասակարգային տվյալները և շարունակական տվյալները:
Կատեգորիայի փոփոխականները պարունակում են վերջավոր թվով կատեգորիաներ կամ տարբեր խմբեր… Շարունակական փոփոխականները թվային փոփոխականներ են, որոնք ունեն անսահման թվով արժեքներ ցանկացած երկու արժեքների միջև: Շարունակական փոփոխականը կարող է լինել թվային կամ ամսաթիվ/ժամ: Օրինակ՝ մասի երկարությունը կամ վճարման ստացման ամսաթիվն ու ժամը։
Ո՞րն է կատեգորիկ տվյալների օրինակը:
Կատեգորիայի փոփոխականները ներկայացնում են տվյալների տեսակները, որոնք կարելի է բաժանել խմբերի: Կատեգորիկ փոփոխականների օրինակներ են՝ ռասա, սեռ, տարիքային խումբ և կրթական մակարդակ: … Կան 8 տարբեր իրադարձությունների կատեգորիաներ, որոնց քաշը տրվում է որպես թվային տվյալներ: